Estadística Descriptiva. Ciencia que estudia una variable observable observada
Enviado por fsofiac • 29 de Abril de 2016 • Biografía • 2.253 Palabras (10 Páginas) • 402 Visitas
ESTADISTICA DESCRIPTIVA:
Ciencia que estudia una variable observable observada, la clasifica, ordena los datos que constituyen la información, los presenta en tabla denotando sus características principales. Representa conjuntos de datos. Posee tres aspectos: E. Descriptiva, E. de Probabilidades, y E. de Inferencia
Estadística Descriptiva: Puede definirse como aquellos métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente las diversas características de ese conjunto. Marco empírico, lo que observamos, nuestra realidad. Valencia empírica de los datos, se dedica a la descripción, visualización y resúmenes de los datos.
E. de Probabilidades: Es el marco teórico.
Su conjunción nos permite realizar inferencias en la población.
Estadística Inferencial: Puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población o la toma de una decisión referente a una población basándose sólo en los resultados de una muestra. Se dedica a generar modelos, inferencias y predicciones asociadas a los fenómenos teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelos o patrones de datos y para extraer inferencias bajo una población en estudio → PROBABILIDADES.
Población: Es la totalidad de elementos o cosas bajo consideración. Relevamiento exhaustivo de la variable en estudio.
Muestra: Es la porción de la población que se selecciona para su análisis. Subconjunto de la población.
Medición: Proceso de atribuir nº a las características.
Parámetro: Es una medida de resumen que se calcula para describir una característica de toda una población. Es fijo.
Estadística/ Estimador: Es una medida que se calcula para describir una característica de una sola muestra de la población. Es variable.
Datos Estadísticos/Variables: Los datos pueden concebirse como información numérica necesaria para ayudarnos a tomar una decisión con más bases en una situación particular.
Existen dos grandes grupos de variables que producen dos tipos de datos: categóricas (cualitativas) y numéricas (cuantitativas). Las variables aleatorias categóricas producen respuestas categóricas, mientras que las variables numéricas producen respuestas numéricas. Las variables numéricas pueden considerarse como discretas o continuas. Los datos discretos son respuestas numéricas que surgen de un proceso de conteo, porque están definidos en determinados puntos del intervalo, números enteros/naturales. Mientras que los datos continuos son respuestas numéricas que surgen de un proceso de medición, definidos en todo punto de intervalos, son números reales, intermedios entre dos variables, parte decimal {edad, peso, estatura, nacimiento, defunción}
Los datos que conforman la información se agrupan a los individuos por comportamientos análogos → Se obtienen frecuencias o distribución de frecuencias (serie de grupos reducidos)
¿Qué es una distribución? Es una tabla que reúne los resultados de un relevamiento, estableciendo una correspondencia entre cada uno de los valores o modalidades que lo designamos con una letra X y un subíndice i → Xi → Valores de la variable y números de individuos que toma el Ni → Frecuencia absoluta.
Frecuencia relativa → Fr → Es el cociente entre la frecuencia absoluta y el total de los casos (N) = A la Σ de frecuencias. La distribución relativa de frecuencia se forma dividiendo las frecuencias de cada clase de distribución de frecuencia entre el número total de observaciones. Entonces puede formarse una distribución de porcentaje multiplicando cada frecuencia relativa o proporción entre 100. (ni/N) Es esencial siempre que una serie de datos se compara con otra seria de datos, especialmente si difiere el número de observaciones en cada serie de datos.
Xi ni Fr → ni/N
20 4 4/21
22 5 5/21
24 6 6/21
26 3 3/21
28 2 2/21
31 1 1/21
Σni→ 21
*La principal ventaja de usar una de estas tablas de resumen es que las principales características de los datos se hacen evidentes inmediatamente para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber cómo se distribuyen los valores individuales dentro de un intervalo de clase particular sin tener acceso a los datos originales.
Niveles de mediciones:
- Escala nominal → Características.
- Escala ordinal →
- Escala de intervalos → Orden de las posiciones relativas (objetos – individuos)
- Escala de cociente o razón → Permite establecer en qué proporción es mayor una categoría.
Graficación de datos numéricos: el Histograma y el Polígono // Gráfico de barras.
Los histogramas son diagramas de barras verticales en los que se construyen barras rectangulares en los límites de cada clase. La variable aleatoria o fenómeno de interés se despliega a lo largo del eje horizontal; el eje vertical representa el número, proporción o porcentaje de observaciones por intervalo de clase, dependiendo de si el histograma particular, es un histograma de frecuencia, un histograma de frecuencia relativa o histograma de porcentaje
El polígono de porcentaje se forma permitiendo que el punto medio de cada clase represente los datos de esa clase y luego conectando la sucesión de puntos medios con sus respectivos porcentajes de clase.
En la gráfica de barras, cada categoría se describe mediante una barra, cuya longitud representa la frecuencia o porcentaje de observaciones que caen en una categoría. Para construir una gráfica de barras se hacen las siguientes sugerencias:
- Las barras deben construirse horizontalmente.
- Todas las barras deben tener el mismo ancho.
- Los espacios entre las barras deben variar entre la mitad
- del ancho de una barra hasta el ancho de una barra.
- Las escalas y guías son auxiliares útiles en la lectura
- de una gráfica y deben incluirse. El punto cero u origen debe indicarse.
- Los ejes deben etiquetarse.
Tendencias Centrales
- Promedio aritmético
- Periodo geométrico
- Periodo armónico
Promedio Aritmético: La primera cuestión que se plantea en el análisis de la serie de frecuencia, es la representación de los valores de la serie mediante un único valor central, él más usado es el promedio aritmético (x raya) El cual comprende el conjunto de los valores de la serie puesto que entran todos, y siempre es un único valor. La media actúa como punto de equilibrio de tal forma que las observaciones menores compensan a las observaciones que son mayores.
...