Estadistica Descriptiva
Enviado por lina7464 • 6 de Agosto de 2015 • Resumen • 7.367 Palabras (30 Páginas) • 125 Visitas
UNIDAD A
ESTADISTICA DESCRIPTIVA
Introducción
En el muestreo estadístico hay tres grandes preguntas:
- Cómo se extrae la muestra
- Cuál es el tamaño de la muestra
- Para qué sirve la muestra
Vamos a dar respuestas a estas tres grandes preguntas. Empezaremos por la tercera pregunta: para que nos sirve la muestra.
Estudiaremos en primer lugar el caso donde la información muestral es cuantitativa y luego se analizará el caso donde la información es de carácter cualitativo.
Información muestral cuantitativa
Para el análisis de una variable cuantitativa estudiaremos las siguientes medidas:
- Medidas de centralización
- Medidas de posición
- Medidas de dispersión
- Medidas de forma
- Análisis exploratorio de datos
Observaciones:
- Para la parte operacional del curso se utilizará el paquete estadístico Statgraphics Centurion
- La parte teórica será acompañada de una parte práctica. Para ello se utilizará el siguiente ejemplo:
Se tomó una muestra de 70 registros de las ventas diarias de un pequeño almacén durante un año; el resultado de la muestra fue el siguiente:
Tabla 1.1
150.000 | 159.000 | 161.000 | 168.000 | 250.000 | 259.000 | 267.000 |
152.000 | 160.000 | 160.000 | 170.000 | 252.000 | 260.000 | 268.000 |
154.000 | 161.000 | 160.000 | 172.000 | 254.000 | 261.000 | 270.000 |
156.000 | 163.000 | 166.000 | 176.000 | 256.000 | 263.000 | 272.000 |
157.000 | 160.000 | 169.000 | 180.000 | 257.000 | 265.000 | 276.000 |
370.000 | 380.000 | 400.000 | 372.000 | 380.000 | 680.000 | 200.000 |
372.000 | 390.000 | 370.000 | 370.000 | 380.000 | 650.000 | 210.000 |
207.000 | 210.000 | 350.000 | 320.000 | 345.000 | 350.000 | 360.000 |
360.000 | 350.000 | 365.000 | 350.000 | 280.000 | 265.000 | 267.000 |
265.000 | 265.000 | 205.000 | 205.000 | 365.000 | 665.000 | 670.000 |
Al procesar ésta muestra en el paquete estadístico nos da el siguiente resultado:
[pic 1]
Ahora analicemos cada tipo de medidas
Medidas de tendencia central
Las principales medidas de centralización son:
- La media aritmética ponderada
- La mediana
- La moda
Media aritmética ponderada:
Es el promedio ponderado de los valores de la variable.
Observaciones:
1. El factor de ponderación de cada valor de la variable es su frecuencia relativa
2. Utilizaremos el símbolo [pic 2].
- Su fórmula es: [pic 3]
- Si la información no está afectada por valores extremos anormales, la media es el valor de la variable elegida para representar a toda la información.
- En cada información la media es un valor único.
- Si en la muestra hay valores atípicos, la media es distorsionada y deja de ser un valor representativo de toda la información
En nuestro ejemplo, el resultado de la media aritmética ponderada fue:
[pic 4], es decir el promedio de las ventas diarias del almacén fue de 281814 pesos.
Más adelante analizaremos si este promedio es representativo o no de todos los valores de la muestra.
Mediana
Es el valor central de la información. Es el valor de la variable hasta el cual se tiene un 50% acumulado de los valores de la muestra.
En nuestro ejemplo el valor de la mediana es: [pic 5], es decir el 50% de las ventas diarias tuvo un valor máximo de 264000 o menos o el 50% de las ventas diarias tienen un costo entre 15000 pesos que es la venta mínima y 264000 pesos.
Moda
Es el valor de la variable que más se presentó.
Observaciones:
- El hallazgo de la moda es muy simple ya que es el registro que tiene la frecuencia absoluta más alta o la frecuencia relativa mayor; es decir, es el dato que más se repite en la muestra observada.
- En una información pueden haber varias modas, y decimos que la información es multimodal. Cuando hay muchas modas este indicador pierde importancia en el análisis.
En nuestro ejemplo, el paquete estadístico Statgraphics no reporta la moda, lo cual nos indica que es una información multimodal.
Medidas de posición:
Analiza la posición de cada valor de la variable. Las principales medidas de posición son:
- Los percentiles
- Los deciles
- Los cuartiles
Veámoslas
El paquete estadístico nos da los siguientes percentiles:
[pic 6]
Percentiles:
Es el valor de la variable hasta la cual se tiene un tanto por ciento acumulado de la información.
En nuestro ejemplo si queremos saber el valor del 33% de las ventas diarias, para ello pedimos el percentil 33 cuyo valor es 207000, es decir, el 33% de las ventas diarias, tienen un valor entre 150000 y 207000 pesos.
...