Diagrama De Cajas Y Bigote
Enviado por • 29 de Abril de 2015 • 407 Palabras (2 Páginas) • 370 Visitas
DIAGRAMA DE CAJA Y BIGOTES (o boxplot)
CONCEPTO:
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 (o mediana) y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
PROCEDIMIENTO:
1. Con ayuda de Excel se determina el valor máximo, mínimo, los percentiles 25, 50 y 75.
2. Se calcula el Rango Intercuartílico: P75 – P25.
3. De determinan los LIMITES, tanto superior como inferior
LI = P25 – 1.5RIC LS = P75 +1.5RIC
Los datos que toman valores por encima o por de debajo de estos límites, constituyen valores atípicos.
4. Los valores atípicos pueden ser cercanos o alejados. Los cercanos se denominas outliers y los lejanos se denominas extremos. Las frontera entre estos tipos de atípicos se determina por la fórmula:
Limite extremo inferior: P25 – 3RIC Límite extremo superior: P75 + 3RIC
APLICACIÓN:
Se desea analizar el consumo de gas natural en los hogares de un distrito limeño, el gasto mensual en este combustible, en nuevos soles de 36 hogares se muestra a continuación:
COMENTARIO
o El mínimo (20,6) es mayor al Límite Inferior (17,1375), por lo tanto no hay valores atípicos inferiores.
o El máximo (37,6) es mayor al Límite Superior (37,0375), por lo tanto hay valores atípicos superiores.
o ¿Cuántos valores atípicos superiores hay en esta muestra?... para ello ordenamos los datos, de menor a mayor, y buscamos si existe otros valores mayores a 37,0375 (por supuesto menores o iguales a 37,6, puesto que es el máximo). No hay otros valores. Hay solo un valor atípico.
o ¿Este valor atípico es un outliers o un extremo? Observamos que el 37,6 está entre el 37,0375 y 44,5 por lo tanto es un outliers. Si el dato hubiese estado por encimo a 44,5 hubiese sido un extremo.
CONCLUSIÓN
Puesto que el valor atípico es a la derecha, el mínimo está por encima del límite inferior y la diferencia entre P50 – P25 es mayor a la diferencia entre P75 – P50, se puede concluir que los datos se ajustan a una distribución asimétrica a la derecha, o sesgo positivo.
...