DIAGRAMAS DE CAJA O BOX - PLOT
Enviado por xaribam • 24 de Septiembre de 2013 • 1.413 Palabras (6 Páginas) • 434 Visitas
2.4 DIAGRAMAS DE CAJA O BOX - PLOT
Representa los tres cuartiles junto con los dos valores extremos de las observaciones.
Los diagramas de caja que se presentan a continuación ( confeccionados con PHStat ),
corresponden a los datos observados para las características “número de aspiradoras
vendidas” y “superficie cubierta de la vivienda” analizadas anteriormente en el desarrollo de las
distribuciones de frecuencias de las variables discretas y continuas, respectivamente.
Nº Aspiradoras
Nº Aspiradoras
82
84
86
88
90
92
94
96
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 35
Superficie cubierta
Superficie
70
90
110
130
150
El lado inferior de las cajas corresponde al primer cuartil, el lado superior al tercer cuartil y el
segmento que divide a las cajas al segundo cuartil. Un segmento de recta une el lado inferior
de las cajas con el mínimo valor observado y otro segmento une el lado superior de las cajas
con el máximo valor observado.
Constituyen una herramienta eficaz para el análisis de la simetría de una distribución de
frecuencias y su estudio comparativo con otras distribuciones.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 36
· DETECCION DE VALORES ANOMALOS (outliers)
Hay ocasiones en que un conjunto de datos contiene observaciones inconsistentes y es probable
que no se desee incluirlas para su análisis. Cuando dichas observaciones se salen del intervalo
de valores de datos que se quiere describir, se denominan valores anómalos u
outliers.
Una observación “x” que es inusualmente grande o pequeña en relación con los demás valores
de un conjunto de datos se denomina valor anómalo.
Uno de los métodos para determinar si una observación es un valor anómalo es observar si el
valor absoluto de z es anormalmente grande.
El valor “z” de un valor “x” de un conjunto de datos es la distancia a la que se encuentra x
por arriba o por debajo de la media, medida en unidades de la desviación estándar:
Estos valores por lo general son atribuibles a una de las siguientes causas:
La observación se registra incorrectamente.
La observación proviene de una población distinta.
La observación es correcta pero representa un suceso poco común (fortuito)
2.5 TRANSFORMACIONES LINEALES
Supongamos una variable “x” con media aritmética ( x ) y varianza ( s2
x ) y una variable “y”
de la forma:
y = a + b x
Se demuestra fácilmente que:
· y = a + b x ( media aritmética de la variable y )
· 2
x
2
s y b s = 2 ( varianza de la variable y )
· sy = ½b½ sx ( desvío estándar de la variable y )
En el caso b = 1, lo único que se hace es sumar una constante (a). La media aritmética de la
nueva variable quedará incrementada en un valor igual al de la constante (a) y el desvío
estándar, que es una medida de dispersión, permanece igual.
En cambio, si la variable es multiplicada por una constante b ¹ 1, esto produce una contracción
o una dilatación de la distribución (según sea b menor o mayor que 1) lo que se refleja en la
varianza.
G.Carnevali-E.Franchelli-G.Gervasoni
s
Valor z = x - x
ESTADÍSTICA DESCRIPTIVA 37
Ejemplo :
Sea la variable x : número de días completos trabajados en un año por operario de una fábrica.
Se conoce que el promedio de la variable x es 290,1 días con una desviación de 2,2 días.
Cada día no trabajado ocasiona a la fábrica una pérdida de $ 150.
Calcule la pérdida anual promedio por operario y su desvío estándar (considere 300 días laborables
en el año).
y : pérdida anual por operario
yi = ( 300 - xi ) 150
de donde :
= ( 300 - 290,1 ) 150 = $ 1485 pérdida anual promedio por operario
sy = 150 . 2,2 = $ 330 desviación estándar de la pérdida anual por operario
G.Carnevali-E.Franchelli-G.Gervasoni
y
ESTADÍSTICA DESCRIPTIVA 38
2.6 TRABAJO PRACTICO
1.- Analice los siguientes gráficos6. Comente.
a ) El siguiente gráfico representa una reducción ( en el año 1990 con respecto al año
anterior ) del 50% en el número de barriles de petróleo extranjero utilizado en el proceso
de manufactura de productos de películas por una empresa.
b)
¿Quién creen los propietarios que es el líder en bienes raíces?
6 Los gráficos fueron realizados por Diego Martínez Viademonte, alumno que cursó la asignatura en el año 2003
G.Carnevali-E.Franchelli-G.Gervasoni
120,000
60,000
1989 1990
Barriles
Liderazgo
3%
2% 2%
32%
11%
COLDWELL BANKER
E.R.A.
GALLERY
CENTURY
otros
ESTADÍSTICA DESCRIPTIVA 39
c)
Chevrolet. Los camiones más formales y de mayor duración.
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
Chevrolet. Los camiones más formales y de mayor duración.
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
G.Carnevali-E.Franchelli-G.Gervasoni
Como una roca
95
96
97
98
CHEVY FORD TOYOTA NISSAN
Camión
Porcentaje
Como una roca
0
10
20
30
40
50
60
70
80
90
...