Desviación estándar y rango intercuartil - Bill Gates regresa al comedor
Enviado por Sriverag777 • 19 de Noviembre de 2015 • Informe • 1.207 Palabras (5 Páginas) • 255 Visitas
[pic 1] [pic 2]
[pic 3][pic 4][pic 5][pic 6]UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO.
FACULTAD DE INGENIERÍA.
PROYECYO FINAL
Amaya Barrera Raúl
ESTADISTICA APLICADA
CAPITULO 3
Desviación estándar y rango intercuartil
Bill Gates regresa al comedor
[pic 7]
[pic 8]
Ok. Lo sé. No puedo ver al hombre más rico del mundo yendo a un comedor bastante barato, menos aun regresando de este, pero quería quedarme con el ejemplo que tenía, imaginemos que Bill haya disfrutado las bien intencionadas bromas acerca de las fallas de diseño en Windows y no hubiera tenido mucho que hacer al día siguiente. Además, imaginemos que el comedor está muy muy ocupado con 80 personas en total que hayan pasado en algún punto de la mañana. Aquí hay un histograma que muestra los salarios de los clientes.
[pic 9]
En el eje de las x (yendo de izquierda a derecha) muestra diferentes niveles de salarios colocados en diferentes grupos. El eje de las y (yendo de arriba abajo) muestra el número de personas en cada nivel de salario. Por ejemplo, el histograma muestra que 16 de los individuos que hayan comido en el comedor tiene salarios en el rango $35,000-$39,000 al año.
No puedes resolver esto con el histograma, pero use los datos para calcular que el salario fue $42,360. Entonces tomamos todos estos puntos y los convertimos en un solo número.
Ahora, hay un viejo chiste que dice algo así, un estadista tiene su cabeza en el horno y sus pies en el congelador, cuando a él se le preguntó cómo se sentía, dijo” En promedio, bastante bien”. De esto aprendemos dos cosas: a) los estadistas cuentan chistes malos y b) frecuentemente un solo número no describe un conjunto de datos de manera correcta. De acuerdo es generalmente una buena idea reportar no solo una media o mediana, lo que los estadistas llaman tendencia central de los datos, pero alguna medida de cómo el dato varía, lo que los estadistas llaman medida de dispersión.
Una medida común de dispersión que describe lo mucho que los datos cambian es la desviación estándar. La desviación estándar es calculada de los datos usando una fórmula. Lo importante es recordar que si la desviación estándar de los datos es pequeña, quiere decir que todos están cerca del mismo salario, si la desviación estándar fue grande, querría decir que los salarios de la gente en comedor varían ampliamente.
Para resolver que tanta variación tuvimos, podemos usar dos simples reglas. La más conocida es que 95% de las observaciones están dentro de las desviaciones estándar de la mediana. Esto es lo mismo que decir que 5% de los clientes tiene salarios más que dos desviaciones estándar de la mediana.
Es también cierto que aproximadamente 2/3 de las observaciones están dentro de una desviación estándar de la mediana y que aproximadamente la mitad de las observaciones están dentro de 2/3 de la desviación estándar de la mediana.
Eso es, desde luego, hasta que Bill Gates llega al comedor. Ahora tenemos la mediana de un salario en aproximadamente 12 millones y una desviación estándar de 100 millones. Claramente no es más el caso que 2/3 de las observaciones están dentro de una desviación estándar de mediana porque nadie en el comedor (salvo Bill) tiene un salario cercano a 112 millones y no puede tener un salario negativo de 88 millones.
[pic 10]
Por lo que las reglas generales no funcionan cuando los datos están fuera de la curva que los estadistas llaman la distribución normal.
Cuando Bill Gates llega, sin embargo tenemos datos que describiremos como sesgados, no parecen encajar en la distribución normal. ¿Qué debe hacer acerca de las desviaciones estándar si no tiene un buen encaje de los datos? Recuerde la primera vez que Bill Gates fue al comedor, dijimos que podíamos usar una mediana en lugar de una media como el promedio. La media de dispersión que usaste con medianas no es una desviación estándar, es lo que se llama rango intercuartil.
...