Conceptos básicos de diversas pruebas de normalidad
Enviado por karen2456 • 18 de Noviembre de 2015 • Resumen • 1.986 Palabras (8 Páginas) • 444 Visitas
Introducción.
El presente trabajo de investigación contiene los conceptos básicos de diversas pruebas de normalidad. Estas pruebas buscan constatar que los datos de una muestra pueden considerarse que proceden de una determinada distribución; en este caso una Distribución Normal.
Las pruebas que se describirán a continuación son: Análisis Residual, Pruebas de Bondad de Ajuste, Puebas de Normalidad, Transformaciones Normalizadoras y Prueba de Geary. Se describirá un panorama general para entender cada una de estas.
Análisis de Residuales.
La descomposición de la variabilidad presente en las observaciones mediante la identidad del análisis de varianza es una relación puramente algebraica. Sin embargo, el uso de la partición para probar formalmente que no hay diferencias en las medias de los tratamientos requiere que se satisfagan ciertos supuestos. Específicamente, estos supuestos son que el modelo:
[pic 1]
Describe de manera adecuada las observaciones, y que los errores siguen una distribución normal e independiente con media cero y varianza constante pero desconocida. Si estos supuestos se satisfacen, el procedimiento de análisis de varianza es una prueba exacta de la hipótesis de que no hay diferencias en las medias de los tratamientos.
Sin embargo es común que en la práctica estos supuestos no se satisfagan exactamente. Las violaciones de los supuestos básicos y la adecuación del modelo pueden investigarse con facilidad mediante el examen de residuales. El residual de la observación j-ésima en el tratamiento i-ésimo se define como:
[pic 2]
Donde ŷij es una estimación de la observación yij correspondiente que se obtiene como sigue:
[pic 3]
La ecuación anterior da el resultado de que cualquier observación en el tratamiento i-ésimo no es sino el promedio del tratamiento correspondiente.
El examen de residuales deberá ser una parte automática de cualquier análisis de varianza. Si el modelo es adecuado, los residuales deberán estar sin estructura; es decir no deberán contener patrones obvios. A través de un estudio de los residuales, pueden descubrirse muchos tipos de inadecuaciones del modelo y violaciones de los supuestos subyacentes.
El supuesto de normalidad.
La verificación del supuesto de normalidad podría hacerse graficando un histograma de los residuales. Si se satisface el supuesto de NID (0,σ2) para los errores, esta gráfica deberá aparecer como una muestra de una distribución normal con centro en cero. Desafortunadamente cuando se trabaja con muestras pequeñas, suelen ocurrir fluctuaciones significativas, por lo que la aparición de una desviación moderada de la normalidad no implica necesariamente una violación de los supuestos.
Un procedimiento en extremo útil es construir una gráfica de probabilidad normal de los residuales. Si la distribución fundamental de los errores es normal, esta gráfica tendrá la apariencia de una línea recta. Para visualizar la línea recta, deberá prestarse más atención a los valores centrales de la gráfica que a los valores extremos.
Una anomalía muy común que suele ponerse de manifiesto en las gráficas de probabilidad normal es un residual que es mucho más grande que cualquier otro. A un residual se le llama así con frecuencia punto atípico. La presencia de uno o más puntos atípicos pueden introducir serias distorsiones en el análisis de la varianza. Las posibles causas del punto atípico pueden ser desde un error en los cálculos hasta un error en codificar o copiar los datos.
Gráfica de los residuales en secuencia en el tiempo.
La graficación de los residuales en el orden temporal de la recolección de los datos es útil para detectar correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indica una correlación positiva (supuesto de independencia violado). Se trata de un problema potencialmente serio y cuya solución es difícil, por lo que de ser posible es importante evitar el problema cuando se colecten datos. La aleatorización del experimento es un paso importante para conseguir la independencia.
[pic 4]
Gráfica de los residuales contra los valores ajustados.
Si el modelo es correcto y se satisfacen los supuestos, los residuales deberán estar sin estructura; en particular, no deberán estar relacionados con ninguna otra variable. Una verificación simple es graficar los residuales contra los valores justados ŷij. Esta gráfica no deberá mostrar ningún patrón obvio.
Un defecto que sale a relucir en ocasiones en esta gráfica es una varianza no constante. La varianza de las observaciones se incrementa cuando la magnitud de la observación se incrementa (esto ocurre comúnmente con muchos instrumentos de medición; el error es un porcentaje en la escala de medición). Si este fuera el caso, los residuales se harían mayores conforme ŷij se hiciera más grande, y la gráfica de los residuales contra ŷij se vería como un embudo con la boca hacia afuera. Una varianza no constante también surge en los casos en que los datos siguen una distribución no normal, sesgada, porque en las distribuciones sesgadas la varianza tiende a ser una función de la media.
El enfoque usual para abordar el problema de una varianza no constante consiste en aplicar una transformación para estabilizar la varianza. En este enfoque se deberá tener presente que las conclusiones del análisis de la varianza se aplica a las poblaciones transformadas.
Por ejemplo si las observaciones siguen una distribución de Poisson, se usaría la transformación de la raíz cuadrada (yij =, si siguen la distribución lognormal, se usa la transformación logarítmica (yij = Logyij) y para datos binomiales se usa la transformación arcsen (yij= arcsen .[pic 5][pic 6]
[pic 7]
Pruebas de bondad de ajuste de normalidad.
A menudo se encuentran hipótesis en donde no se sabe cuál es la distribución de la población, y se desea probar la hipótesis de que una distribución en particular será un modelo satisfactorio de la población, por ejemplo, tal vez se quiera probar que la hipótesis de que una población es normal. En estos casos, la prueba de bondad de ajuste se utiliza para contrastar si los datos de la muestra pueden considerarse que proceden de una determinada distribución; en otras palabras, nos permiten conocer como es la forma de la distribución de la población de la que se ha extraído la muestra.
...