ANÁLISIS DE VARIANZA
Enviado por diego1199 • 17 de Febrero de 2015 • Tesis • 3.236 Palabras (13 Páginas) • 395 Visitas
Capítulo 12
ANÁLISIS DE VARIANZA
1. INTRODUCCIÓN
El análisis de varianza (ANOVA) permite probar la significancia de las diferencias entre más de dos medias de muestra o hacer inferencias sobre si las muestras fueron tomadas de poblaciones que tienen la misma media. El análisis de varianza será útil en situaciones como la comparación del kilometraje logrado por 5 tipos de gasolina; en la prueba de cuál de 4 métodos de entrenamiento produce el más rápido aprendizaje, etc.
Sin embargo estas aplicaciones no son todo lo que se quiere conocer. Con respecto a si hay diferencias en la eficiencia entre 5 tipos de gasolina, hay varias preguntas que quedan sin resolver: ¿Qué autos se usaron para las pruebas? ¿Los instrumentos para medir la eficiencia eran similares en precisión? En la prueba de la eficiencia de los métodos de aprendizaje se podría preguntar: ¿Qué tipo de profesores se usaron? ¿La calidad de los textos es la misma? ¿Los estudiantes tenían un mismo nivel de inteligencia? El resolver estas preguntas lleva al vasto tema del diseño de experimentos, del cual, el ANOVA es el fundamento.
2. SUPOSICIONES
Para utilizar el ANOVA se deben realizar las siguientes suposiciones:
Cada una de las muestras es tomada de una población normal de forma independiente y además cada una de las poblaciones tiene la misma varianza (Si los tamaños de las muestras son lo suficientemente grandes no se necesita la suposición de normalidad, pero esto no ocurre frecuentemente).
Si se prueba que las muestras salieron de la misma población, entonces se puede reunirlas en una sola muestra.
En el capítulo siguiente (pruebas no paramétricas) se tiene una prueba alternativa a la ANOVA (de un factor) en el cual no se tienen que hacer estas suposiciones, y es la prueba H de Kruskal-Wallis.
3. PROCEDIMIENTO
El análisis de varianza está basado en una comparación de dos estimaciones diferentes de la varianza de la población total, mediante una prueba de hipótesis:
Para probar esta hipótesis se realizan los siguientes pasos:
1. Se determina una estimación de la varianza de la población a partir de la varianza entre las medias de las muestras (intervarianza).
2. Se determina una segunda estimación de la varianza de la población desde la varianza dentro de las muestras (intravarianza).
3. Se compara estas dos estimaciones. Si su valor es aproximadamente igual, aceptamos que las muestras provienen de la misma población.
Para probar la hipótesis nula, se utiliza el valor crítico: y se compara con el valor del estadístico F con un cierto nivel de significancia. Si la Hipótesis nula fuera falsa, la intervarianza debería ser significativamente mayor que la intravarianza.
4. ANÁLISIS DE VARIANZA CON UN FACTOR
4.1. Introducción
Se supondrá que se tiene “a” diferentes niveles de un factor que se desean comparar (llamados tratamientos). La respuesta observada para cada nivel de los “a” tratamientos es una variable aleatoria. Los datos pueden ser representados mediante la tabla 12.4.1, del modo siguiente:
Tabla 12.4.1
Datos para la ANOVA con un factor
Tratamientos Observaciones Totales Promedios
1 2 3 .... n
1 y11 y12 y13 .... y1n y1.
2 y21 y22 y23 .... y2n y2.
3 y31 y32 y33 .... y3n y3.
: : : : : : : :
A ya1 ya2 ya3 .... yan ya.
Totales y..
Fuente: Montgomery Douglas C. Diseño y Análisis de Experimentos, 1991.
Para un tratamiento “a”, habrá “n” observaciones. y11 por ejemplo representa la primera observación del tratamiento 1.
El modelo estadístico para representar cada observación de la tabla está dado por:
donde: i = 1, 2, ..., a tratamientos
j = 1, 2, ..., n niveles
μ = Parámetro común a todos los tratamientos, llamada media global.
τi = Parámetro asociado al i-ésimo tratamiento, llamado el efecto del tratamiento “i”.
εij = Error aleatorio del proceso de muestreo.
El objetivo será probar hipótesis con respecto a los efectos de los tratamientos o realizar estimaciones de ellos, suponiendo que el error aleatorio del muestreo sigue una variable aleatoria independiente con distribución normal, con una varianza constante para todos los niveles del factor.
Este modelo estadístico tiene dos direcciones:
Si los a tratamientos fueron seleccionados específicamente por el experimentador, entonces las conclusiones no pueden generalizarse a tratamientos similares que no hayan sido considerados en el análisis (Este modelo se llama modelo de efectos fijos). Aquí es deseable estimar los parámetros del modelo: .
Si los a tratamientos son una muestra aleatoria de una población mayor de tratamientos, entonces las conclusiones se pueden generalizar a todos los tratamientos de la población (Este es el modelo de efectos aleatorios). Aquí es deseable realizar hipótesis sobre la variabilidad de las .
Por razones prácticas, en este texto sólo se presentará el modelo de efectos fijos.
4.2. Modelo de efectos fijos. Análisis estadístico
Primer paso.
Se desea probar la igualdad de los efectos de los “k” tratamientos:
Si H0 es cierta, entonces . Esto es, la variable de respuesta no se ve afectada por el factor investigado.
Segundo paso.
El investigador fija su nivel de riesgo:
Tercer paso.
Aquí se muestra la tabla 12.4.2 de cálculos para este tipo de análisis de varianza.
Tabla 12.4.2
Tabla de resultados ANOVA con un factor
Fuente de variación Suma de cuadrados Grados de libertad Media cuadrada Razón F
Entre tratamientos SSTr k-1
Error muestral
SSE N-k
Total
SST N-1
Fuente: Montgomery Douglas C. Diseño y Análisis de Experimentos, 1991.
El estadístico de prueba es la F de Fisher, puesto que se están relacionando dos varianzas. Las ecuaciones para hallar este valor son:
Cuarto paso.
Quinto paso.
Se realiza la decisión con base en la regla establecida.
Ejemplo: Un ingeniero de desarrollo de
...