ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Análisis simple de la varianza (One-Way ANOVA)


Enviado por   •  30 de Septiembre de 2012  •  Trabajo  •  1.813 Palabras (8 Páginas)  •  1.411 Visitas

Página 1 de 8

ANOVA

INTRODUCCIÓN:

Análisis simple de la varianza (One-Way ANOVA)

El objetivo principal de muchos experimentos consiste en determinar el efecto que sobrealguna variable dependiente Y tienen distintos niveles de algún factor X (variableindependiente y discreta). El factor puede ser la temperatura, la empresa que ha producido elbien, el día de la semana, etc.

Esencialmente, el diseño para el análisis simple de la varianza consistirá en obtener muestrasaleatorias e independientes del valor de Y asociado a cada uno de los distintos niveles delfactor X1, X2,..., Xn . Entonces podremos determinar si los diferentes niveles del factor tienenun efecto significativo sobre el valor de la variable dependiente.

El funcionamiento de la técnica ANOVA simple es, a grandes rasgos, el siguiente: a fin decomparar las medias de Y asociadas a los distintos niveles del factor (X1, X2,..., Xn),compararemos una medida de la variación entre diferentes niveles (MS-factor) con unamedida de la variación dentro de cada nivel (MS-error). Si el MS-factor essignificativamente mayor que el MS-error, concluiremos que las medias asociadas adiferentes niveles del factor son distintas. Esto significa que el factor influye significativamentesobre la variable dependiente Y. Si, por el contrario, el MS-factor no es significativamentemayor que el MS-error, no rechazaremos la hipótesis nula de que todas las medias,asociadas a diferentes niveles del factor, coinciden.

De forma similar a lo que ocurre con la regresión lineal, aquí también hay un modelo para losdatos. El modelo asociado al i-ésimo nivel del factor X será:

Y= μi + ε

donde:

• Los errores ε están normalmente distribuidos con media 0

• Los errores ε son independientes

• Los errores ε tienen varianza constante σ2

Para verificar estos supuestos suele ser útil realizar un gráfico que muestre la distribución delas observaciones por niveles: si en el gráfico se aprecian diferencias entre niveles por lo quea la variación de las observaciones se refiere, es muy probable que tengamos un problemacon el supuesto de varianza constante; si aparecen “outliers”, puede que no se cumpla elsupuesto de normalidad; por otra parte, si el tiempo fuese un factor importante a la hora deregistrar observaciones, podría ocurrir que observaciones consecutivas estuviesencorrelacionadas, con lo que no se cumpliría el supuesto de independencia.

Análisis doble de la varianza (Two-Way ANOVA)

Usaremos el análisis doble de la varianza para estudiar los posibles efectos causados pordiferentes niveles de dos factores sobre la variable dependiente. Así, por ejemplo, enagricultura estaremos interesados en estudiar qué efectos tendrán, sobre el crecimiento delas patatas, variaciones en los niveles de potasio y nitrógeno de la tierra; en medicina,estaremos interesados en estudiar los efectos, sobre el dolor de cabeza, del medicamento yde la dosis empleados; en educación, buscaremos conocer qué efectos, sobre el tiemponecesario para adquirir unos conocimientos, tendrán los factores nivel de estudios y sexo; enuna campaña de marketing, estaremos interesados en conocer los efectos del presupuesto ydel medio usado (televisión, revistas, ...) sobre las ventas; etc.

Modelo aditivo (sin interacción)

El modelo aditivo supone que la variación total en los datos puede ser expresada comosuma de variaciones procedentes de fuentes diversas:(Variación total en los datos) = (Variación debida al primer factor) + (Variación debida alsegundo factor) + (Variación debida al error aleatorio)

En el modelo anterior, si la variación debida al primer factor fuese mucho mayor que lavariación debida al error aleatorio, dispondríamos de evidencia estadística contra la hipótesisnula de que los distintos niveles del primer factor tienen el mismo efecto sobre la variabledependiente; de forma similar, si la variación debida al segundo factor fuese mucho mayorque la variación debida al error aleatorio, deberíamos rechazar la hipótesis nula de que lavariable dependiente no depende de los diversos niveles del segundo factor.

Análisis de la varianza de más de dos factores.

Es una generalización del de dos factores. El procedimiento, por lo tanto, será:

1) encontrar el modelo, teniendo en cuenta si los factores son fijos o aleatorios y todos los términos de interacción.

2) subdividir la suma de cuadrados total en tantos términos ortogonales como tenga el modelo y estudiar los valores esperados de los cuadrados medios para encontrar los estadísticos que permitan realizar los contrastes de hipótesis.

Un modelo de tres factores fijos, por ejemplo, será:

Los tres primeros subíndices para los factores y el cuarto para las repeticiones, nótese que aparecen términos de interacción de segundo y tercer orden, en general en un modelo de k factores aparecen términos de interacción de orden 2, 3,... hasta k y el número de términos de interacción de orden n será el número combinatorio Ck,n. Este gran número de términos de interacción dificulta el análisis de más de dos factores, ya que son difíciles de interpretar y complican los valores esperados de los cuadrados medios por lo que también resulta difícil encontrar los estadísticos para los contrastes. Por estas razones no se suele emplear este tipo de análisis y cuando interesa estudiar varios factores a la vez se recurre a otros métodos de

...

Descargar como (para miembros actualizados) txt (10 Kb)
Leer 7 páginas más »
Disponible sólo en Clubensayos.com