ANÁLISIS DE VARIANZA (ANOVA)
Enviado por dsahuaisd • 6 de Mayo de 2019 • Biografía • 2.328 Palabras (10 Páginas) • 286 Visitas
ANÁLISIS DE VARIANZA (ANOVA)
El Análisis de Varianza (ANOVA) se ha diseñado en concreto para contrastar si dos o más poblaciones tienen la misma varianza. Aunque la finalidad del ANOVA es contrastar las diferencias de medias poblacionales, exige que se analicen las varianzas de las muestras estudiadas; de ahí el término análisis de varianza. Más concretamente, el procedimiento se puede aplicar a la determinación de si un tratamiento en particular aplicado a una población tendrá un efecto significativo sobre su media. El empleo del ANOVA surgió en el campo de la agricultura, donde se utilizaba el término tratamiento al tratar varias parcelas de tierra con diferentes fertilizantes y anotar las discrepancias en el rendimiento medio de las cosechas. En la actualidad, el término tratamiento se emplea, en sentido amplio, a cualquier situación en que se desee comparar medias.
En un estudio de ANOVA, las unidades experimentales son los objetos que reciben el tratamiento. El factor es la fuerza o variable cuyo efecto en estas unidades experimentales queremos medir.
Diseño completamente aleatorio. Las unidades experimentales son asignadas al azar a los diversos tratamientos. Todas las unidades elegidas al azar para el estudio tienen la misma probabilidad de ser asignadas a un tratamiento.
Modelo de efectos fijos. Se eligen o fijan tratamientos específicos antes de emprender el estudio.
Modelo de efectos aleatorios. Los niveles (tratamientos) usados en el estudio se eligen al azar de una población de niveles posibles.
Para aplicar el ANOVA son esenciales las premisas siguientes:
- Todas las poblaciones implicadas son normales.
- Todas las poblaciones tienen varianzas iguales.
- Las muestras se eligen de manera independiente.
ANOVA unidireccional
Es el problema más sencillo de ANOVA, se conoce también como ANOVA de un solo factor o de clasificación única, donde interviene el análisis ya sea de datos a los que se hace el muestreo a partir de más de dos poblaciones numéricas (distribuciones), o datos de experimentos en los que se han empleado más de dos tratamientos.
Si el número de tratamientos se designa por c, el sistema de hipótesis a contrastar será:
H0: µ1 = µ2 = µ3 = ··· = µc
Ha: No todas las medias son iguales
Se usa la letra c para representar el número de tratamientos porque en una tabla de ANOVA, cada tratamiento se especifica en su propia columna.
Media General
[pic 1]
Donde:
c = número de tratamientos (columnas)
rj = número de observaciones en el tratamiento (filas)
[pic 2] [pic 3]
Efecto de Tratamiento: Como las distintas muestras son sometidas a tratamientos diferentes, la variación intermuestral puede ser causada por los diferentes efectos de tratamientos.
Variación intramuestral: es debida a factores aleatorios
Variación intermuestral: es debida a factores aleatorios + efectos del tratamiento
Sumas cuadráticas
Total [pic 4]
Del tratamiento [pic 5]
Del error [pic 6]
Grados de Libertad
Total [pic 7]
Del tratamiento [pic 8]
Del error [pic 9]
Medias cuadráticas
Total [pic 10]
Del tratamiento [pic 11]
Del error [pic 12]
Estadístico de prueba
[pic 13]
Tabla ANOVA unidireccional
Fuente de variación | Suma de cuadrados | Grados de libertad | Medias cuadráticas | Valor de F |
Intermuestral (tratamiento) | SSTR | c – 1 | SSTR / (c – 1) | MSTR / MSE |
Intramuestral (error) | SSE | n – c | SSE / (n – c ) | |
Variación total | SST | n – 1 |
Relación F utilizada en el ANOVA: La relación F es la que existe entre la variación intermuestral y la variación intramuestral. Cuando las medias poblacionales son diferentes existe un efecto de tratamiento y las desviaciones intermuestrales pueden ser grandes comparadas con la desviación debida al error dentro de una muestra. Por tanto, el valor de F, que es una relación entre la variación debida al tratamiento y la variación debida al error, aumentará. Si el valor de F es mayor a su valor crítico, entonces se rechazará Ho con un nivel α de significación.
ANOVA Bidireccional:
Con el ANOVA unidireccional se piensa que es uno solo el factor que influye en las unidades experimentales. Pero a veces detectamos que puede incidir en las unidades experimentales una segunda influencia extraña. Esta consideración simultánea de dos fuerzas exige un ANOVA bidireccional. Entonces las observaciones se clasificarán por bloques y tratamientos. Este diseño experimental se denomina diseño de bloques aleatorios.
Si la formación de bloques es eficaz y se basa en un factor que afecta realmente a la medición, se obtiene una medida más pura del efecto de tratamiento. Es importante determinar si la formación de bloques es la correcta y si el factor en que se basan los bloques ejercen una influencia cierta.
...