ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Análisis De Varianza


Enviado por   •  11 de Abril de 2014  •  4.535 Palabras (19 Páginas)  •  322 Visitas

Página 1 de 19

Análisis de Varianza: es una técnica de comparación de dos o más grupos. Estudia la variación de cada una de las variables independientes de un fenómeno. La mayoría de los experimentos consiste en el estudio del efecto de una o más variables independientes sobre una respuesta. El ANVA se aplica a diferentes situaciones tanto para animales, como plantas o situaciones de tipo social económica, por ejemplo: Preferencias, aceptación de artículos, etc.

En estadística, el análisis de la varianza (ANOVA, Analysis of Variance, según terminología inglesa) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos a diferentes variables explicativas. Por lo que ANOVA está diseñada específicamente para probar si dos o más poblaciones tienen la misma media. Aun cuando el propósito de ANOVA es hacer pruebas para hallar las diferencias en las medidas poblacionales, implica un examen de las varianzas muéstrales; de allí el termino de análisis de varianza.

El ANOVA parte de algunos supuestos que han de cumplirse:

• La variable dependiente debe medirse al menos a nivel de intervalo.

• Independencia de las observaciones.

• La distribución de los residuales debe ser normal.

• Homocedasticidad: homogeneidad de las varianzas.

Las técnicas englobadas bajo la denominación de análisis de la varianza o abreviadamente ANOVA (del inglés analysis of variance) han jugado un papel crucial en la metodología estadística moderna, desde que fueran ideadas por R.A. Fisher en 1925, y como sucede en tantas ocasiones, aunque conocidas por la gran mayoría, quizás no son adecuadamente comprendidas por los no especialistas.

Casi siempre se introduce el tema del análisis de la varianza como respuesta a la necesidad de utilizar una técnica de comparación de más de dos grupos, es decir como un método para comparar más de dos tratamientos: si disponemos de medidas cuantitativas continuas, que se puede suponer como procedentes de una distribución de probabilidad normal, y queremos comparar dos grupos -dos tratamientos-, la prueba estadística que se utiliza es un contraste de medias basado en la t de Student, y cuando se dispone de más de dos grupos, la prueba a emplear es el análisis de la varianza.

En el análisis de varianza (ANOVA) se comparan tres o más medias muestrales para determinar si provienen de poblaciones iguales. Para utilizar esta técnica, se supone lo siguiente:

1. Las poblaciones tienen una distribución normal.

2. Las poblaciones tienen desviaciones estándar iguales.

3. Las muestras se seleccionan de manera independiente.

ANOVA tuvo sus inicios en la agricultura, y muchos de los términos en que se relacionan con ese contexto permanecen vigentes. En particular se emplea el término tratamiento para identificar las diferentes poblaciones que se examinan. ¿Por qué es preciso estudiar ANOVA? La principal razón es la acumulación insatisfactoria del error tipo I (Rechazar la hipótesis nula cuando en realidad es verdadera), ya que ANOVA permitirá comparar en forma simultánea las medias de tratamiento y evitar la acumulación de errores tipo I.

ANÁLISIS DE VARIANZA (ANOVA)

¿Cómo funciona la prueba ANOVA? Recuerde que se desea determinar si las diversas medias de muestra proceden de una sola población, o de poblaciones con distintas medias. De hecho, las medias de muestras se comparan por medio de sus varianzas. Uno de los supuestos de la prueba ANOVA fue que debían ser iguales las desviaciones estándar de las diversas poblaciones. En la prueba ANOVA se aprovecha ese requerimiento. La estrategia fundamental consiste en calcular la varianza de población (la desviación estándar elevada al cuadrado) de dos formas y luego encontrar la relación de esas dos estimaciones. Si la relación está próxima a uno, entonces ambas estimaciones, de forma lógica son iguales, y se concluye que las medias de población son iguales. Si la relación es muy distinta de 1, entonces se concluye que las medias de población no son las mismas. La distribución F nos indica que la relación es mucho mayor que 1 para haber ocurrido por casualidad.

Ilustremos lo anterior con un ejemplo.

El propietario de una granja desea determinar si existe una diferencia en los rendimientos medios de trigo para los diversos fertilizantes. Tiene doce parcelas de tierra y asignó al azar cuatro de ellas a cada uno de los tres fertilizantes. Para comenzar, encuentre el rendimiento medio de trigo, en Bushels, de las doce parcelas de tierra. Son 58 bushels que se encuentra por (55+54+…+48)/12. A continuación, para cada una de las doce parcelas, encontrar la distancia entre el desarrollo de esa parcela en particular y la media general. Cada una de estas diferencias se eleva al cuadrado y se suman dichos cuadrados. Este término se conoce como variación total.

Variación total. La suma del cuadrado de las diferencias entre cada observación y la media global. |

En el ejemplo, la variación total es 1,082, que se encuentra por (55-58)2+(54-58)2+…+(48-58)2.

A continuación, separe la variación total en sus dos componentes: el que se debe a los tratamientos y el aleatorio. Para encontrar estos dos componentes, determine la media de cada uno de los tratamientos. En el ejemplo, se calcularon el rendimiento medio de trigo de las cuatro parcelas que se fertilizaron con la marca Wolfe, y de las cuatro parcelas que se fertilizaron con la marca White, y el de las cuatro que se fertilizaron con la marca Korosa. La primera fuente de variación se debe a los tratamientos.

Variación de tratamiento. La suma del cuadrado de las diferencias entre la media de cada tratamiento y la media global.

En el ejemplo de los fertilizantes, la variación que se debe a los tratamientos es la suma del cuadrado de las diferencias entre la media de cada fertilizante y la media global. Este término es 992. Para calcularlo, primero es preciso encontrar el rendimiento medio de cada uno de los tres tratamientos. El rendimiento medio para Wolfe es 53 bushels, que se encuentra por (55+54+59+56)/4. Las otras medias son 70 y 48 bushels respectivamente. La suma de los cuadrados debido al tratamiento es (56-58)2+(56-58)2+…+(48-58)2=4(56-58)2+4(70-58)2+4(48-58)2=992. Si existe considerable variación entre las medias de tratamiento, es lógico que este término sea un valor grande. Si las medias del tratamiento son similares, este término tendrá un valor pequeño. El menor valor posible es cero. Esto ocurre cuando todas las medias de tratamiento son iguales.

La otra fuente de variación a que se hace referencia es el componente aleatorio, o componente de error.

Variación aleatoria. La suma

...

Descargar como (para miembros actualizados) txt (27 Kb)
Leer 18 páginas más »
Disponible sólo en Clubensayos.com