ANALISIS DE VARIANZA
Enviado por faavrepa • 24 de Abril de 2013 • 1.393 Palabras (6 Páginas) • 377 Visitas
Análisis de la varianza
INTRODUCCION
Este ejemplo pone de manifiesto la importancia del diseño de experimentos en la realización de estudios estadísticos. De forma general, se entiende por diseño de experimentos al procedimiento utilizado para obtener las observaciones o medidas que componen la muestra.
Las bases del procedimiento de contraste de hipótesis son las siguientes:.
Si la variabilidad de los datos alrededor de cada media muestral es pequeña comparada con la variabilidad que se observa entre las medias, será una evidencia en contra de la hipótesis nula de igualdad de las medias poblacionales.
Por el contrario, si la variabilidad de los datos alrededor de cada media muestral es relevante comparada con la variabilidad observada entre las medias muestrales, decidiremos que los datos no presentan evidencias importantes contra la hipótesis nula.
Debido a que la varianza de los datos es importante en la decisión de rechazo o no rechazo de la hipótesis nula, el procedimiento de análisis se denomina análisis de la varianza.
2. DESARROLLO TEORICO
2.1. Análisis de la varianza con un factor
Supongamos que tenemos K poblaciones y queremos comparar un determinado parámetro en cada una de ellas. Dicho parámetro se modelará, para cada una de las poblaciones, como una variable aleatoria. Llamaremos a las correspondientes medias poblacionales para cada población.
De cada población extraemos una muestra aleatoria de tamaño , respectivamente. Denominaremos al valor de la observación j-ésima en la población i-ésima. Así, y . La hipótesis nula que deseamos contrastar es la de igualdad de medias poblacionales, es decir,
El procedimiento comienza por obtener las medias poblacionales de los datos correspondientes a cada población, es decir:
El siguiente paso es obtener la media común de todos los datos a partir de la muestra completa. Es decir:
siendo el número total de datos de la muestra completa. Una forma alternativa para es:
EJERCICIO:
Demostrar que ambas expresiones de son equivalentes.
Ya hemos dicho en la introducción que la base del procedimiento de análisis de varianza es la comparación entre los dos tipos de variabilidad que se pueden observar en los datos:
• Denominaremos variabilidad dentro de los grupos a la variabilidad en torno a los valores muestrales de la media para cada una de las K poblaciones.
• Denominaremos variabilidad entre grupos a la variabilidad entre las medias de los K grupos.
Vamos a estimar esas dos fuentes de variabilidad. En primer lugar, obtendremos una medida de la variabilidad dentro de los grupos. Para cada grupo sumaremos los valores de las diferencias al cuadrado de los valores en ese grupo y la media muestral del grupo. Es decir:
La variabilidad total dentro de los grupos la obtendremos como la suma de los K valores anteriores, es decir:
En segundo lugar, vamos a estimar la variabilidad entre grupos. Una forma razonable de proceder sería evaluar las diferencias entre la media muestral de cada grupo y la media muestral global. Es decir: .
Llamaremos a la medida total de variabilidad entre grupos suma total de cuadrados entre grupos: SCG. Al calcularla, habrá que tener en cuenta que se debe dar más peso a las discrepancias que se observen en los grupos en los que haya más medidas:
A veces es útil calcular la suma de cuadrados total. es la suma d los cuadrados de las diferencias de las observaciones y la media global. La expresamos como SCT.
Y se puede demostrar que
Vamos a establecer nuestro contraste de hipótesis para la igualdad de medias de las poblaciones. Actuaremos bajo la suposición de que todas las poblaciones tienen la misma varianza.
En ese caso puede demostrarse que se puede obtener una estimación insesgada de la varianza poblacional, que es:
CMD se denomina cuadrado medio dentro de los grupos.
Sólo bajo la hipótesis de que las medias poblacionales son iguales, otro estimador insesgado de la varianza poblacional es lo que se denomina cuadrado medio entre grupos:
Si las medias poblacionales no son iguales, este valor tenderá a presentar valores superiores al anterior, ya que incorporará información sobre las verdaderas diferencias entre las medias.
Pero si la hipótesis nula es cierta, CMG y CMD son dos estimadores de la misma cantidad. El contraste de hipótesis está basado en la razón de ambas cantidades:
Si la hipótesis nula es verdadera, la razón anterior será aproximadamente igual a 1. En caso contrario, tenderá a ser mayor que 1. Se puede demostrar que si la hipótesis nula es cierta, F tiene una distribución
...