Analisis De La Varianza
Enviado por larielgee • 14 de Abril de 2014 • 3.504 Palabras (15 Páginas) • 221 Visitas
ANALISIS DE LA VARIAZA
A veces, los analistas investigan la variabilidad de una población, en lugar de su media o proporción.
Esto es debido a que la uniformidad de la producción muchas veces es crítica en la práctica industrial.
La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis está diseñada para determinar si la varianza de una población es igual a algún valor predeterminado.
La desviación estándar de una colección de datos se usa para describir la variabilidad en esa colección y se puede definir como la diferencia estándar entre los elementos de una colección de datos y su media.
La varianza de un conjunto de datos se define como el cuadrado de su desviación estándar; y la varianza muestral se utiliza para probar la hipótesis nula que se refiere a la variabilidad y es útil para entender el pocedimiento de análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algún valor previamente especificado. Como el aspecto de interés, por lo general es si la varianza de la población es mayor que este valor, siempre se aplica una de una cola.
Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una población que se investiga; y a partir de esos datos, se calcula el estadístico de prueba.
Para este cálculo se utiliza la siguiente ecuación:
( n - 1 ) s2
2 = ----------------
2
Donde:
* n-1 = Grados de libertad para la prueba de tamaño n.
* s2 = Varianza muestral.
* 2 = Varianza poblacional si y solo si suponemos que la hipótesis nula
es cierta.
EJEMPLO
1.- Averiguar si la variabilidad de edades en una comunidad local es la misma o mayor que la de todo el Estado. La desviación estándar de las edades del Estado, conocida por un estudio reciente es de 12 años. Tomamos una muestra aleatoria de 25 personas de la comunidad y determinamos sus edades. Calcular la varianza de la muestra y usar la ecuación anteriormente explicada para obtener el estadístico muestral.
Las hipótesis nula y alternativas son:
• H0 : 2 = 144
• H1 : 2 144
Se toma la muestra y resulta una desviación estándar muestral de 15
Años. La varianza de la muestra es entonces 225, y el estadístico ji cuadrada de la muestra es:
(n - 1 ) s2 (25-1)(15)2
2 = --------------- = ------------------- = 37,5
2 122
Si la hipótesis nula es cierta, el estadístico muestral de 37,5 se obtiene de la distribución ji cuadrada teórica, en particular, la distribución con 24 grados de libertad ( 25 - 1 = 24 ).
Como se puede observar en la ecuación anterior, cuanto mas grande es la varianza muestral respecto a la varianza poblacional hipotética, mas grande es el estadístico que se obtiene. Luego deducimos que de un estadístico muestral grande llevamos al rechazo de la hipótesis nula, y un estadístico muestral pequeño implicará que no se rechaze. La tabla ji cuadrada se usa para determinar si es probable o no que el valor 37,5 haya sido obtenido de la distribución muestral ji cuadrada hipotética.
Supongamos que esta prueba debe llevarse a un nivel de significancia de 0,02. En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra el valor critico de 40, 27. La regla de decisión es:
Si 2 40,27, se rechaza la hipótesis nula de que la varianza de la población es 144 ( Se rechaza H0 si 2 > 40,27 ).
Como estadístico de prueba calculado es 37,5, la hipótesis nula no se rechaza (con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se hubiese elegido un alfa de 0,05, el valor crítico de la tabla sería 36,415, y la hipótesis nula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra la importancia de pensar con cuidado en el riesgo apropiado de un error de tipo I en una prueba de hipótesis.
Se supone que la hipótesis nula es cierta, lo que conduce a la obtención de un estadístico muestral de una distribución ji cuadrada con 2 grados de libertad.
PRUEBA DE LA VARIANZA CON DOS POBLACIONES
En ocasiones es importante comparar dos poblaciones para ver si una es mas variable que la otra en alguna medida específica. La hipótesis nula es que las dos poblaciones tienen la misma varianza, y la hipótesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de cada población y se calculan las varianzas muestrales. Estos valores se usan entonces en la ecuación siguiente para calcular el estadístico de la muestra:
Cociente F
S12
F = ---------
S22
Donde:
• S12 = Varianza de la muestra 1
• S22 = Varianza de la muestra 2
Nota: Por convivencia, para encontrar los valores de F, por lo general se pone en el numerador la varianza muestral mas grande.
El estadístico de prueba dado por la ecuación anteriormente nombrado,
es el cociente F . Si la hipótesis nula de varianzas poblacionales iguales es
cierta, la razón de las varianzas muestrales se obtiene de la distribución F
teórica. Al consultar la tabla F se puede evaluar la probabilidad de este suceso.
Si parece probable que el cociente F pueda haberse obtenido de la distribución
muestral supuesta, la hipótesis nula no se rechaza. Si es poco probable que el
cociente F se haya obtenido de la distribución supuesta, la hipótesis nula se
rechaza.
La distribución F especifica que se aplica a una prueba en particular queda determinada por dos parámetros: los grados de libertad para el numerador y los grados de libertad para el denominador. Cada uno de estos valores es n-1. Si se conocen estos valores y se elige un valor alfa, al valor crítico de F se puede encontrar en la tabla F.
Método dentro y método entre.
El método dentro para estimar la varianza de las poblaciones produce una estimación válida, sea o no cierta la hipótesis nula. El método entre produce una estimación válida sólo si la hipótesis nula es cierta.
El paso final en ANOVA requiere el cálculo de un cociente con la estimación del método entre en el numerador y la estimación del método dentro en el denominador.. Si la hipótesis nula de que las poblaciones tienen la misma media es cierta, esta razón consiste en dos estimaciones separadas de la misma varianza poblacional y, se puede obtener la distribución F si las medias poblacionales no son iguales. La estimación en el numerador estará inflada, y el resultado será un cociente muy grande. Al consultar la distribución F no es probable que un cociente tan grande haya sido obtenido de esta distribución, y la
...