Analisis De Varianza
Enviado por SALVADOROCA • 3 de Mayo de 2012 • 10.429 Palabras (42 Páginas) • 819 Visitas
PRUEBA DE LA VARIANZA CON UNA POBLACIÓN
A veces, los analistas investigan la variabilidad de una población, en lugar de su media o proporción.
Esto es debido a que la uniformidad de la producción muchas veces es crítica en la práctica industrial.
La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis está diseñada para determinar si la varianza de una población es igual a algún valor predeterminado.
La desviación estándar de una colección de datos se usa para describir la variabilidad en esa colección y se puede definir como la diferencia estándar entre los elementos de una colección de datos y su media.
La varianza de un conjunto de datos se define como el cuadrado de su desviación estándar; y la varianza muestral se utiliza para probar la hipótesis nula que se refiere a la variabilidad y es útil para entender el pocedimiento de análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algún valor previamente especificado. Como el aspecto de interés, por lo general es si la varianza de la población es mayor que este valor, siempre se aplica una de una cola.
Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una población que se investiga; y a partir de esos datos, se calcula el estadístico de prueba.
Para este cálculo se utiliza la siguiente ecuación:
( n - 1 ) s2
2 = ----------------
2
Donde:
* n-1 = Grados de libertad para la prueba de tamaño n.
* s2 = Varianza muestral.
* 2 = Varianza poblacional si y solo si suponemos que la hipótesis nula
es cierta.
EJEMPLO
1.- Averiguar si la variabilidad de edades en una comunidad local es la misma o mayor que la de todo el Estado. La desviación estándar de las edades del Estado, conocida por un estudio reciente es de 12 años. Tomamos una muestra aleatoria de 25 personas de la comunidad y determinamos sus edades. Calcular la varianza de la muestra y usar la ecuación anteriormente explicada para obtener el estadístico muestral.
Las hipótesis nula y alternativas son:
• H0 : 2 = 144
• H1 : 2 144
Se toma la muestra y resulta una desviación estándar muestral de 15
Años. La varianza de la muestra es entonces 225, y el estadístico ji cuadrada de la muestra es:
(n - 1 ) s2 (25-1)(15)2
2 = --------------- = ------------------- = 37,5
2 122
Si la hipótesis nula es cierta, el estadístico muestral de 37,5 se obtiene de la distribución ji cuadrada teórica, en particular, la distribución con 24 grados de libertad ( 25 - 1 = 24 ).
Como se puede observar en la ecuación anterior, cuanto mas grande es la varianza muestral respecto a la varianza poblacional hipotética, mas grande es el estadístico que se obtiene. Luego deducimos que de un estadístico muestral grande llevamos al rechazo de la hipótesis nula, y un estadístico muestral pequeño implicará que no se rechaze. La tabla ji cuadrada se usa para determinar si es probable o no que el valor 37,5 haya sido obtenido de la distribución muestral ji cuadrada hipotética.
Supongamos que esta prueba debe llevarse a un nivel de significancia de 0,02. En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra el valor critico de 40, 27. La regla de decisión es:
Si 2 40,27, se rechaza la hipótesis nula de que la varianza de la población es 144 ( Se rechaza H0 si 2 > 40,27 ).
Como estadístico de prueba calculado es 37,5, la hipótesis nula no se rechaza (con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se hubiese elegido un alfa de 0,05, el valor crítico de la tabla sería 36,415, y la hipótesis nula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra la importancia de pensar con cuidado en el riesgo apropiado de un error de tipo I en una prueba de hipótesis.
Se supone que la hipótesis nula es cierta, lo que conduce a la obtención de un estadístico muestral de una distribución ji cuadrada con 2 grados de libertad.
PRUEBA DE LA VARIANZA CON DOS POBLACIONES
En ocasiones es importante comparar dos poblaciones para ver si una es mas variable que la otra en alguna medida específica. La hipótesis nula es que las dos poblaciones tienen la misma varianza, y la hipótesis alternativa es que una tiene mayor varianza que la otra. Se obtienen muestras aleatorias de cada población y se calculan las varianzas muestrales. Estos valores se usan entonces en la ecuación siguiente para calcular el estadístico de la muestra:
Cociente F
S12
F = ---------
S22
Donde:
• S12 = Varianza de la muestra 1
• S22 = Varianza de la muestra 2
Nota: Por convivencia, para encontrar los valores de F, por lo general se pone en el numerador la varianza muestral mas grande.
El estadístico de prueba dado por la ecuación anteriormente nombrado,
es el cociente F . Si la hipótesis nula de varianzas poblacionales iguales es
cierta, la razón de las varianzas muestrales se obtiene de la distribución F
teórica. Al consultar la tabla F se puede evaluar la probabilidad de este suceso.
Si parece probable que el cociente F pueda haberse obtenido de la distribución
muestral supuesta, la hipótesis nula no se rechaza. Si es poco probable que el
cociente F se haya obtenido de la distribución supuesta, la hipótesis nula se
rechaza.
La distribución F especifica que se aplica a una prueba en particular queda determinada por dos parámetros: los grados de libertad para el numerador y los grados de libertad para el denominador. Cada uno de estos valores es n-1. Si se conocen estos valores y se elige un valor alfa, al valor crítico de F se puede encontrar en la tabla F.
EJEMPLO
1.- Averiguar si la variabilidad del salario por hora es la misma en dos sucursales, o si la variabilidad de la sucursal 1 es mayor que la de la sucursal 2. La comparación de la variabilidad de las dos sucursales constituye el primer paso en un estudio detallado sobre ingresos.
Se toman muestras aleatorias de los salarios por hora en cada sucursal para determinar las varianzas muestrales y elegimos un nivel de significancia de 0,05. La hipótesis nula y alternativa son:
• H0 : 12 - 22 0
• H1 : 12 - 22 > 0
Los resultados de la muestra son:
S1 = $3,79 S12 = 14,3641 n1 = 21 (Sucursal 1)
S2 = $2,48 S22 = 6,1504 n2 = 25 (Sucursal 2)
El estadístico F se calcula mediante la ecuación anteriormente explicada:
S12 14,3641
F = ------- = ---------------- = 2,34
S22 6,1504
El
...