Comprobación de hipótesis ANOVA (Análisis de varianza)
Enviado por • 15 de Abril de 2015 • 4.583 Palabras (19 Páginas) • 381 Visitas
UNIVERSIDAD TÉCNICA DE AMBATO.
FACULTAD DE CIENCIAS ADMINISTRATIVAS
CARRERA ORGANIZACIÒN DE EMPRESAS
MODALIDAD PRESENCIAL.
MODULO FORMATIVO APLICACIÓN METODOLOGICA DE ANÁLISIS ESTADÍSTICOS.
COMPROBACIÓN DE HIPÓTESIS (ANOVA).
INTEGRANTES:
Adame Christian
Montesdeoca Salas
Salazar Edwin
DOCENTE: Ing. Mg. Carlos Pinos.
PARALELO: IV “B”
Período: Octubre 2014 - Marzo 2015.
TEMA.
Comprobación de hipótesis ANOVA (Análisis de varianza).
ANALISIS DE LA VARIANZA
El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés.
Las medias de las poblaciones no son iguales
El ANOVA requiere el cumplimiento los siguientes supuestos:
Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.
Las K muestras sobre las que se aplican los tratamientos son independientes.
Las poblaciones tienen todas igual varianza.
EL PROCEDIMIENTO
Parte A: La hipótesis nula y alternativa
La hipótesis nula y alternativa se expresa en términos de la igualdad de las medias poblacionales para todos los grupos de tratamientos.
Parte B: El formato de los datos que se analizan
Los datos pueden listarse en forma tabular, con una columna separada para cada tratamiento t. el número de observaciones en las columnas (n1, n2, n3,.., nt) no necesita ser igual.
Parte C: Los cálculos para un ANOVA de un sentido.
Cálculos específicos necesarios para efectuar un ANOVA de un sentido.
Cada una de estas cantidades se asocia con una fuente específica de variación dentro de los datos de la muestra.
La suma de los términos cuadrados: cuantificación de las dos fuetes de variación.
Los tratamientos, TR.SSTR es el valor de la suma de cuadrados que refleja la variación entre las medias de los diferentes tratamientos y la media general para todos los tratamientos (x ̿). Ponderado de acuerdo al tamaño de las muestras para los grupos de tratamientos respectivos, el SSTR expresa la cantidad de variación que se puede atribuir a los tratamientos.
El error de muestreo, E. SSE es la suma de cuadrados de las diferencias entre los valores y las medias observadas para sus respectivos grupos de tratamiento; expresa la cantidad de variación debido al error de muestreo.
La variación total, T. SST es la cantidad total de variación, o SST= SSTR+SSE
Hacer comparables las magnitudes de las dos fuentes de variación. MSTR es el cuadrado medio de la variación entre los grupos. Se obtiene dividiendo SSTR entre un numero apropiado de grados de libertad (t – 1), de modo que MSTR se pueda comparar con MSE en el cálculo del estadístico de la prueba.
MSE es el cuadrado medio de la variación dentro del grupo. Se obtiene dividiendo SSE entre un número adecuado de grados de libertad (N – t).
Parte D: El estadístico de la prueba, el valor crítico y la regla de decisión.
El estadístico de la prueba: la razón F, MSTR/MSE es el estadístico de la prueba en el que nos basamos para llegar a una conclusión.
El MSTR estima la varianza común ( ) con base a la variación entre las medias de los tratamientos.
MSE estima la varianza común con base en la variación dentro de los grupos de tratamientos mismos, y el estadístico de la prueba F, es la razón de estas diferentes estimaciones de la varianza común.
El valor crítico y la regla de decisión.
La prueba es de cola derecha y para un nivel de significancia especifico (∞), rechazamos Ho: µ1=µ2=…..=µt, si el valor calculado de F > F [∞, (t – 1), (N – t).
La distribución F, es la distribución de muestreo para la relación de dos varianzas muéstrales cuando se extraen repetidamente muestras aleatorias de la misma población con distribución normal.
Si las poblaciones en un experimento en realidad tienen la misma media (y considerando las suposiciones de varianza iguales y distribuciones normales), el valor calculado de nuestro estadístico de prueba debe ser aproximadamente de 1.0, si Ho es verdadera.
En la medida que el F calculado sea mayor que 1.0, tenderemos a concluir que las medias poblacionales tal vez no sean iguales. Por supuesto, la conclusión específica que obtengamos dependerá de:
El nivel de significancia que hayamos seleccionado
Nuestra comparación con el F calculado con el F critico
EJEMPLO
Una empresa de contabilidad desarrollo tres métodos con el propósito de guiar a sus empleados temporales para elaborar las declaraciones individuales de impuestos. Para comparar la eficacia de estos métodos, se prepara una prueba en la cual cada uno de los 10 empleados temporales se asigna de manera aleatoria para utilizar uno de los tres métodos para elaborar una hipotética solicitud de devolución de impuestos. Los tiempos de elaboración (en minutos). Con un nivel de significancia de 0.025
¿Podemos concluir que los tres métodos pueden tener la misma eficacia?
RESOLUCION:
método 1 método 2 método 3
15 10 18
20 15 19
19 11 23
14
x ̅.1=17 x ̅.2=12 x ̅.3=20
Número total de observaciones:
∑▒n= N= 4+3+3 N= 10
La gran media (x ̿)
∑▒x/N= (15+20+19+14+10+15+11+18+19+23)/10 = 16.4 minutos
Suma de cuadrados en los tratamientos, SSTR
∑▒nj (x ̅.j - x ̿)2 = 4(17-16.4)2+3(12-16.4)2+3(20-16.4)2
SSTR= 98.4
Suma de cuadrados de los errores, SSE
∑▒〖(x〗ij - x ̅.j)2
= [█(■((15-17)^2@(20-17)^2@(19-17)^2 )@(14-17)^2 )] + [█(█(■((10-12)^2@(15-12)^2@(11-12)^2 )))] + [█(■((18-20)^2@(19-20)^2@(23-20)^2 ))]
SSE=54
Suma de cuadrados total, SST
∑▒〖(x〗ij -x ̿)2
= [█(■((15-16.4)^2@(20-16.4)^2@(19-16.4)^2 )@(14-16.4)^2 )] + [█(█(■((10-16.4)^2@(15-16.4)^2@(11-16.4)^2 )))] + [█(■((18-16.4)^2@(19-16.4)^2@(23-16.4)^2 ))]
SST=152.4 O SST=SSTR+SSE
...