Leer Ensayo Completo Prueba De Comparación Multiple De Tukey

Prueba De Comparación Multiple De Tukey

Imprimir Documento!
Suscríbase a ClubEnsayos - busque más de 1.608.000+ documentos

Categoría: Temas Variados

Enviado por: Stella 16 mayo 2011

Palabras: 6322 | Páginas: 26

...

3 grupos de edad: menores de 35 años, entre 35 y 55 años y mayores de 55 años).

El análisis estadístico de datos derivados de un experimento tiene como propósito proveer información referente a la manera en que las unidades experimentales responden a los tratamientos aplicados. El primer paso consiste en someter los datos a un análisis de varianza para establecer si hay diferencias significativas entre las medias de los tratamientos. El rechazo de la hipótesis nula de igualdad de medias en el análisis de varianza, conduce a preguntar cuáles diferencias entre las medias muestrales son las responsables del rechazo.

HISTORIA DE JOHN WILDER TUKEY

[pic]

John Wilder Tukey nació en New Bedford, un pueblo pesquero de la costa sur de Massachussets. Su padre era profesor de latín en una escuela secundaria, su madre fue maestra también.

John se graduó de la cercana Universidad de Brown con un título en química, seguida de un título de grado en matemáticas en Princeton. De hecho, pasó la mayor parte de su vida en Princeton, donde fundó la universidad Departamento de Estadística y enseñó durante décadas.

John Tukey pronto se convirtió en uno de los estadistas más influyentes de finales del siglo 20. Gran parte de su trabajo son análisis sólido, que permite a los investigadores, llegar a conclusiones fiables, incluso cuando los datos son deficientes. También introdujo nuevas formas de presentar los datos con claridad, incluyendo los diagramas de tallo y hojas. Y junto con James Cooley, desarrolló la Transformada Rápida de Fourier, un algoritmo, con amplias aplicaciones en las ciencias físicas. (Ayuda a los astrónomos, por ejemplo, para determinar el espectro de la luz procedente de una estrella mucho más rápidamente que con otros métodos.) Pero Tukey fue un pensador de gran alcance. No se contentó con permanecer dentro de la academia. Como él mismo dijo, "La mejor cosa sobre ser un estadista es que puedes jugar en el patio trasero de todos". Por lo tanto, trabajó como investigador para AT & T Bell Laboratorios, se convirtió en un consultor del gobierno, corporaciones y otras organizaciones, y fue un participante destacado en los debates sociales.

Su trabajo gubernamental incluyó el diseño del avión espía U-2. Inspiró (conjuntamente con Lyman Spitzer, Jr.), el Telescopio Espacial Hubble. Esto condujo a la recomendación de aplicar métodos estadísticos para ajustar el 1990 Censo de los EE.UU. con el fin de contar con los residentes urbanos pobres que habían pasado por alto. En 1973, el presidente Nixon le otorgó la Medalla Nacional de Ciencias.

Fuera del gobierno, trabajó para la Corporación Xerox, Merck and Co. y en la cadena de televisión NBC (para la cual diseñó encuestas para predecir y analizar las elecciones). Y él era un participante en el debate público vigoroso. Así, presidió el comité que relacionaba el uso de aerosoles a los daños causados a la capa de ozono. Y allá por la década de 1950, mientras trabajaba para el Consejo Nacional de Investigación, realizó un toque al criticar la investigación de Alfred C. Kinsey 's sobre el comportamiento sexual. El Informe Kinsey había conmocionado a la nación al representar a los hábitos sexuales del país como muy distinto del que se pensaba. Crear una expresión que logra cierta popularidad o pasa a formar parte de la lengua común.

Aunque poca gente lo conoce, Tukey fue también un lingüista aficionado que hizo contribuciones significativas a la lengua de los tiempos modernos. Así, en la década de 1940, Crear el término bit, una abreviatura de "dígito binario", que describe el 0 y 1 que se han convertido en la base de programas de ordenador. En la década de 1950, décadas antes de la fundación de Microsoft, crea el software de palabra, que, predijo, sería al menos tan importante como todo lo que hardware del equipo, a continuación, consistentes en tubos, transistores, alambres, y tal. Por último, desarrollada y nombrada la prueba HSD para determinar con honestidad diferencias significativas entre los pares de medias de las muestras que se analizan en el ANOVA.

TIPOS DE CLASIFICACIÓN DE LAS PRUEBAS DE COMPARACIÓN MÚLTIPLE

Existen diferentes tipos de clasificaciones de las pruebas de comparaciones múltiples lo cual nos ofrece una variedad de dimensiones según las cuales caracterizar a las pruebas (Hochberg y Tamhane, 1987; Toothaker, 1991). Por ejemplo, Toothaker (1991, 1993) propone las siguientes dimensiones:

1) Según el número de comparaciones.

2) según el tipo de contraste (ortogonales frente a no ortogonales).

3) según la manera de comparación (por pares o no).

4) comparaciones a priori o comparaciones a posteriori.

5) según el proceso de cálculo (simples o en un único paso o en varios pasos 'stepwise', estos a su vez se dividen en step-down o step-up, según se proceda desde la mayor diferencia hasta la más pequeña o desde la menor diferencia a la mayor).

6) según el tipo de estadístico y/o la distribución teórica utilizada en su cálculo.

7) según el tipo de tasa de error (existen dos tipos: tasa de error por comparación y tasa de error por familia).

Muchas de las dimensiones anteriores pueden aparecer combinadas según la elección de la prueba que se realice. Se podrían utilizar comparaciones múltiples a priori y una tasa de error por comparación. O se pueden utilizar comparaciones ortogonales y a posteriori con una tasa de error por comparación. Algunas combinaciones son imposibles, tales como todas las comparaciones por pares y ortogonales. Sin embargo, es cierto que unas determinadas combinaciones se suelen utilizar con más frecuencia, como comparaciones ortogonales y a priori con una tasa de error por comparación.

TIPOS DE PRUEBAS DE COMPARACIÓN MÚLTIPLE.

Definición de Prueba de Comparación Múltiple:

Es propósito de todo investigador que al realizar un análisis de varianza de un experimento en particular, realiza la prueba sobre el efecto de los tratamientos en estudio, para ello hace uso de la prueba F el cual indicará si los efectos de todos los tratamientos son iguales o diferentes; En caso de aceptar la hipótesis de que todos los tratamientos no tienen el mismo efecto, entonces es necesario realizar pruebas de comparación de promedios a fin de saber entre que tratamientos hay diferencias, y para esto es necesario realizar pruebas de comparación múltiple como las siguientes:

Diferencia Significativa Mínima (DLS):

Es una prueba para comparar dos medias y su uso en comparaciones simultáneas se justifica sólo en las siguientes condiciones:

➢ La prueba F resulta significativa.

➢ Las comparaciones fueron planeadas antes de ejecutar el experimento.

Prueba de Rangos Múltiples de Duncan:

Este procedimiento es utilizado para realizar comparaciones múltiples de medias; para realizar esta prueba no es necesario realizar previamente la prueba F y que ésta resulte significativa; sin embargo, es recomendable efectuar esta prueba después que la prueba F haya resultado significativa, a fin de evitar contradicciones entre ambas pruebas.

Prueba de Rangos Múltiples de Tukey:

Este procedimiento es llamado también «Diferencia Significativa Honesta», se utiliza para realizar comparaciones múltiples de medias; esta prueba es similar a la prueba de Duncan en cuanto a su procedimiento y además es más exigente.

Prueba de Comparación de Dunnet:

Esta prueba es útil cuando el experimentador está interesado en determinar que tratamiento es diferente de un testigo, control o tratamiento estándar, y no en hacer todas las comparaciones posibles (que pasarían a una segunda prioridad); es decir, cuando se quiere comparar el testigo con cada uno de los tratamientos en estudio.

Comparación entre Prueba de Comparación Múltiple

A continuación presentamos algunas de las pruebas de comparaciones múltiples clasificadas según la distribución estadística que utilizan en su cálculo:

Tukey (Tukey, 1953) Basadas en la distribución del Rango

Duncan (Duncan, 1955) Studentizado.

LSD de Fisher (Fisher, 1935) Basadas en una prueba t protegida

Dunnet (Dunnett, 1955) Basadas en la comparación con un control

VENTAJAS Y DESVENTAJAS DE LA PRUEBA DE COMPARACIÓN MULTIPLE DE TUKEY

Ventajas:

■ Cumple con el supuesto de Homocedasticidad.

■ Involucra la comparación de todos los pares de medias.

■ Es exigente y exacta.

■ Es recomendable usar Tukey cuando un experimento conste de 10 o más tratamientos.

■ Es de fácil cálculo.

■ No se corre el riesgo de no conservar el nivel de significancia.

Desventajas:

■ Es necesario realizar obligadamente un ANDEVA.

■ No se puede calcular con este método más de dos medias simultáneamente.

■ No realizan comparaciones de sólo algunos pares de medias.

■ No se puede utilizar para pruebas con diseños no balanceados.

EJEMPLO:

Amelia del Rio es vicepresidenta del Banco Chile, en Los Ángeles. Los recientes esfuerzos promocionales para atraer nuevos depositantes incluyen algunos juegos y premios en cuatro sucursales del banco. Carla está convencida de que diferentes tipos de premios atraerían a diferentes grupos de ingreso. Las personas de un nivel de ingreso prefieren los regalos, mientras que los de otro grupo de ingresos pueden sentirse más atraídos por viajes gratuitos a sitios favoritos para pasar vacaciones. Carla decide utilizar el monto de los depósitos como una medida representativa del ingreso. Ella desea determinar si existe una diferencia en el nivel promedio de depósitos entre las cuatro sucursales. Si se encuentra alguna diferencia, Carla ofrecerá una diversidad de premios promocionales.

|Depósito (rj ) |Sucursal 1 |Sucursal 2 |Sucursal 3 |Sucursal 4 |

| |(Tratamiento 1) |(Tratamiento 2) |(Tratamiento 3) |(Tratamiento) |

|1 |5.1 |1.9 |3.6 |1.3 |

|2 |4.9 |1.9 |4.2 |1.5 |

|3 |5.6 |2.1 |4.5 |0.9 |

|4 |4.8 |2.4 |4.8 |1.0 |

|5 |3.8 |2.1 |3.9 |1.9 |

|6 |5.1 |3.1 |4.1 |1.5 |

|7 |4.8 |2.5 |5.1 |2.1 |

Para dar comienzo al desarrollo de este ejercicio comenzaremos aplicando el método Anova.

Aquí aparecen siete depósitos seleccionados aleatoriamente de cada sucursal (cifras en millones de $)

❖ Hay c = 4 tratamientos (sucursales)

rj = 7 observaciones en cada tratamiento

❖ El número total de observaciones (n) es: n = r * c = 7 * 4 =28

1. Se calculan las medias de cada tratamiento (sucursales):

|Depósito (rj ) |Sucursal 1 |Sucursal 2 |Sucursal 3 |Sucursal 4 |

| |(Tratamiento 1) |(Tratamiento 2) |(Tratamiento 3) |(Tratamiento 4) |

|1 |5.1 |1.9 |3.6 |1.3 |

|2 |4.9 |1.9 |4.2 |1.5 |

|3 |5.6 |2.1 |4.5 |0.9 |

|4 |4.8 |2.4 |4.8 |1.0 |

|5 |3.8 |2.1 |3.9 |1.9 |

|6 |5.1 |3.1 |4.1 |1.5 |

|7 |4.8 |2.5 |5.1 |2.1 |

| |_ |_ |_ |_ |

| |X =4.87 |X =2.29 |X = 4.31 |X =1.46 |

2. Se calcula la Gran Media:

= X = ΣX ij

n

= (5.1+4.9+5.6+4.8+3.8+5.1+4.8+1.9+1.9+2.1+2.4+….+ 2.1)

28

= 3.23

➢ Amelia del Rio desea probar la Hipótesis al nivel del 5% que:

H0: µ1 = µ2 = µ3 = µ4

H1: No todas las medias son iguales

Para determinar si todas las medias son o no iguales se debe comparar entre: La Razón F y El Valor Crítico de F

• 1.RAZÓN F: F = CMT

CME

• 2.VALOR CRÍTCO DE F: F = α, c-1, n-c

1. Cálculo de la Razón Fisher

Utilizando las fórmulas tenemos:

. Para calcular el CMTR debemos saber (CMTR):

• Suma de cuadrados de los tratamientos:

SCTR = Σrj (Xj - X)2

= 7(4.87-3.23)2 + 7(2.29+3.23)2+7(4.31+3.23)2+7(1.46-3.23)2

= 55.33

✓ Por lo tanto: CMTR=SCTR = 55.33 = 18.44

c-1 4-1

GRADOS DE LIBERTAD: c-1

2. Para calcular el CME debemos saber (CME):

• Suma del cuadrado del error:

SCE = ΣΣ (Xij –Xj)2

= (5.1 - 4.87)2 + ……….+ (4.8 - 4.87)2 Para el 1º tratamiento

= (1.9 – 2.29)2 + ……….+ (2.5 – 2.29)2 Para el 2º tratamiento

= (3.6 – 4.31)2 + ……….+ (5.1 – 4.31)2 Para el 3º tratamiento

= (1.3 – 1.46)2 + ……….+ (2.1 – 1.46)2 Para el 4º tratamiento

= 5.67

✓ Por lo tanto: CME = SCE = 5.97 = 0.236

n-c 28-4

✓ GRADOS DE LIBERTAD: n-c

Entonces la Razón F es: F = CMTR

CME

= 18.44 = 78.14

0.236

2. Calculo del Valor Crítico de Fisher:

✓ Entonces F = 0.05, 3 , 24 = ?

✓ Vamos a la Tabla ANOVA

TABLA DE DISTRIBUCIÓN F

F = 0.95 α = 0.05

Grados de libertad del Numerador

|Grados de libertad del |1 |2 |3 |4 |5 |6 |

|denominador | | | | | | |

|18 |4.41 |3.55 |3.16 |2.93 |2.77 |2.66 |

|19 |4.38 |3.52 |3.13 |2.90 |2.74 |2.63 |

|20 |4.35 |3.49 |3.10 |2.87 |2.71 |2.60 |

|21 |4.32 |3.47 |3.07 |2.84 |2.68 |2.57 |

|22 |4.30 |3.44 |3.05 |2.82 |5.66 |2.55 |

|23 |4.28 |3.42 |3.03 |2.80 |2.64 |2.53 |

|24 |4.26 |3.40 |3.01 |2.78 |2.62 |2.51 |

|25 |4.24 |3.39 |2.99 |2.76 |2.60 |2.49 |

✓ Por lo tanto:

H0: µ1 = µ2 = µ3 = µ4

H1: No todas las medias son iguales

✓ Decisión: Rechazar la hipótesis nula si F >3.01

✓ Conclusión: Debido a que F= 78.14>3.01, se rechaza la hipótesis nula

✓ INTERPRETACIÓN:

Debido a que F=78.14, se debe rechazar la hipótesis nula. Puede estar 95% seguro de que los depósitos promedios en todas las sucursales bancarias no son iguales. Si considera que los grupos de ingreso diferentes se sienten atraídos por tipos de juegos de promoción distintos, debería diseñar esquemas alternativos para que cada sucursal atraiga nuevos depositantes.

✓ Ahora para saber cual o cuales son las medias distintas se debe utilizar la prueba de TUKEY

Ya concluido con el método Anova podemos aplicar el método Tukey según la conclusión que llegamos:

✓ Conclusión: Debido a que F = 78.14>3.01, se rechaza la hipótesis nula.

T = q (α, c, n-c) √CME

r

✓ Criterio de Tukey para comparaciones por pares:

✓ Valores Críticos para q con α =0.05, donde se desea el valor para q (0.05, 4, 24) =3.90.

Entonces: T=3.90√0.236

7

T= 0.716

Ahora comparamos con la diferencia absoluta entre cada par de medias muestrales.

Cuadro:

_ _

|x1 –x2| = |4.87 -2.29| = 2.58 >0.716*

_ _

|x1 –x3| = |4.87 -4.31| = 0.56 0.716*

_ _

|x2 –x3| = |2.29 -4.31| = 2.02 >0.716*

_ _

|x2 –x4| = |2.29 -1.46| = 0.83 >0.716*

_ _

|x3 –x4| = |4.31 -1.46| = 2.85 >0.716*

Ahora comparamos los valores absolutos de cada diferencia entre los pares de medias muéstrales con T = 0.716

✓ Conclusión: se puede estar seguro en 95% que solo las sucursales 1 y3 tienen igual nivel promedio de depósitos. Todas las otras diferencias exceden el criterio T.

LA GRAFICA UTILIZADA ES:

✓ Cuadro:( subrayado común)

_ _ _ _

X4 X2 X3 X1

1.46 2.29 4.31 4.87

En el cual las líneas que conectan las medias, muestran que estas no difieren significativamente. Las medias muéstrales primero deben ponerse en una serie ordenada, generalmente del más bajo al mas alto. Debido a que sólo las sucursales 1 y 3 no difieran significativamente, son las únicas que están conectadas por un subrayado común.

CONCLUSIÓN

-----------------------

F = CMTR

CME

CME=SCE

n-c

~ð†ð¹ð¾ðóðøð-ñ2ñgñlñ¡ñ¦ñÛñàñçñ