Prueba T para muestras independientes
Enviado por Francisco Salas • 19 de Mayo de 2020 • Documentos de Investigación • 3.357 Palabras (14 Páginas) • 327 Visitas
Prueba T para muestras independientes
El procedimiento Prueba T para muestras independientes compara las medias de dos grupos de casos. Lo ideal es que para esta prueba los sujetos se asignen aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores. Este caso no ocurre si se comparan los ingresos medios para hombres y mujeres. El sexo de una persona no se asigna aleatoriamente. En estas situaciones, debe asegurarse de que las diferencias en otros factores no enmascaren o resalten una diferencia significativa entre las medias. Las diferencias de ingresos medios pueden estar sometidas a la influencia de factores como los estudios (y no solamente el sexo).
Ejemplo. Se asigna aleatoriamente un grupo de pacientes con hipertensión arterial a un grupo con placebo y otro con tratamiento. Los sujetos con placebo reciben una pastilla inactiva y los sujetos con tratamiento reciben un nuevo medicamento del cual se espera que reduzca la tensión arterial. Después de tratar a los sujetos durante dos meses, se utiliza la prueba t para dos muestras para comparar la tensión arterial media del grupo con placebo y del grupo con tratamiento. Cada paciente se mide una sola vez y pertenece a un solo grupo.
Estadísticos. Para cada variable: tamaño de la muestra, media, desviación estándar y error estándar de la media. Para la diferencia entre las medias: media, error estándar e intervalo de confianza (puede especificar el nivel de confianza). Pruebas: prueba de Levene sobre la igualdad de varianzas y pruebas t de varianzas combinadas y separadas sobre la igualdad de las medias.
Prueba T para muestras independientes: Consideraciones sobre los datos
Datos. Los valores de la variable cuantitativa de interés se hallan en una única columna del archivo de datos. El procedimiento utiliza una variable de agrupación con dos valores para separar los casos en dos grupos. La variable de agrupación puede ser numérica (valores como 1 y 2, o 6,25 y 12,5) o de cadena corta (como sí y no). También puede usar una variable cuantitativa, como la edad, para dividir los casos en dos grupos especificando un punto de corte (el punto de corte 21 divide la edad en un grupo de menos de 21 años y otro de más de 21).
Supuestos. Para la prueba t de igualdad de varianzas, las observaciones deben ser muestras aleatorias independientes de distribuciones normales con la misma varianza de población. Para la prueba t de varianzas desiguales, las observaciones deben ser muestras aleatorias independientes de distribuciones normales. La prueba t para dos muestras es bastante robusta a las desviaciones de la normalidad. Al contrastar las distribuciones gráficamente, compruebe que son simétricas y que no contienen valores atípicos.
Para obtener una prueba T para muestras independientes
Esta característica requiere la edición Base de Statistics.
- Elija en los menús:
Analizar > Comparar medias > Prueba T para muestras independientes...
- Seleccione una o más variables de contraste cuantitativas. Se calcula una prueba t para cada variable.
- Seleccione una sola variable de agrupación y pulse en Definir grupos para especificar dos códigos para los grupos que desee comparar.
- Si lo desea, puede pulsar en Opciones para controlar el tratamiento de los datos perdidos y el nivel del intervalo de confianza.
Este procedimiento pega la sintaxis de comandos T-TEST.
DISTRIBUCION "F" FISHER
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se desea comparar la precisión de un instrumento de medición con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, [pic 1] y [pic 2], utilizando la razón de las varianzas muestrales s21/s22. Si s21/s22 es casi igual a 1, se tendrá poca evidencia para indicar que [pic 3] y [pic 4] no son iguales. Por otra parte, un valor muy grande o muy pequeño para s21/s22, proporcionará evidencia de una diferencia en las varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independientes, cada una dividida entre sus respectivos grados de libertad. Esto es,
[pic 5]
donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad [pic 6]1€y€[pic 7]2 respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribución ji cuadradas con [pic 8] grados de libertad, respectivamente. Entonces la distribución de la variable aleatoria [pic 9] está dada por:
[pic 10]
[pic 11]
y se dice que sigue la distribución F con [pic 12]€grados de libertad en el numerador y [pic 13]€grados de libertad en el denominador.
La media y la varianza de la distribución F son:
[pic 14] para [pic 15]
[pic 16]€para [pic 17]
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la derecha. La distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parámetros [pic 18]proporcionan una flexibilidad adicional con respecto a la forma de la distribución.
Si s12 y s22 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de poblaciones normales con varianzas [pic 19]12 y [pic 20]22, respectivamente, entonces:
...