Para hacer una prueba de hipótesis en Excel, hay que seguir los pasos vistos en la clase de teoría, vamos a usar una base de datos específica para dar respuesta al siguiente problema.
Ejemplo 1
400 personas que entrenan en un gimnasio, que por primera vez se inscriben para realizar una actividad física orientada a objetivos, con edades entre los 19 y 33 años participaron en una encuesta que busca determinar relacionar el sueño, el entrenamiento deportivo y su personalidad. Para ello, brindaron información sociodemográfica, información médica y contestaron, a nivel general tres pruebas: CSD (Cuestionario de sueño del deportista), Cuestionario Diurnidad-Nocturnidad de Östeberg y EPQ-A (por sus siglas en francés, su traducción es Cuestionario de la personalidad de Eysenck). Además, a las personas que manifestaron en su inscripción presentar dolor lumbar se les aplicó la prueba ODI (por sus siglas en inglés, su traducción sería Índice de Discapacidad de Owstry).
El director afirma que la población que ingresa al gimnasio por primera vez, tiene por lo menos 1,2 kg de masa-grasa teórica en exceso, con una desviación de 0.4 kg. ¿La información de los 400 inscritos permite afirmar ese promedio con un nivel de significancia del 5%?
Paso 1: Planteamiento de hipótesis.
Se plantean las hipótesis nula y alternativa, la primera corresponde a la aseveración que hace el director y la segunda correspondería al resultado opuesto.
[pic 42] [pic 43]
Paso 2: Nivel de significancia
Identificar el nivel de significancia
[pic 44]
Paso 3: Calculo del estadístico de prueba.
Calcular el estadístico de prueba. Para ello necesitamos primero calcular el promedio y la desviación estándar de la muestra. Recordando lo visto en primer corte, debemos usar la fórmula =PROMEDIO(Datos). [pic 45]
Este resultado sería 1,24. Con esta información vamos a calcular el estadístico de prueba usando la fórmula NORMALIZACIÓN. La vamos a aplicar de igual manera que en el laboratorio de distribución normal teniendo en cuenta que por el teorema del límite central, la desviación va a corresponder a la desviación poblacional dividido entre la raíz cuadrada del número de datos.
[pic 46]
Paso 4: Establecer la región de rechazo y no rechazo de Ho.
Nuestro estadístico de prueba sería exactamente 2. Para calcular el valor crítico vamos a usar la función =INV.NORM.ESTAND(probabilidad), es importante recordar el valor que debemos escribir en esta casilla, sí la prueba de hipótesis se hace con una región de rechazo a la izquierda, debemos escribir el nivel de significancia en el valor de la probabilidad. Si la región de rechazo estuviera a la derecha, debemos colocar uno menos el nivel de significancia. Para nuestro caso, escribimos el nivel de significancia directamente.
[pic 47]
Para el cálculo del valor crítico a dos colas vamos a ingresar la mitad del nivel de significancia teniendo en cuenta que el valor arrojado es el límite inferior, y el límite superior de forma automática será la misma cantidad pero positiva.
[pic 48]
Paso 5: Rechazo o no rechazo de Ho
Con el valor crítico de una cola podemos dar respuesta a nuestro problema, debido a que nuestra prueba es con una cola a la izquierda y el estadístico de prueba (2) es MAYOR al valor crítico, NO RECHAZAMOS la hipótesis nula, es decir, NO HAY EVIDENCIA ESTADÍSTICA QUE PERMITA RECHAZAR LA HIPÓTESIS QUE LAS PERSONAS QUE SE ACERCAN AL GIMNASIO TIENEN, POR LO MENOS, 1.2 KG DE PESO.
Pruebas de Hipótesis para la media con varianza desconocida:
Estructura de la prueba de hipótesis: La estructura de la prueba de hipótesis para cuando se desconoce la varianza es igual a la prueba de hipótesis para conociendo (en cuanto a los pasos del procedimiento).[pic 49][pic 50][pic 51] A continuación, se muestran los posibles casos que se pueden presentar: Caso 1 | Caso 2 | Caso 3 | 1. Establecer las hipótesis [pic 52] [pic 53] |
[pic 54] [pic 55] |
[pic 56] [pic 57] | 2. Nivel de significancia ()[pic 58] | Nivel de significancia ()[pic 59] | Nivel de significancia ()[pic 60] | 3. Estadístico de prueba (t calculado): [pic 61][pic 62] |
[pic 63] |
[pic 64] | 4. Región de rechazo: [pic 65][pic 66][pic 67][pic 68][pic 69][pic 70][pic 71] |
[pic 72][pic 73][pic 74][pic 75][pic 76] | [pic 77][pic 78][pic 79][pic 80][pic 81] | 5. Decisión: Se rechaza si [pic 82][pic 83] |
Se rechaza si [pic 84][pic 85] |
Se rechaza si [pic 86][pic 87] | 6. Conclusión | Conclusión | Conclusión |
Ejemplo 2
Para el caso del Gimnasio del Ejemplo 1 ahora , el director estima que, en el caso de los suscriptores con 3 hijos, el tiempo promedio de dedicación se encuentra en 1 hora y 20 minutos. Usando la información de la base de datos, realice una prueba de hipótesis para la media, con un nivel de significancia del 5%.
Del enunciado del problema tenemos que la varianza poblacional es desconocida, por lo cual, no es posible usar la distribución normal para esta prueba. Así que debemos obtener, de la base de datos, el tamaño de la muestra, la desviación estándar y la media muestral. Vamos a generar una tabla dinámica para adquirir dichos valores.
Vamos a seleccionar la variable # de hijos y la ubicamos en la casilla de filas. Luego, seleccionamos la variable tiempo de ejercicio y la dejamos ubicada en la casilla de valores. Finalmente, vamos a ubicar dos veces más la variable tiempo en la casilla de valores pero, como solo se puede seleccionar una vez, las otras dos veces se deben arrastrar. La tabla debería quedar como se muestra a continuación.
[pic 88] Ahora, en las casillas de valores, en cada variable vamos a habilitar la opción de configuración del campo de valores usando el botón derecho del ratón. Para la primera variable, vamos a cambiarla de SUMA a PROMEDIO.
[pic 89] Para la segunda variable en valores vamos a configurarla con DESVEST y la tercera con RECUENTO. La tabla debe quedar así:
[pic 90] Como ya contamos con toda la información para realizar la prueba de hipótesis, vamos a proceder a organizar la información, calcular el estadístico de prueba y el valor crítico.
Paso 1: Planteamiento de hipótesis.
Se plantean las hipótesis nula y alternativa, la primera corresponde a la aseveración que hace el director y la segunda correspondería al resultado opuesto.
[pic 91] [pic 92]
Paso 2: Nivel de significancia
Identificar el nivel de significancia
[pic 93]
Paso 3: Calculo del estadístico de prueba.
Recordemos que, en el cálculo del estadístico cambiamos la desviación poblacional (que es desconocida) por la muestral (que obtuvimos de los datos). Nuevamente, usamos la fórmula de normalización.
[pic 94]
Paso 4: Establecer la región de rechazo y no rechazo de Ho.
Para calcular el valor crítico vamos a usar la función =INV.T(probabilidad, grados_de_libertad), es importante recordar el valor que debemos escribir en esta casilla, sí la prueba de hipótesis se hace con una región de rechazo a la izquierda, debemos escribir el nivel de significancia en el valor de la probabilidad. Si la región de rechazo estuviera a la derecha, debemos colocar uno menos el nivel de significancia. Además, si la prueba es a dos colas, la probabilidad debe ser dividida entre 2.
[pic 95]
Paso 5: Rechazo o no rechazo de Ho
Con el valor crítico para una prueba bilateral podemos dar respuesta a nuestro problema, debido a que nuestro estadístico de prueba (0,755) NO ES MAYOR que el valor crítico (1,99), NO HAY EVIDENCIA ESTADÍSTICA QUE PERMITA RECHAZAR LA HIPÓTESIS QUE EL PROMEDIO DE TIEMPO DEDICADO POR LAS PERSONAS CON 3 HIJOS ES DIFERENTE DE 80 MINUTOS, LUEGO, PODEMOS ASUMIR QUE SÍ ES IGUAL A 80.
Pruebas de Hipótesis para la proporción muestral:
PASOS PARA UNA PRUEBA DE HIPÓTESIS PARA PROPORCIONES Caso 1 | Caso 2 | Caso 3 | 1. Establecer las hipótesis [pic 96] [pic 97] |
[pic 98] [pic 99] |
[pic 100] [pic 101] | 2. Nivel de significancia ()[pic 102] | Nivel de significancia ()[pic 103] | Nivel de significancia ()[pic 104] | 3. Estadístico de prueba (Z calculado): [pic 105][pic 106] |
[pic 107][pic 108] |
[pic 109][pic 110] | 4. Región de rechazo:[pic 111] [pic 112][pic 113][pic 114][pic 115][pic 116][pic 117] | [pic 118] [pic 119][pic 120][pic 121][pic 122] | [pic 123][pic 124][pic 125][pic 126][pic 127] | 5. Decisión: Se rechaza si [pic 128][pic 129] |
Se rechaza si [pic 130][pic 131] |
Se rechaza si [pic 132][pic 133] | 6. Conclusión | Conclusión | Conclusión |
Ejemplo 3
Para el caso del Gimnasio del Ejemplo 1 ahora, el equipo médico que acompaña el trabajo en el gimnasio revisó los resultados de la prueba CSD y les sorprendió que, en la pregunta número 8 en la cual se indaga sobre si ha asistido al médico por problemas de sueño, más del 15% registra un puntaje superior a 2. Sin embargo, ellos consideran que es importante analizarlo según el área de trabajo. Usando un nivel de significancia del 2%, ¿es posible no afirmar este porcentaje en alguna de las áreas?
DESARROLLO: En esta ocasión, toda la información se encuentra en términos porcentuales por lo cual estamos trabajando sobre una estimación de la proporción de la población. Para esta prueba necesitamos la proporción de la muestra en cada área de trabajo, que obtuvo un puntaje de 3 o superior, por lo cual vamos a recurrir a la tabla dinámica.
Vamos a seleccionar la variable CSD 8 y la ubicamos en la casilla de filas. Luego, vamos a ubicar la variable ÁREA DE TRABAJO en columnas, esto para generar una tabla cruzada. Finalmente, ubicamos una tercera variable, preferiblemente no numérica, usaremos GÉNERO en la casilla valores como se muestra a continuación
Vamos a agrupar los resultados de los puntajes de 0 a 2 y de 3 a 7. Vamos a seleccionar los valores de 0 a 2, y usando el botón derecho del ratón usaremos la opción AGRUPAR.
[pic 136]
Hacemos lo mismo para el caso de 3 a 7.
[pic 137]
Ahora, vamos a encoger los grupos para que quede más simplificado. Esto lo logramos dando click en el símbolo – que aparece junto al nombre del grupo.
[pic 138][pic 139]
Con los grupos formados ya podemos estimar las proporciones para cada área.
Ciencias básicas. | [pic 140] | Ciencias de la salud. | [pic 141] | Ciencias humanas. | [pic 142] | Ciencias políticas y económicas. | [pic 143] | Ingeniería. | [pic 144] |
De acuerdo lo propuesto, el único programa para el cual la afirmación podría llegar a ser falsa sería en el caso de ciencias políticas y económicas. Así, solamente revisaremos ese caso particular. Como ya contamos con toda la información para realizar la prueba de hipótesis, vamos a organizar la información, calcular el estadístico de prueba y el valor crítico.
Paso 1: Planteamiento de hipótesis.
Se plantean las hipótesis nula y alternativa, la primera corresponde a la aseveración que hace el equipo médico y la segunda correspondería al resultado opuesto.
[pic 145] [pic 146]
Paso 2: Nivel de significancia
Identificar el nivel de significancia
[pic 147]
Paso 3: Calculo del estadístico de prueba.
En este caso suponemos que la distribución está asociada a una binomial, por lo cual, el estadístico de prueba se calcula usando la fórmula de la desviación estándar.
[pic 148]
Paso 4: Establecer la región de rechazo y no rechazo de Ho.
Para calcular el valor crítico vamos a usar la función =INV.NORM. ESTAND (probabilidad), es importante recordar el valor que debemos escribir en esta casilla, sí la prueba de hipótesis se hace con una región de rechazo a la izquierda, debemos escribir el nivel de significancia en el valor de la probabilidad. Si la región de rechazo estuviera a la derecha, debemos colocar uno menos el nivel de significancia. Además, si la prueba es a dos colas, la probabilidad debe ser dividida entre 2.
[pic 149] Paso 5: Rechazo o no rechazo de Ho
Con el valor crítico para una prueba unilateral podemos dar respuesta a nuestro problema, debido a que nuestro estadístico de prueba (-0,313) NO ES MENOR que el valor crítico (-2,95), no hay evidencia estadística que permita rechazar la hipótesis que por lo menos el 15% de la población en el área de ciencias políticas y humanas, alcanzaron un puntaje superior a 2 en la pregunta 8 del cuestionario del sueño
|