Hipotesis
joselacuta2325 de Enero de 2015
3.461 Palabras (14 Páginas)261 Visitas
Supongamos que en una muestra las colegiaturas de los estudiantes universitarios entrevistados son las siguientes:
2821 3102 2398 2511 3222
2329 3109 2725 3627 2933
3822 3044 3125 2650 2741
3054 3281 2292 2952 2462
La media y la desviación estándar de la muestra son 2910 y 411.95 respectivamente, se procede enseguida a calcular el error estándar y la t*
Paso 4. Tomar decisión y conclusión
Una regla de decisión es establecer las condiciones sobre las cuales la hipótesis nula es rechazada o no rechazada. Si el estadístico de prueba queda dentro de la zona crítica la hipótesis nula deberá ser rechazada. Si el estadístico de prueba queda fuera de la zona crítica la hipótesis nula no deberá ser rechazada.
En el ejemplo de las colegiaturas, como el estadístico de prueba quedó fuera de la zona crítica la hipótesis nula no puede ser rechazada. La conclusión podría ser la siguiente:
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
Sin embargo en la clase se presentó otra forma de tomar la conclusión usando el valor p o p value. En este ejemplo se trata de una hipótesis bilateral y el valor de referencia es alfa = 0.05. A partir del resultado del estadístico de prueba t = -0.097 (menos cero punto noventa y siete) se obtiene en R el p value correspondiente con la instrucción pt(-0.097,19) de donde resulta un p value de 0.4618711 (observe que esta es un area bajo la curva hacia la derecha)
Dado que le valor p es mayor que el valor de referencia, entonces se dice que no existe evidencia para rechazar la Hipótesis nula. Es decir que
“No hay evidencia suficiente para afirmar que la colegiatura que pagan en promedio los estudiantes universitarios es diferente de 3000 pesos, en un nivel de significancia de .05”
Prueba de hipótesis relativas a dos medias
El siguiente ejemplo nos muestra el procedimiento de prueba de hipótesis relativas a la media de dos poblaciones.
Ejemplo
Se realizó un estudio con un nivel de significancia de .05 para investigar si el número de u.e.a´s que se dan de baja en la quinta semana es diferente entre los estudiantes de ingeniería de la UAM iztapalapa y los estudiantes de ingeniería de la UAM Azcapotzalco. Se obtuvieron dos muestras representativas de 40 estudiantes. La muestra 1 (UAM I) tuvo un puntaje medio de 3.5 (es decir dan de baja en promedio 3.5 u.e.a´s) con una desviación estándar de 2, mientras que la muestra 2 (UAM A) tuvo una media de 3 con una desviación de 2.2.
1.- Establecer las hipótesis
Ho: µ1 ≤ µ2
Ho: « El número de u.e.aás que dan de baja no es mayor en la UAM I que en la UAM A »
Ha: µ1 > µ2
Ha: « El número de u.e.a´s que dan de baja en la UAM I es mayor que en la UAM A ».
2.- Establecer el criterio de ecisión o contraste
Como en este problema, la hipótesis alternativa o alterna contiene el signo (>) el problema es de una cola, es decir, la región crítica se ubica en el extremo derecho de la curva. Para determinar que tipo de distribución se utilizará primero deberiamos estudiar si la muestra es pequeña o grande, vamos a suponer que 30 es el limite:
• Si n1 + n2 - 2 > 30 entonces se busca en la tabla el valor de z correspondiente a α/2.
• Si n1 + n2 - 2 ≤ 30 se busca en la tabla el valor t correspondiente a Φ = n1+n2-2 y a α/2.
En este ejemplo, Φ = n1 + n2 - 2 = 40 + 40 - 2 = 78 entonces Φ > 30 y por lo tanto se utiliza la distribución normal con α = .05
El valor .05 no está en la tabla, pero debería encontrarse entre estas dos cantidades
Z 4 ? 5
1.6 .05050 .05 .04947
Se procede entonces con un procedimiento llamado interpolación, identificando la primera z como z1 y la segunda como z2. Las áreas como A1 y A2 respectivamente.
Z1 Z Z2
Z 4 ? 5
1.6 .05050 .05 .04947
Α1 A Α2
Luego se aplica la fórmula de interpolación:
Z= Z1 + ( Z2 – Z1) (A1 - A) = 1.64 + (1.65 -1.64) (.05050-.05) = 1.6448
(A1 – A2) (.05050-.04947)
Pero usted tiene suerte pues con R puede obtener el valor exacto con la instrucción qnorm(0.05, lower.tail = F) ide donde resulta1.644854
3.- Calcular el valor del estadístico de prueba
En este ejemplo vamos a suponer que las varianzas de las dos poblaciones son iguales (aunque en el examen usted deberá probar si esta hipótesis es plausible o valida).
Entonces si esta hipótesis de igualdad de varianzas es válida, se calcula el error estándar de la diferencia de las medias
Se calcula el valor del estadístico de prueba, en este caso Z*
Usted tiene las formulas que quizas no corresponden a la anterior, pero puede verificar si dan resultados semejantes o no
4.- Tomar una decisión e interpretar
El estadístico de prueba queda localizado fuera de la zona crítica, entonces no podemos rechazar la hipótesis nula ( Ho), de tal suerte que se concluye lo siguiente:
No hay evidencia suficiente, con un nivel de significancia de .05, de que la prensa popular tenga una mayor orientación al tema sexual que la prensa de clase media
Pero pues a nosotros nos interesa aprender a tomar una decisión mediante el valor p o p value.
> pnorm(1.063, lower.tail = F)
[1] 0.1438910
Es decir el p value = 0.1438, como es de una cola se compara con 0.05 y como 0.1438n entonces No hay evidencia suficiente, con un nivel de significancia de .05, de que los estudiantes de la UAM I den de baj más u.e.aás que los estudiantes de la UAM A
Tambien podriamos presentar ejemplos sobre pruebas de hipótesis sobre varianzas, proporciones o radio de varianzas. Pero esto ye lo vimos en clase
Para el examen usted deberá entregar el lunes al inicio de la clase es decir a las 8:30 hrs
las soluciones a los siguientes problemas
Como en la sección anterior presentar con claridad cada paso y dar una explicación
Según el tipo de problema presentar la formula correspondiente, los resultados intermedios más importantes y el resultado finl del cálculo (usted puede usar una calculadora, las tablas o R) no deje nada suponiendo que yo lo se, no es mi examen es el suyo. Usted es responsable de comprobar y presentar claramente sus razonamientos.
Por supuesto usted deberá tomar sus decisiones usando los dos procedimientos de decisión, es decir comparando la estadística de prueba con los límites de la region crítica (una si es unilateral o dos si es bilateral) y usando el p value.
Problemas
1.- Una compañía de transportes desconfía de la afirmación de que la vida útil de ciertos neumáticos es al menos 28,000 km. Para verificar la afirmación se prueba una muestra de estas llantas en los camiones de la compañía, obteniéndose los siguientes resultados en miles de kilómetros:
25.6 27.1 31.1 26.5 26.5 28.3 29.4
27.4 29.7 29.5 27.7 27.1 31.2 29.5
27.3 25.8 26.5 27.3 31.2 28.0 26.0
29.6 26.4 26.4 25.8 27.5 27.9 26.9
23.4 28.0 29.0 28.8 27.3 27.5 27.8
a) ¿Es correcta la sospecha de la compañía de transportes en base a estos datos y a un nivel de significancia de .01 ?
b) ¿Cual sería la conclusión si el nivel de significancia fuera .05?
c) Se sospecha que la varianza poblacional es superior a 3,000 ¿es correcta esta sospecha a un nivel de significancia del 0.05 ?
d) Obtener el intervalo de confianza a un nivel del 95% para la varianza y el promedio de la vida útil a un nivel de significancia del 0.05.
e) Obtener el intervalo de confianza a un nivel del 95% para la proporción de pneumáticos inferior a 28,000 km.
2.- usted realiza un experimento con dos grupos de estudiantes. A un grupo le aplica un examen y no les permite usar formulario y al segundo grupo le aplica el mismo examen y les deja usar formulario. Los tiempos que tardan en responder el examen son los siguientes:
Grupo 1 Grupo 2
52 72 73 64 48 52 57 42 58 35 51 51 47 35
46 66 61 46 65 62 47 61 31 32 47 60 29 35
51 53 49 47 73 61 53 28 14 64 37 65 60 48
60 62 43 46 75 64 68 37 43 45 58 18 39 41
a) ¿Existe evidencia de que las desviaciones estándar de los tiempos entre los dos grupos sean diferentes a un nivel de 0.05?
b) ¿Existe evidencia suficiente de que el promedio de tiempo que tardan los estudiantes en resolver el examen es diferente entre los dos grupos con un nivel de significancia de .05 ?
c) ¿Existe evidencia suficiente de que el tiempo que tardan los estudiantes del primer grupo es mayor que el tiempo que tardan los del segundo grupo, con un nivel de significancia de .05 ?
d) ¿obtener el intervalo de confianza a un nivel del 95% para la diferencia de los promedios o medias poblacionales de ambos grupos y para el radio de varianzas? Que relación observa con los resultados de los incisos anteriores.
3.- La compañía “X” que fabrica lámparas incandescentes, asegura que su producto es superior al de su principal competidor, la compañía “Y”. En un estudio, en una muestra de 24 de las lámparas “X” y una muestra de 20 lámparas “Y” se obtuvieron las siguientes duraciones en horas:
Lámparas “X” Lámparas “Y”
643 636 630 645 630 624 611 655 630 639 622 688
667 626 635 652 622 629 665 696 665 573 639 585
624 662 633 645 691 690 641 673 649 597 629 648
...