Pruebas de Hipótesis y Bondad de Ajuste
Enviado por 2325050503 • 21 de Marzo de 2020 • Práctica o problema • 851 Palabras (4 Páginas) • 249 Visitas
Pruebas de Hipótesis y Bondad de Ajuste (10%) SEM. 02 – 2019
La base de datos con la que le corresponde trabajar se obtiene como una muestra aleatoria de una gran base de datos. La base original corresponde a los resultados obtenidos por los jóvenes de todo el país en las pruebas Saber 11, del año 2019. Dicha base contiene las variables: DEPARTAMENTO, MUNICIPIO, CALENDARIO, NATURALEZA, JORNADA, EVALUADO, PROMLECT (Promedio obtenido en Lectura Crítica), PROMMATE (Promedio obtenido en Matemáticas), PROMSOCIAL (Promedio obtenido en Ciencias Sociales y Ciudadanas), PROMCIENCIA (Promedio obtenido en Ciencias Naturales) y PROMINGLES (Promedio obtenido en Inglés). Solo se trabajará con los departamentos de Antioquia y Valle.
Cada pareja debe generar una base de datos, que corresponderá a una muestra de tamaño 120 de la base original. Los datos originales están en el archivo: “saber.txt”, el cual está disponible en Moodle. Para hacerlo debe seguir los siguientes pasos:
# Procedimiento para generar archivo de datos para el trabajo
# Primero leer el archivo de datos.
saber <- read.table(file.choose(), header=T, sep=”,”)
# Copiar el siguiente código en R sin modificar nada
gener <- function(cedula){
set.seed(cedula)
data <- saber[sample(1:2668,120),]
data
}
# Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente línea:
datos <- genera(cedula)
“cedula” representa el número de cedula de uno de los dos integrantes. En el trabajo debe indicar cuál número de cédula usó. Este debe escribirse en la parte superior izquierda.
En la parte superior derecha, el grupo al cual pertenecen los estudiantes. Se aclara que ambos estudiantes deben pertenecer al mismo grupo en el cual están matriculados.
En todos los casos, para realizar las pruebas de hipótesis sobre medias o varianzas, debe primero establecer si la respectiva muestra proviene de una distribución normal. En este punto debe plantear las Hipótesis correspondientes, el estadístico de prueba usado y la conclusión usando únicamente el Valor P.
Usando la base de datos generada, responda a las siguientes preguntas:
- ¿Puede afirmarse que el resultado medio obtenido en lectura Crítica es superior a 50? Justifique su respuesta.
H0: Promedio en lectura crítica tiene una distribución normal
Ha: Promedio en lectura crítica no se distribuye normalmente
[pic 1]
Como el valor P para el estadístico Shapiro-Wilk es 0.1303 > 0.05 no se rechaza H0, hay suficiente evidencia para sugerir que el promedio en lectura crítica se distribuye normalmente.
Planteamos una hipótesis para la prueba con µ igual al promedio en lectura critica promedio con =0.05, como n es relativamente grande y desconocemos entonces nuestro estadístico de prueba será:
H0: µ=50
Ha: µ>50
T. test para “PROMEDIO LECTURA CRÍTICA”
[pic 2]
Valor P= 0.6997
Como el valor P > =0.05 entonces no se rechaza H0, es decir, no hay suficiente evidencia para afirmar que el valor medio del promedio de lectura critica es mayor a 50.
- ¿Se puede afirmar que el resultado medio obtenido en Matemáticas es mayor en Antioquia que en el Valle? Justifique su respuesta.
X= resultado medio de matemáticas en Antioquia
Y= resultado medio de matemáticas en el Valle
Verificación de la distribución de ambas
Prueba Shapiro-Wilk variable Y:
[pic 3]
Valor P= 0.05252
Como el valor P para el estadístico Shapiro-Wilk es 0.05252 > 0.05 no se rechaza H0, hay suficiente evidencia para sugerir la variable Y se distribuye normalmente.
...