Realice un histograma y describa la información según la forma y la curtosis de los datos
Enviado por Pedro Zarate Ortiz • 1 de Julio de 2018 • Apuntes • 2.048 Palabras (9 Páginas) • 1.118 Visitas
Parte 1
Tamaño de muestra
Utilizando la variable edad (P6040), realice lo siguiente:
- Realice un histograma y describa la información según la forma y la curtosis de los datos.
[pic 1]
Ahora veamos la medida de forma la curtosis (o apuntamiento) la cual mide cuan escarpada o achatada esta una curva o distribución.
El coeficiente de curtosis viene dado por la siguiente ecuación:
Curtosis=[pic 2]
Siendo
=la media [pic 3]
S=desviación típica
La curva se puede clasificar en 3 grupos según el signo de la curtosis, es decir según el signo de la distribución.
- Leptocurtica: la curtosis>o. los datos están muy concentrados en la media siendo una curva muy apuntada
- Mesocurtica: : la curtosis=0 la distribución es normal
- platicurtica: la curtosis
Del resumen de los datos se tienen que
Media = 30,525 Desviación Estándar = 19,6759
Luego Curtosis= = - 0.749137[pic 4]
Luego respecto a la información de los datos (edad “p6040”) Según la forma la curtosis es platicurtica muy poca concentración de datos en la media presentando una forma muy hachada. Es decir el valor de curtosis no se encuentra dentro del rango esperado para datos provenientes de una distribución normal.
- Realice una descripción numérica y descripción como es la población.
La población consta de 31 variables las cuales están clasificadas como numéricas y categóricas dichas variables están clasificados como directorios, secuencias orden, hogar, Registro p6016, p6020 edad p6040, clase, mes Dpto. Entre otras, algunas variables tienen un tamaño de 320 datos
- Calcule una nueva variable que sea el [pic 5]
A partir de la variable vamos a generar una nueva variable la cual seria [pic 6][pic 7]
[pic 8]
- Teniendo en cuenta la variable anterior realice el cálculo del tamaño de muestra, utilizando la siguiente fórmula:
[pic 9]
Donde, se tiene lo siguiente:
Z: Es el cuantil de la distribución normal estándar al nivel de significancia que se establezca.
S: Es la desviación estándar de la variable.
[pic 10]Es el margen de error absoluto.
Para calcular el tamaño de la muestra, utilice un nivel de confianza del 95% y un margen de error de absoluto que no supere 0.5.
Del resumen de los datos anteriores se tiene:
µ=9.2162
S=4.4333
[pic 11]=0.5
N=320
Con un nivel de confianza del 95% es decir α=0.05 entonces el cuantil de la distribución normal estándar seria == 1.96[pic 12][pic 13]
Así reemplazando en la ecuación anterior se tiene:
= ==302.01302 es decir[pic 14][pic 15][pic 16][pic 17]
[pic 18]
- Teniendo en cuenta los resultados anteriores, realice una selección de elementos para una muestra, utilizando el algoritmo del coordinado negativo.
Veamos la implementación del algoritmo del coordinado negativo. Para realizar una selección de elemento para una muestra.
Así para extraer la muestra de tamaño n de un universo de N objetos.
Generar N realizaciones de una variable aleatoria (k U) con distribución uniforme (0,1).[pic 19][pic 20]
Asignar al elemento k-´esimo de la población.[pic 21]
[pic 22] [pic 23]
Ordenar la lista de elementos descendente (o ascendentemente) con respecto a este número aleatorio .[pic 24]
[pic 25] [pic 26]
A continuación, seleccionar los n primeros (o los n últimos) elementos. Esta selección corresponde a la muestra realizada.
En este caso note que
[pic 27]
[pic 28] [pic 29]
Intervalo de confianza para dos variables numéricas
Un investigador, cree determinar que existen diferencias entre los niveles de estudio de los hombres y las mujeres en Colombia. Para determinar lo anterior, se sugiere utilizar la base de la hoja “muestra” y realizar lo siguiente:
- Utilizando la variable escolaridad (ESC) y sexo (P6020), realice un histograma para los hombres y mujeres. Según los resultados, ¿Existen diferencias?
[pic 30]
(Grafico # 1)
Del gráfico de frecuencia anterior se tiene existen mucha diferencia en cuanto a la comparación entre las variables escolaridad (ESC) y sexo (P6020) hombres y mujeres, es decir el nivel de escolaridad en mujeres se encuentra entre 0 a 19 mientras que en los hombres de 0 a 20, también se puede ver que 30 mujeres se encuentran en un nivel de escolaridad 10, y 17 mujeres tienen nivel de escolaridad 0 del total que son 157. Por otro lado, se puede ver que hay 27 hombres con un nivel de escolaridad 5 y 24 hombres con nivel de escolaridad 1, del total que son 207 mujeres.
- Teniendo en cuenta lo anterior, realice un estudio descriptivo de ambas variables. Realice lectura de resultados.
Veamos un estudio descriptivo de las variables anteriores escolaridad (ESC) y sexo (P6020)
En cuanto a la escolaridad (ESC) para el sexo masculino estas variables constan de 157 hombres la consta un nivel de escolaridad de (0 a 20) puede observarse que en esa columna hay unas casillas en NA
Veamos la lectura de datos:
[pic 31]
[pic 32]
En cuanto a la escolaridad (ESC) para el sexo femenino estas variables constan de 207 mujeres con niveles de escolaridad de (0 a 19) puede observarse que en esa columna hay unas casillas en NA
...