Control 2 laboratorio R, Inferencia Estadística
Enviado por josefinaortiz30 • 3 de Septiembre de 2018 • Trabajo • 1.139 Palabras (5 Páginas) • 179 Visitas
Control 2 laboratorio R, Inferencia Estadística
1) Para analizar los datos en este caso ocupamos el comando summary del total de datos lo que nos arrojó en las variables cuantitativas el primer y tercer quintil, la mediana, la media, el mínimo y el máximo. Y en las variables cualitativas nos mostró la cantidad, por ejemplo con la variable “zona” la cantidad de personas que viven en zonas rurales y urbanas. Ahora las veremos una a una:
- Comuna: En este caso queremos saber la cantidad de personas que hay por comuna, para esto realizamos el comando “table(comuna)” para saber la cantidad de personas por comuna y vemos que las personas no tiene un inclinación por vivir en una sino que están distribuidas en cantidades muy similares menos en la “comuna 1” que está por debajo del resto. Luego ocupamos el gráfico “barplot” que es un diagrama de barras para las variables cualitativas, para una mejor forma de representar la distribución por comuna y podemos afirmar nuevamente que no hay mucha inclinación hacia una comuna en preferencia sobre otras.
1 | 2 | 3 | 4 | 5 | 6 |
591 | 837 | 849 | 713 | 823 | 812 |
[pic 1]
b) Zona: como es una variable cualitativa, ocupamos el diagrama de tablas de barplot para representar la cantidad de personas que viven en zonas rurales versus zonas urbanas, y nos damos cuenta que la cantidad de personas que viven en zonas urbanas están muy por sobre las personas que viven en zonas rurales.
Rural | Urbana |
38 | 4587 |
[pic 2]
c) Sexo: También es una variable cualitativa, y usando el gráfico de la “torta” podemos ver que sexo es el que predomina en cantidad en esta muestra de la casen.
Hombre | Mujer |
2227 | 2398 |
[pic 3]
Entonces como podemos ver en la tabla y el gráfico podemos decir que en la muestra, las mujeres y hombres serían relativamente iguales en número con una leve inclinación hacia el sexo femenino.
d) Edad: es una variable continua y para esto ocupamos el gráfico de histograma y el gráfico del “cajón con bigotes” para que representar bien la cantidad de personas que hay por edad aproximadamente, vemos que las edades están entre los 0 y 100 años. El promedio de edad es de 43,43 años y la mayoría de las personas de la muestra se encuentran entre los 28 y 56 años.
min | 1er Qu. | median | mean | 3rd Qu. | Max |
0 | 28 | 43 | 43.43 | 56 | 100 |
[pic 4]
e) Estado Civil: también es una variable cualitativa, en la que queremos saber la cantidad de personas que hay según su estado civil ya sea soltero, casado, viudo, anulado, conviviente, divorciado o separado. Podríamos representarla con barplot al igual que lo hemos hecho en las anteriores variables de este tipo, pero nos damos cuenta que no nos arroja toda la información, entonces ocupamos la “torta” para así saber la cantidad de personas según estado civil y además comparar entre ellos, de cuál hay más, menos, etc. Nos damos cuenta que la mayoría son casados y solteros y la minoría están en condición de divorciados y anulados.
Anulado | Casado | Conviviente | Divorciado | Separado | Soltero | Viudo |
11 | 1716 | 638 | 65 | 357 | 1577 | 261 |
[pic 5]
f) Ingreso: al ser una variable continua, ocupamos el histograma y el boxplot, para saber la dispersión del ingreso. Con el resumen de la variable, nos damos cuenta que la mayoría de las personas de esta encuesta tienen un ingreso entre $157.800 y $582.500 y que los ingresos van desde un monto de $1.352 a $2.326.000 con una desviación estándar de $456.846.3 . Viendo los gráficos queda muy claro que las personas que ganan más de 500.000 aproximadamente son muy pocas y este número va descendiendo a medida que avanzamos en los montos mayores.
...