Estadistica. Análisis de la variable
Enviado por Juan Jiménez Díaz • 24 de Noviembre de 2021 • Apuntes • 1.838 Palabras (8 Páginas) • 183 Visitas
ESTADISTICA II
TRABAJO 1.
AUTOR(ES):
JUAN PABLO JIMÉNEZ DÍAZ
ADRIAN YULIANO PERNETT CABALLERO
CAMILO JOSE PATERNINA PERTRUZ
JUAN DIEGO LÓPEZ PETRO
DIRECTOR:
JORGE ALBERTO BARÓN CÁRDENAS
UNIVERSIDAD DE CÓRDOBA
DEPARTAMENTO DE INGENIERÍA DE SISTEMAS Y TELECOMUNICACIONES
FACULTAD DE INGENIERÍA
INGENIERÍA DE SISTEMAS
MONTERÍA, CÓRDOBA
21 de noviembre de 2021
- INTRODUCCIÓN.
Inicialmente, instalaremos la librería “MASS”, de R, que nos da acceso a un grupo amplio de bases de datos que nos ayudaran a revisar y analizar, La base de datos Pima.te, está base de datos posee la información de 332 mujeres indígenas que vivían cerca de Phoenix, Arizona. Los datos fueron recopilados por el Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales de los Estados Unidos. Usamos los 532 registros completos después de eliminar los datos (principalmente faltantes) sobre la insulina sérica. El conjunto de entrenamiento Pima.tr contiene un conjunto seleccionado al azar de 200 sujetos, y Pima.te contiene los 332 sujetos restantes.
OBJETIVOS.
- En primera parte, el objetivo de este informe es realizar un análisis descriptivo de cada una de las variables proporcionadas por la base de datos Pima.te que se encuentra en la librería “MASS” de R, teniendo en cuenta que esta información corresponde a una muestra aleatoria de la población de mujeres indígenas.
- En segunda instancia, se pretende construir intervalos de confianza y demás parámetros para las variables que a continuación serán descritas
- Las variables medidas por el Instituto Nacional de Diabetes y Enfermedades Digestivas y Renales de Estados Unidos son:
- npreg: número de embarazos.
- glu: concentración plasmática de glucosa en una prueba oral de tolerancia a la glucosa.
- pb: presión arterial diastólica.
- skin: espesor del pliegue de piel en el tríceps.
- bmi: índice de masa corporal.
- age: edad en años.
- type: sí o No, para diabéticos según criterios de la OMS.
METODOLOGÍA.
A partir de las clases síncronas, libros y videos referentes a la temática de estudio, se dispuso a realizar un análisis descriptivo sobre las variables a tratar y sus respectivos diagramas o gráficas para la mejor ilustración de los datos obtenidos a través de la base de datos
RESULTADOS.
Teniendo en cuenta los objetivos anteriormente mencionados, se procede primeramente a presentar la forma en como fue importada la base de datos para posteriormente trabajar con los resultados que se nos son proporcionados para dar pie a los análisis de las variables.
Importando la base de datos
[pic 1]
Respectivo análisis descriptivo y gráficas de las variables
Analizando la variable npreg
La codificación que se utilizo para poder analizar npreg fue:[pic 2]
A partir de estos datos podemos dar pie a la realización del diagrama de las mujeres y el número de embarazos.
[pic 3]
Diagrama correspondiente:
[pic 4]
Análisis descriptivo de la variable npreg (número de embarazos)
[pic 5]
Analizando los datos obtenidos y observando la gráfica podemos decir que el valor mínimo de mujeres embarazadas fueron 49 teniendo una media de 2. Asimismo, el punto máximo de embarazos es de 17 siendo una (1) sola mujer la que llegó a este valor.
Analizando la variable glu
La codificación que se utilizó para poder analizar glu fue:
[pic 6]
A partir de estos datos podemos dar pie a la realización del diagrama de concentración plasmática de glucosa en una prueba oral de tolerancia a la glucosa. Los siguientes datos serán representados en una gráfica.
[pic 7]
Diagrama correspondiente:
[pic 8]
Análisis descriptivo de la variable glu (concentración plasmática de glucosa en una prueba oral de tolerancia a la glucosa)
[pic 9]
Analizando los datos obtenidos y observando la gráfica podemos decir que el valor mínimo concentración plasmática de glucosa en una prueba oral de tolerancia a la glucosa (glu) fue de 65 con una sola (1) persona, teniendo una media de 112. Asimismo, el punto máximo de glu es de 197 siendo 2 personas las que llegaron a este valor.
Analizando la variable bp
La codificación que se utilizó para poder analizar bp fue:
table(tabla_datos$bp)
plot(table(tabla_datos$bp), main="Gráfica", ylab ="Número de mujeres", xlab = " presión arterial diastólica ")
...