ESTADÍSTICA PARA INGENIERÍA 1ra Práctica
Enviado por AkiDLGC • 3 de Septiembre de 2022 • Resumen • 3.066 Palabras (13 Páginas) • 57 Visitas
[pic 1][pic 2]
[pic 3]
[pic 4]
[pic 5]
[pic 6]
[pic 7]
[pic 8]
PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ FACULTAD DE CIENCIAS E INGENIERÍA
ESTADÍSTICA PARA INGENIERÍA
1ra Práctica (tipo c) (Primer Semestre 2022)
Indicaciones Generales:
- Esta práctica debe ser desarrollada por un grupo de máximo 3 alumnos del mismo horario.
- Justifique claramente sus soluciones, presente los códigos y resultados obtenidos en R, interprete estos resultados y escriba respuestas completas teniendo en cuenta el contexto de los ejercicios propuestos; todo esto influirá en la calificación.
- La presentación, la ortografía y la gramática de los trabajos influirán en la calificación.
- La solución debe ser subida en único archivo PDF en la tarea PC1 de su correspondiente horario del curso. La primera hoja debe presentar el código PUCP, nombre completo y correo electrónico de todos los integrantes del grupo.
Puntaje debido al cuestionario: 20 puntos Puntaje total: 20 puntos[pic 9]
Cuestionario:
La base de datos ObesityDataSet_cleaned_and_data_sinthetic.csv contiene los datos de una muestra de personas de México, Perú y Colombia sobre su estilo de vida (Fuente: https://www.kaggle.com/datasets/mandysia/obesity-dataset-cleaned-and-data-sinthetic). Las variables medidas corresponden a información demográfica de las personas y sobre su estilo de vida.
Al leer este conjunto de datos mediante la función read.csv(), utilice el argumento stringsAsFactors = TRUE, de manera que las variables cualitativas sean leídas como factores. En este caso la sintaxis sería
datos=read.csv("ObesityDataSet_cleaned_and_data_sinthetic.csv",stringsAsFactors = TRUE)
Adicionalmente, ejecute el siguiente código para reordenar el nivel de algunos factores, de manera que se mantenga el orden correcto de las categorías en algunas de las variables ordinales.
d$NObeyesdad = factor(d$NObeyesdad,levels=levels(d$NObeyesdad)[c(1,2,6,7,3,4,5)]) d$FCVC = factor(d$FCVC,levels = levels(d$FCVC)[c(2,3,1)])
d$CH2O = factor(d$CH2O,levels=levels(d$CH2O)[c(2,1,3)]) d$CALC = factor(d$CALC,levels = levels(d$CALC)[c(3,4,2,1)]) d$CAEC = factor(d$CAEC,levels = levels(d$CAEC)[c(3,4,2,1)]) d$TUE = factor(d$TUE,levels = levels(d$TUE)[c(2,3,1)])
Pregunta 1 (2.0 puntos)
Se desea comparar gráficamente las distribuciones de frecuencias relativas de la variable número de comidas por día (NCP) entre el género (Gender). Obtenga también las tablas de distribución de frecuencias de esta variable por género. Interprete los resultados obtenidos.
library(DescTools)
library(EnvStats)
datos=read.csv("D:/ADAYANASCRIPTS/ObesityDataSet_cleaned_and_data_sinthetic.csv",stringsAsFactors = TRUE)
datos$NObeyesdad = factor(datos$NObeyesdad,levels=levels(datos$NObeyesdad)[c(1,2,6,7,3,4,5)])
datos$FCVC = factor(datos$FCVC,levels = levels(datos$FCVC)[c(2,3,1)])
datos$CH2O = factor(datos$CH2O,levels=levels(datos$CH2O)[c(2,1,3)])
datos$CALC = factor(datos$CALC,levels = levels(datos$CALC)[c(3,4,2,1)])
datos$CAEC = factor(datos$CAEC,levels = levels(datos$CAEC)[c(3,4,2,1)])
datos$TUE = factor(datos$TUE,levels = levels(datos$TUE)[c(2,3,1)])
#PARA LA PREGUNTA 1
#Mujeres y Varones
Freq(as.factor(datos$NCP[datos$Gender=="female"]))
Freq(as.factor(datos$NCP[datos$Gender=="male"]))
#Gráfica Mujeres
barplot(
prop.table(table(
as.factor(datos$NCP[datos$Gender=="female"])
)),
las=2,
main = "Distribución de frecuencias \n del Número de Comidas al Día en Mujeres",
xlab="",
ylab="Frecuencia relativa"
)
#GráficaVarones
barplot(
prop.table(table(
as.factor(datos$NCP[datos$Gender=="male"])
)),
las=2,
main = "Distribución de frecuencias \n del Número de Comidas al Día en fffffffffffffffffffVarones",
xlab="",
ylab="Frecuencia relativa")
[pic 10] [pic 11]
Gracias a las gráficas obtenidas, concluimos que tanto en mujeres como en varones predomina el consumo de tres comidas al día. Así mismo, podemos observar que en la gráfica de mujeres las frecuencias relativas se encuentran más dispersas. Mientras que, en la gráfica de varones el consumo de una, dos y cuatro comidas al día se mantienen dentro de un mismo nivel y la única que varía es la de tres comidas al día. Asimismo, se muestra un punto en común entre ambos, siendo la moda el dato más notorio, el cual es de 3 comidas al día. Por otro lado, un dato a considerar es la asimetría negativa apreciada tanto en el gráfico para varones como en el gráfico para mujeres, el cual es un poco más notorio en el primero que en el segundo.
Pregunta 2 (2.0 puntos)
Para un estudio se van a considerar solamente la información de las personas cuyo índice de masa corporal (BMI) haya estado dentro del 8% más altas. ¿Qué índice de masa corporal debe superar como mínimo una persona para que sea incluida en el estudio? Justifique su respuesta.
Ya que nos solicitan considerar a las personas cuyo índice de masa corporal (BMI) haya estado dentro del 8% más altas, trabajaremos con el Cuantil 0.92. Ello, para obtener el dato que actue como límite inferior del 8% superior del BMI. Puesto que, todo índice de masa superior al Cuantil 0.92 (41.8932) pertenecerán al porcentaje deseado.
...