ESTADÍSTICA PARA INGENIERÍA 1ra Práctica

AkiDLGCResumen3 de Septiembre de 2022

3.066 Palabras (13 Páginas)123 Visitas

Página 1 de 13

[pic 1][pic 2]

[pic 3]

[pic 4]

[pic 5]

[pic 6]

[pic 7]

[pic 8]

PONTIFICIA UNIVERSIDAD CATÓLICA DEL PERÚ FACULTAD DE CIENCIAS E INGENIERÍA

ESTADÍSTICA PARA INGENIERÍA

1ra Práctica (tipo c) (Primer Semestre 2022)

Indicaciones Generales:

Esta práctica debe ser desarrollada por un grupo de máximo 3 alumnos del mismo horario.
Justifique claramente sus soluciones, presente los códigos y resultados obtenidos en R, interprete estos resultados y escriba respuestas completas teniendo en cuenta el contexto de los ejercicios propuestos; todo esto influirá en la calificación.
La presentación, la ortografía y la gramática de los trabajos influirán en la calificación.
La solución debe ser subida en único archivo PDF en la tarea PC1 de su correspondiente horario del curso. La primera hoja debe presentar el código PUCP, nombre completo y correo electrónico de todos los integrantes del grupo.

Puntaje debido al cuestionario: 20 puntos Puntaje total: 20 puntos[pic 9]

Cuestionario:

La base de datos ObesityDataSet_cleaned_and_data_sinthetic.csv contiene los datos de una muestra de personas de México, Perú y Colombia sobre su estilo de vida (Fuente: https://www.kaggle.com/datasets/mandysia/obesity-dataset-cleaned-and-data-sinthetic). Las variables medidas corresponden a información demográfica de las personas y sobre su estilo de vida.

Al leer este conjunto de datos mediante la función read.csv(), utilice el argumento stringsAsFactors = TRUE, de manera que las variables cualitativas sean leídas como factores. En este caso la sintaxis sería

datos=read.csv("ObesityDataSet_cleaned_and_data_sinthetic.csv",stringsAsFactors = TRUE)

Adicionalmente, ejecute el siguiente código para reordenar el nivel de algunos factores, de manera que se mantenga el orden correcto de las categorías en algunas de las variables ordinales.

d$NObeyesdad = factor(d$NObeyesdad,levels=levels(d$NObeyesdad)[c(1,2,6,7,3,4,5)]) d$FCVC = factor(d$FCVC,levels = levels(d$FCVC)[c(2,3,1)])

d$CH2O = factor(d$CH2O,levels=levels(d$CH2O)[c(2,1,3)]) d$CALC = factor(d$CALC,levels = levels(d$CALC)[c(3,4,2,1)]) d$CAEC = factor(d$CAEC,levels = levels(d$CAEC)[c(3,4,2,1)]) d$TUE = factor(d$TUE,levels = levels(d$TUE)[c(2,3,1)])

Pregunta 1 (2.0 puntos)

Se desea comparar gráficamente las distribuciones de frecuencias relativas de la variable número de comidas por día (NCP) entre el género (Gender). Obtenga también las tablas de distribución de frecuencias de esta variable por género. Interprete los resultados obtenidos.

library(DescTools)

library(EnvStats)

datos=read.csv("D:/ADAYANASCRIPTS/ObesityDataSet_cleaned_and_data_sinthetic.csv",stringsAsFactors = TRUE)

datos$NObeyesdad = factor(datos$NObeyesdad,levels=levels(datos$NObeyesdad)[c(1,2,6,7,3,4,5)])

datos$FCVC = factor(datos$FCVC,levels = levels(datos$FCVC)[c(2,3,1)])

datos$CH2O = factor(datos$CH2O,levels=levels(datos$CH2O)[c(2,1,3)])

datos$CALC = factor(datos$CALC,levels = levels(datos$CALC)[c(3,4,2,1)])

datos$CAEC = factor(datos$CAEC,levels = levels(datos$CAEC)[c(3,4,2,1)])

datos$TUE = factor(datos$TUE,levels = levels(datos$TUE)[c(2,3,1)])

#PARA LA PREGUNTA 1

#Mujeres y Varones

Freq(as.factor(datos$NCP[datos$Gender=="female"]))

Freq(as.factor(datos$NCP[datos$Gender=="male"]))

#Gráfica Mujeres

barplot(

prop.table(table(

as.factor(datos$NCP[datos$Gender=="female"])

)),

las=2,

main = "Distribución de frecuencias \n del Número de Comidas al Día en Mujeres",

xlab="",

ylab="Frecuencia relativa"

)

#GráficaVarones

barplot(

prop.table(table(

as.factor(datos$NCP[datos$Gender=="male"])

)),

las=2,

main = "Distribución de frecuencias \n del Número de Comidas al Día en fffffffffffffffffffVarones",

xlab="",

ylab="Frecuencia relativa")

[pic 10] [pic 11]

Gracias a las gráficas obtenidas, concluimos que tanto en mujeres como en varones predomina el consumo de tres comidas al día. Así mismo, podemos observar que en la gráfica de mujeres las frecuencias relativas se encuentran más dispersas. Mientras que, en la gráfica de varones el consumo de una, dos y cuatro comidas al día se mantienen dentro de un mismo nivel y la única que varía es la de tres comidas al día. Asimismo, se muestra un punto en común entre ambos, siendo la moda el dato más notorio, el cual es de 3 comidas al día. Por otro lado, un dato a considerar es la asimetría negativa apreciada tanto en el gráfico para varones como en el gráfico para mujeres, el cual es un poco más notorio en el primero que en el segundo.

Pregunta 2 (2.0 puntos)

Para un estudio se van a considerar solamente la información de las personas cuyo índice de masa corporal (BMI) haya estado dentro del 8% más altas. ¿Qué índice de masa corporal debe superar como mínimo una persona para que sea incluida en el estudio? Justifique su respuesta.

Ya que nos solicitan considerar a las personas cuyo índice de masa corporal (BMI) haya estado dentro del 8% más altas, trabajaremos con el Cuantil 0.92. Ello, para obtener el dato que actue como límite inferior del 8% superior del BMI. Puesto que, todo índice de masa superior al Cuantil 0.92 (41.8932) pertenecerán al porcentaje deseado.

> #QUANTILE

> quantile(d$BMI,0.92)

92%

41.89832

Pregunta 3 (4.0 puntos)

Obtenga la tabla de frecuencias y el histograma de la variable edad (Age) considerando 12 intervalos de igual amplitud. ¿Se puede decir que esta es una distribución simétrica? Justifique su respuesta mediante el gráfico realizado y una medida estadística adecuada.

#PREGUNTA 3

# Consideremos ahora construir la tabla de frecuencias

# Numero de intervalos

k=12

# Amplitud

A=max(datos$Age)-min(datos$Age)

# Ancho de clase

c=ceiling(A/k)

# Limites

b = seq(from=min(datos$Age),

by =c,

length.out=k+1)

Freq(datos$Age,breaks = b)

hist(datos$Age, breaks = b,

xlab="Edad",

ylab="Frecuencia",

main="Histograma de las Edades"

)

> Freq(datos$Age,breaks = b)

level freq perc cumfreq cumperc

N°	Rango	Frecuencia	Porcentaje	Frecuencia acumulada	Porcentaje acumulado
1	[14 -18]	303	14.4%	303	14.4%
2	<18 - 22]	718	34.0%	1021	48.4%
3	<22 - 26]	608	28.8%	1629	77.2%
4	<26 - 30]	149	7.1%	1778	84.2%
5	<30 - 34]	154	7.3%	1932	91.5%
6	<34 - 38]	83	3.9%	2015	95.5%
7	<38 - 42]	70	3.3%	2085	98.8%
8	<42 - 46]	14	0.7%	2099	99.4%
9	<46 - 50]	2	0.1%	2101	99.5%
10	<50 - 54]	3	0.1%	2104	99.7%
11	<54 - 58]	6	0.3%	2110	100.0%
12	<58 - 62]	1	0.0%	2111	100.0%
		2111

...

Descargar como (para miembros actualizados) txt (19 Kb) pdf (711 Kb) docx (640 Kb)

Leer 12 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com