Programación exploración de datos
Enviado por kperez26 • 25 de Junio de 2023 • Práctica o problema • 364 Palabras (2 Páginas) • 106 Visitas
#KAREN LORENA PÉREZ MADERA
#Llamo a la librería readxl y luego importo
library(readxl)
datos <- readxl::read_excel("Educacion Sexual.xlsx")
# 1. Realizar un str, summary del objeto. Comentar brevemente las impresiones obtenidas del df
summary(datos)
# los datos indican que la edad mínima encontrada en el dt es 15 años y la máxima es 19 años, con un promedio de 16 años
# el dt también indica que los años mínimos de educación son 6 años y máximo 12 años con un promedio de 9 años
str(datos)
# la estructura del df tiene 15,157 filas y 6 columnas
# 2. Analizar la informacion faltante con las funciones rowSums y colSums. Comentar brevemente las impresiones obtenidas del df
rowSums(is.na(datos))
# a simple vista se observa que no hay datos na en el df pero por la cantidad de filas es mejor usar colSums
colSums(is.na(datos))
# se evidencia que en las 6 columnas del df no hay datos na
#3. Calcular los promedios y la mediana de cada una de las siguientes variables: Girth, Height, Volume
#Estadística descriptiva mediante paquete "pastecs"
#Cargamos la librería "pastecs"
library(pastecs)
#Promedio
mean(datos$edad)
#El promedio de la variable edad en el df es 16 años
mean(datos$anios_educ)
#El promedio de los años de estudio del df en los datos observados es 8.5 años de educación
#Mediana
median(datos$edad)
#La mediana de la variable edad en el df es de 17 años
median(datos$anios_educ)
#La mediana de la variable años de eduación en el df es de 9 años
#4. Calcular las varianzas y desvios estandares de cada una de las siguientes variables: Girth, Height, Volume
#Varianza
var(datos$edad)
#La varianza de la variable edad en el df es de 1.99
var(datos$anios_educ)
#La varianza de la variable de años de eduación en el df es de 1.38
#Desviación estándar
sd(datos$edad)
# La desviación estándar de la variable edad es 1.41 lo que indica que están lejos de la media
sd(datos$anios_educ)
#La desviación estándar de la cariable años de educación es 1.17 lo que indica que están lejos de la media
#5. Hacer un histograma de cada una de las siguientes variables: Girth, Height, Volume
#Histograma de la variable edad
...