Ejercicios Data Sciencec
Enviado por Manuel Hidalgo • 29 de Noviembre de 2018 • Tarea • 512 Palabras (3 Páginas) • 118 Visitas
QUIZ 2
Nombre Alumno:
Con ayuda de Excel, R y/o Minitab debe desarrollar las actividades referidas a la base de datos CLIENTES.xlsx y entregar los resultados y conclusiones en este mismo archivo, enviándolo al correo contacto@estadistica.uc.cl (Asunto: QUIZ 2 – SECCIÓN - Nombre Alumno).
Los datos corresponden al comportamiento de 2.000 clientes de un banco del país. La descripción de las variables es la siguiente:
VARIABLES | DESCRIPCION |
IDCLIENTE: | Número identificador del cliente. |
MARCA: | Marca que indica si el cliente fue bueno. |
EVOLUCION_LCR: | Evolución de la línea de crédito. |
DIAS_MORA: | Días de mora del último crédito pedido por el cliente. |
COMPORT_INT: | Comportamiento interno del cliente. |
ACTIVIDAD: | Actividad del cliente. |
ESTADO_CIVIL: | Estado civil del cliente |
EDAD: | Edad del cliente, años |
RENTA: | Renta del cliente. |
SEXO: | Sexo del cliente. |
TIPO_VIV: | Tipo de vivienda del cliente. |
VARIABLES | Tipo |
IDCLIENTE: | Cualitativa nominal |
MARCA: | Cualitativa nominal |
EVOLUCION_LCR: | Cualitativa nominal |
DIAS_MORA: | Cuantitativa discreta |
COMPORT_INT: | Cualitativa nominal |
ACTIVIDAD: | Cualitativa nominal |
ESTADO_CIVIL: | Cualitativa nominal |
EDAD: | Cuantitativa discreta |
RENTA: | Cuantitativa discreta |
GENERO: | Cualitativa nominal |
TIPO_VIV: | Cualitativa nominal |
- Clasifique las variables de interés según el tipo de variable (ejemplo: Cuantitativa-Discreta).
- Construya una Tabla de Distribución de Frecuencias para la variable MARCA y un gráfico adecuado que describa la distribución de esta variable. Comente los resultados.
- Construya una Tabla de Distribución de Frecuencias para la variable RENTA y un gráfico adecuado que describa la distribución de esta variable. Comente los resultados. No olvide comentar respecto al tipo de asimetría de la variable.
- Calcule las medidas numéricas de resumen que describa la RENTA de los clientes. Comente los resultados principales.
- De las medidas de tendencia central obtenidas en el punto anterior ¿Cuál considera más adecuada para este tipo de datos?
- Calcule las medidas numéricas de resumen que describa la variable RENTA, según la MARCA del cliente. Compare y comente las rentas para cada tipo de cliente.
- Construya un diagrama de caja que permita comparar la distribución de las RENTAS según la MARCA del cliente. Comente los resultados.
- Construya un diagrama de caja que permita comparar la distribución de la EDAD según la MARCA del cliente. Comente los resultados.
- Genere tres grupos de EDAD (Grupo 1: 20-35, Grupo 2: 36-50, Grupo 3: 51-65].
- Construya una tabla de doble entrada con la variable generada GRUPO y la variable SEXO que permita observar la distribución conjunta de las variables. Interprete alguno de sus valores.
- Construya una tabla de doble entrada que permita observar la distribución de los grupos de Edad según SEXO. Interprete algunos de sus valores. Diferencia??
- Construya una tabla de doble entrada que permita observar la distribución del SEXO según los grupos de EDAD.
- ¿Existe asociación entre RENTA y EDAD? Realice un adecuado que permita ver la asociación entre las variables. Calcule el coeficiente de correlación e interprete su resultado.
- Construya grupos de edad según la tabla a continuación, luego para cada grupo calcule el promedio de la EDAD (note que el promedio de la EDAD en cada grupo NO es el punto medio del rango del intervalo) y el promedio de la RENTA. Luego calcule el Coeficiente de Correlación de los promedios de EDAD y de los promedios de RENTA obtenidos en los grupos. Compare su resultado con lo obtenido en el punto anterior, comente.
GRUPOS | Promedio EDAD | Promedio RENTA |
G01: 20-24 | ||
G02: 25-29 | ||
G03: 30-34 | ||
G04: 35-39 | ||
G05: 40-44 | ||
G06: 45-49 | ||
G07: 50-54 | ||
G08: 55-59 | ||
G09: 60-64 | ||
G10: 65-70 |
Coeficiente de correlación (Promedio EDAD, Promedio RENTA) =
...