Tarea de LEC Probabilidades y Estadísticas
Enviado por destay • 17 de Noviembre de 2018 • Documentos de Investigación • 3.101 Palabras (13 Páginas) • 352 Visitas
[pic 1] [pic 2]
Tarea de LEC Probabilidades y Estadísticas
Para realizar este trabajo aplicado ocupe la base de datos “GermanCredit” que se encuentra adjuntada, la cual presenta registros de una muestra de 1000 clientes del “Banco German” con el objetivo de predecir si un cliente nuevo pagará o no (response) un crédito asignado por el banco. Para esto, debe realizar las siguientes tareas en base a un análisis exploratorio estadístico y a lo más un estudio probabilístico y/o de regresión.
- Describir y analizar 4 variables a elección mediante la estadística descriptiva. Entre las técnicas que debe utilizar, considere: Tablas univariadas, tablas bivariadas, gráficos adecuados, medidas de tendencia central, dispersión, posición, asimetría, curtosis, correlación y todas las técnicas estudiadas en el curso que sean pertinentes por incluir. Además, incluya el uso de metodologías de inferencia estadística. Realice conclusiones e interpretaciones.
A continuación se indican las 4 variables seleccionadas para su análisis, junto con su descripción, gráfica y análisis.
- “Duration”: Corresponde a la variable que describe la duración de un crédito obtenido, expresado en meses. Esta variable corresponde a una variable cuantitativa continua, y sus medías descriptivas básicas corresponden a las siguientes:
DURATION | |
Media | 20,9 |
Error típico | 0,4 |
Mediana | 18,0 |
Moda | 24,0 |
Desviación estándar | 12,1 |
Varianza de la muestra | 145,4 |
Curtosis | 0,9 |
Coeficiente de asimetría | 1,1 |
Rango | 68,0 |
Mínimo | 4,0 |
Máximo | 72,0 |
Suma | 20.903,0 |
Cuenta | 1.000,0 |
Al interpretar estos resultados podemos decir que en promedio las personas obtienen créditos a 21 meses aproximadamente (20,9), de los cuales el 50% pide créditos hasta en 18 meses y el otro 50% de los clientes los pide en a lo menos 18 meses. Respecto a la cantidad de meses que más se repite en la solicitud de un crédito podemos ver que es de 24 meses, presentando una desviación en la cantidad de meses que pide cada persona respecto de los meses promedio de 12 meses aproximadamente (12,1). La cantidad mínima de meses en que las personas piden el crédito es de 4 mientras que la máxima de 72, presentando un rango (es decir diferencia entre el máximo y mínimo) de 68 meses. Todo esto obtenido de la información de 1.000 personas que han obtenido un crédito.
Finalmente podemos ver respecto de la distribución de los datos que presenta una curva leptocúrtica, es decir existe una gran concentración de datos sobre la media, respecto a la asimetría podemos ver que es positiva, es decir los datos se concentran por encima de la media.
Para ver esta variable de manera gráfica hemos creado la siguiente tabla univariada, la cual cuenta la cantidad de clientes asociados a los meses de duración del crédito:
DURATION | Cantidad |
4 | 6 |
5 | 1 |
6 | 75 |
7 | 5 |
8 | 7 |
9 | 49 |
10 | 28 |
11 | 9 |
12 | 179 |
13 | 4 |
14 | 4 |
15 | 64 |
16 | 2 |
18 | 113 |
20 | 8 |
21 | 30 |
22 | 2 |
24 | 184 |
26 | 1 |
27 | 13 |
28 | 3 |
30 | 40 |
33 | 3 |
36 | 83 |
39 | 5 |
40 | 1 |
42 | 11 |
45 | 5 |
47 | 1 |
48 | 48 |
54 | 2 |
60 | 13 |
72 | 1 |
Lo que gráficamente se ve como sigue a continuación:
[pic 3]
Acá claramente podemos fijarnos que el número de meses en los que se obtiene un crédito, más frecuente es de 12 y 24 meses.
- “Amount”: Corresponde a la variable que describe el monto del crédito obtenido. Esta variable corresponde a una variable cuantitativa continua, y sus medías descriptivas básicas corresponden a las siguientes:
AMOUNT | |
Media | 3.271,3 |
Error típico | 89,3 |
Mediana | 2.319,5 |
Moda | 1.393,0 |
Desviación estándar | 2.822,7 |
Varianza de la muestra | 7.967.843,5 |
Curtosis | 4,3 |
Coeficiente de asimetría | 1,9 |
Rango | 18.174,0 |
Mínimo | 250,0 |
Máximo | 18.424,0 |
Suma | 3.271.258,0 |
Cuenta | 1.000,0 |
...