Modelo de predicción de fugas de cuentacorrentistas
Enviado por moitabeatriz • 8 de Noviembre de 2015 • Tarea • 797 Palabras (4 Páginas) • 88 Visitas
TAREA PRÁCTICA
"Modelo de predicción de fugas de cuentacorrentistas"
Fernanda Escanilla
Paula Henriquez
Rodrigo Pinto
Modelo de inteligencia de Marketing
El modelo utilizado para predecir la potencial fuga de clientes fue una regresión lineal que consiste en una función que asigna a cada registro un valor real. Esta es la principal diferencia respecto a la clasificación; el valor a predecir es numérico. El objetivo de este caso es minimizar el error entre el valor predicho y el real.
Para los 1.200 clientes nos entregaron las siguientes variables,
Variables | |
NOMBRE | DESCRIPCIÓN |
Cod_Cliente | identificador cliente |
COD_OFI | Código oficina |
COM | Comuna del cliente |
ED | Edad |
SX | Sexo |
NIV_EDUC | Nivel educacional |
RENT A | Sueldo mensual |
E_CIVIL | Estado civil |
VIG | Meses dentro de la empresa |
TRX_T | No de transacciones mes T |
TRX_T-1 | No de transacciones mes T-1 |
TRX_T-2 | No de transacciones mes T-2 |
SALDO_T | Saldo cuenta corriente mes T |
SALDO_T-1 | Saldo cuenta corriente mes T-1 |
SALDO_T-2 | Saldo cuenta corriente mes T-2 |
SALDO_T-3 | Saldo cuenta corriente mes T-3 |
SALDO_T-4 | Saldo cuenta corriente mes T-4 |
SALDO_T-5 | Saldo cuenta corriente mes T-5 |
REN_T | Rentabilidad cliente T |
REN_T-1 | Rentabilidad cliente T-1 |
REN_T-2 | Rentabilidad cliente T-2 |
REN_T-3 | Rentabilidad cliente T-3 |
REN_T-4 | Rentabilidad cliente T-4 |
Transformación de las variables:
- Codigo Cliente: Identificador cliente: Variable Irrelevante
- Código oficina: Se mantiene, debido a que podemos verificar el comportamiento de la oficina que puede afectar el cierre de una cuenta corriente.
- Comuna del cliente: Irrelevante, debido a que en una comuna pueden existir varias sucursales, por lo tanto se mantiene código de oficina.
- Edad: Esta variable fue agrupada en rangos, para llevarla a variable Dummy. Se eliminaron 119 datos que no tenían edad. Se realizó una correlación para verificar si los datos sin edad afectaban , la correlación tendìa a 0, por lo tato se eliminaron. Esto se puede verificar en excel adjunto en pestaña s-edad
Dummy | Rango de edad |
1 | 20 - 30 |
2 | 31 - 45 |
3 | 45 - 65 |
4 | 65 más |
- Sexo: Se clasifica como Dummy. El unico dato sin sexo no contiene información relevante.
Sexo | Dummy |
hombre | 0 |
mujer | 1 |
- Nivel educacional: Se clasifica como Dummy. Los datos sin nivel educacional no se consideran, se realizó una correlación no impactando en el resultado.
- Sueldo mensual: La renta es un atributo importante para la evaluación, por lo tanto se realizó la correlación entre los valores que tienen renta y los que aparecen con valor 0, y con esto apreciamos que no estaban correlacionados. Se eliminaron 122 datos sin renta.
Al resto de los datos se sacó Ln y se llevó a variable Dummy.
Renta | Dummy |
< = 0 | 0 |
> 0 | 1 |
- Estado civil: Variable Dummy
- Meses dentro de la empresa: Variable Dummy
- No de transacciones mes T
- No de transacciones mes T-1
- No de transacciones mes T-2
Estas variales se realizaron en rangos, utilizando variable Dummy
Rango | Dummy |
0 a 5 | 0 |
> 5 | 1 |
...