Procesos Estocásticos Entrega Intermedia – Proyecto Final
Enviado por Fernando Andres Vega Lopez • 25 de Octubre de 2017 • Ensayo • 3.772 Palabras (16 Páginas) • 245 Visitas
Pontificia Universidad Javeriana
Departamento de Ingeniería Industrial
Procesos Estocásticos
Entrega Intermedia – Proyecto Final
Carlos Ramírez, Fernando Vega y Camilo Zuleta
- Objetivos:
- Objetivo general:
Este trabajo tiene la finalidad de encontrar, mediante análisis matemático, una predicción de un valor representativo de la vida útil de un cliente promedio de una empresa de reparación y mantenimiento automotriz ubicada en Taiwan. Esta vida útil se refiere a un tiempo proyectado que un cliente va a durar en la empresa, así como un valor monetario de lo que dicha persona va a gastar en su vida útil como cliente.
- Objetivos específicos:
- Estimación de los datos referentes a una base de 3.239 clientes mediante el uso de las distribuciones y promedios que el documento original del proyecto provee.
- Desarrollo de una regresión logística de los datos obtenidos para estimar valores necesarios para el análisis.
- Modelamiento mediante Cadenas de Márkov de todo el proceso con la finalidad de encontrar posibles estados y probabilidades para determinar un valor numérico a la vida útil de un cliente en la empresa.
- Resultados específicos esperados:
Los objetivos de este proyecto se fundamentan en el análisis y seguimiento de los procedimientos establecidos por los autores C.-J. Cheng, S.W. Chiu, C.-B. Cheng y J.-Y. Wu en su escrito “Customer lifetime value prediction by a Markov chain based data mining model: Application to an auto repair and maintenance¡ company in Taiwan”. Estos autores buscan determinar el valor que un determinado cliente tiene en los ingresos de una compañía dueña de un concesionario de automóviles en Taiwán, a partir del análisis de un ejemplo de un estudio realizado por ellos en 1990. Ellos buscan determinar el Life Time Value (LTV) de un cliente, concepto que se define como el tiempo que permanece en el sistema y las ganancias que produce para la empresa.
Para tal fin, ellos plantean que es necesario seguir un procedimiento de tres etapas. Primero, es necesario estructurar un análisis estadístico de los datos obtenidos de la muestra construida de clientes del negocio, así como de sus compras y demás factores que resulten significativos para determinar la probabilidad de que un determinado cliente abandone finalmente el concesionario. Para ello es necesario recurrir a la aplicación de un modelo de regresión logística que utilice como variable respuesta la variable binaria que determina si cada cliente ha abandonado (o ha dejado de asistir) al concesionario en el año final del estudio (1990). Esta variable fue relacionada con una serie de variables consideradas por los autores como significativas estadísticamente, y se ha decidido aplicarlas para construir este modelo en el programa R Studio. Dichas variables son: edad en años del automóvil actual del cliente antes de comprar uno nuevo, valor promedio que cada cliente del estudio ha gastado en el concesionario, frecuencia de visita al concesionario y el total de carros comprados a ese concesionario. Una vez obtenidas dichas probabilidades de abandono, será posible calcular el tiempo esperado que cada cliente haya pasado como cliente del negocio, antes de su abandono. Este tiempo para el cliente k-ésimo será considerado como [pic 1]
En segundo lugar, es necesario utilizar los conceptos de Cadenas de Markov para modelar este problema. Se ha establecido que la variable principal a considerar para este análisis estocástico es la cantidad de visitas por año al concesionario. Dentro del conjunto de datos de entrada ésta se toma como la frecuencia de visitas y se supondrá como una variable distribuida Poisson como un parámetro λ que dependerá de los estados que se definan para este sistema. Para este caso, el conjunto de estados corresponderá a la cantidad de visitas que en promedio realice un cliente anualmente. A partir de estos estados definidos y de la función de probabilidad Poisson se calculará la matriz de transición P, que será el segundo resultado esperado de este proyecto. De igual manera será posible construir el vector , que determinará el estado en el que se halle el k-ésimo cliente dentro del sistema. Este vector valdrá uno en la posición del estado en el que se ocupe, y en el resto de espacios valdrá cero.[pic 2]
Finalmente, se procederá a realizar un análisis de redes neuronales para calcular los márgenes de contribución de cada cliente considerado en este estudio. Dicho margen cuantifica el grado de importancia de un cliente para el concesionario y para el k-ésimo cliente será considerado como . [pic 3]
Una vez obtenidos tanto la matriz de transición P, la matriz como el tiempo esperado de permanencia en el sistema y el margen de contribución , será posible construir el valor futuro del Life Time Value. Según los autores, el LTV está compuesto de un elemento de su contribución proyectada a futuro (conocida como el Valor Futuro (FV)) y la suma de sus contribuciones pasadas (conocido como el Currency Value (CV)).[pic 4][pic 5][pic 6]
En el caso del Valor Futuro, para un cliente k, se obtiene de la siguiente manera:
[pic 7]
Donde es el conjunto de contribuciones generadas por el cliente k en todos los estados de la Cadena de Márkov en el tiempo t, es la probabilidad de transición P en t pasos y la sumatoria se aplica desde el periodo actual hasta la duración calculada como el tiempo máximo de permanencia del cliente como usuario del concesionario.[pic 8][pic 9]
Por su parte, el CV se obtiene así:
[pic 10]
Donde es el conjunto de contribuciones generadas por el cliente k en todos los estados de la cadena de Márkov en el tiempo t, r(d) es la tasa de interés en el periodo d y m es la cantidad de periodos considerados y anteriores al periodo actual (que en el caso del estudio sería en 1990, año en el que fue ejecutado el estudio puntual en un concesionario en Taiwan. Una vez calculados ambos valores se puede finalmente concluir el estudio determinando el LTV para cada individuo, que será simplemente la suma del CV y del PV:[pic 11]
...