Depuración de datos o data-cleaning
Enviado por nikc • 8 de Noviembre de 2012 • Trabajo • 1.261 Palabras (6 Páginas) • 458 Visitas
1- DEPURACIÓN DE DATOS O DATA-CLEANING
Los directivos desconfían de la información almacenada en las Bases de Datos utilizadas por los departamentos de marketing. Las principales objeciones que plantean son:
INSEGURIDAD EN SU FIABILIDAD
El estado de la información se encuentra en una situación deficiente. Esto está motivado porque la entrada de datos y su manipulado está realizado por personas que desconocen el valor que puede proporcionar una correcta información al departamento de marketing. Se suele valorar más la cantidad que la calidad, por lo que no son muy rigurosos a la hora de aplicar las normas de normalización de la información establecidas por la dirección. Los errores más frecuentes son:
- Errores ortográficos.
- Nombres, apellidos y direcciones excesivamente abreviados.
- Errores fonéticos.
- Información inexacta o errónea.
- Errores de digitalización.
- Direcciones obsoletas.
- Escritura
- En lenguas vernáculas.
- Descuido del diseño de algunos campos.
- Duplicación de registros, etc.
Estos problemas provocan un rechazo ante la información, que imposibilita el desarrollo de un buen sistema de información para marketing.
En RTA-Claritas llevamos trabajando en la depuración de la información. Gracias a las nuevas tecnologías de inteligencia artificial, hemos desarrollado un sistema experto capaz de solucionar estos problemas y posibilitando la aplicación de un sistema de información de marketing en la empresa. Conseguimos optimizar la información permitiendo la realización del marketing de precisión.
Los procesos llevados a cabo por nuestro sistema experto son denominados DATA-CLEANING. La obtención de información fiable tiene una aplicación inmediata en las acciones de marketing. Estos procesos son:
TRATAMIENTO DEL NOMBRE (expeRTA)
El tratamiento del nombre y los apellidos permiten la realización del marketing “one to one”. Nuestro sistema además permite la identificación del sexo o de una entidad jurídica. Aumentando notoriamente el impacto percibido por el destinatario, al considerarlo como algo personal, a pesar de saber que se envíe a otras muchas personas. Además intensifica la calidad de la imagen de la empresa ante sus clientes y potenciales.
En este proceso se realiza el tratamiento del nombre automatizado de los nombre y apellidos de un fichero con el objeto de:
- Diferenciar entre personas físicas y entidades jurídicas.
- Separar el nombre de pila, primer y segundo apellidos.
- Asignar el sexo en función del nombre de pila.
- Aislar las partículas conectivas de los apellidos.
- Corregir los errores de escritura más habituales.
- Expandir las abreviaturas.
- Traducir hipocorísticos (Paco-Francisco, Pepe-José,…).
Con ello se consigue: incrementar la calidad de la información, personalizar la correspondencia, mejorar la imagen de empresa, perfeccionar el acceso alfabético a los datos, clasificar…
Este tratamiento puede realizarse de tres formas:
1- Presentación de servicio: recibimos un fichero de nuestro cliente con los datos y devolveremos el mismo fichero más la información depurada.
2- Instalación Batch: se instala el software y tablas en el CPD del cliente con un training, con lo cual él mismo realizara el tratamiento de sus ficheros.
3- Instalación Online: suele ser complementario a cualquiera de los procesos anteriores. En este caso facilitamos unos módulos para que los técnicos de nuestro cliente los incorporen a sus tratamientos interactivos de captura de datos.
Algunos datos sobre expeRTA en el tratamiento de nombres y direcciones:
NORMALIZACION DE DIRECCIONES (expeRTA)
La depuración de direcciones (Población, vía, código postal) consigue mermar el índice de devoluciones, logrando una comunicación de precisión. Las inversiones realizadas en comunicación consiguen una mayor eficacia, así como una reducción del coste por impacto intensificando los resultados del departamento de marketing.
En este proceso se realiza el tratamiento automatizado de las direcciones (población y vía) de un fichero con el objetivo de:
- Asignar el código de población según el I.N.E.
- Corregir las denominaciones incorrectas de localidad.
- Descomponer el domicilio en tipo de vía, nombre, número y complementos.
- Codificar
...