Text Mining
Enviado por betoduffel • 24 de Octubre de 2012 • 661 Palabras (3 Páginas) • 635 Visitas
Una aplicación my popular de text mining es el documento realizado por Don Swanson que extrajo información derivada de colecciones de texto. Swanson demostró como cadenas de implicaciones causales dentro de la literatura médica pueden conducir a hipótesis para enfermedades poco frecuentes.
Este extrajo solo de los títulos de presentes en la literatura biomédica respecto a artículos relaciones con la migraña, que demostraban que la perdida de magnesio podrá representar un papel en algunos tipos de migraña, una hipótesis que no existía en la literatura y que se encontró mediante ligas.
El objetivo del text mining es presentar herramientas que faciliten la gestión y la descripcion de corpus o textos de gran tamaño y que permitan derivar la información de ellos desde el puno de vista estadístico.
La lengua es nuestra morada vital
Le lengua nos hace y en ella nos hacemos.
Estudios recientes indican que le 80% de información de una compañía esta almacenada en forma de textos o formatos no estructurados.
Con text mining es fácil saber como distintos segmentos utilizan diferentes palabras para expresar la misma idea. Identificar las variaciones en el uso del lenguaje es muy importante si deseamos comunicarnos con nuestros clientes usando sus propias palabras, si queremos saber como verbalizan su agrado o desagrado.
L a buque da de una estrategia adecuada depende de los objetivos, se requiere saber el vocabulario utilizado por personas con características diversas respecto a un producto o servicio.
Unidades léxicas y segmentación del corpus
Iniciamos por unidad del análisis. Esta unidad puede ser un carácter una palabra o un conjunto de palabras. Tal vez no interese saber las palabras asociadas a un producto, por ejemplo: go. Si lo que nos interesa es haber un concepto transmitiendo lo que deseamos, la unidad puede ser un segmento.
La aplicación de text mining en investigación de mercados tiene varias vertientes.
Blogs, Focus Group, Preguntas abiertas.
En el caso de las preguntas abiertas, diversos estudios han concluido que la forma de preguntar, ya sea abierta o cerrada, cambia de manera radical los resultados.
Aun cuando una pregunta se realiza de manera abierta. Las respuestas pasan por un procedimiento de codificación que presenta varias desventajas.
Mediación del codificador, empobrecimiento del contenido, las respuestas raras, originales y poco claras se asignas a códigos residuales, destrucción de forma.
Text mining es un conjunto de técnicas de análisis que ayudan a estudiar las respuestas abiertas sin necesidad de codificar.
¿Como text mining puede resolver problemas de I.M?
Identificando vocabulario, encuentra la estructura de una asociación de texto, forma clústeres semánticos.
1. Identificación de campos semánticos por segmentos.
L a ideas
...