La raíz de la minería de datos tiene sus aplicaciones basado en la Estadística
Enviado por Lisbeth Moreno • 18 de Noviembre de 2017 • Ensayo • 715 Palabras (3 Páginas) • 138 Visitas
Profesor: Omar Castro Alumno: Ángel Gómez
MINERIA DE DATOS
La raíz de la minería de datos tiene sus aplicaciones basado en la Estadística. Según Mena (1999) afirma. “Proceso iterativo de extracción de patrones predictivos ocultos de grandes bases de datos, utilizando tecnologías de inteligencia artificial y técnicas estadísticas”. Esto se debe a que la Estadística Exploratoria (Data Analysis) se encarga de estudiar un conjunto de datos que se encuentran en una población determinada así como también el estudio de la variación y el estudio de los métodos de reducción de datos con el objetivo de resumir y visualizar datos de manera que se facilite la identificación de tendencias o patrones que son relevantes para el estudio que se esté realizando, ayudándose también de la Estadística Descriptiva, donde se aplican diferentes tipos de estudios como estudios poblacionales o estudios muestrales.
La información subministrada por la minería de datos es de útil provecho para el entorno laboral, facilitando la optimización de procesos y mejorar sus productos. Un ejemplo es una empresa que esta patentado un nuevo software, la minería de datos en este caso buscara todos los patrones que existen en el software analizando todos los datos posibles así como también nos permite observar las tendencias de cómo se está comportando el software con la finalidad de ayudar a los desarrolladores a saber si este tiende a tener errores o no.
Existen dos tipos de técnicas para la minería de datos que se conocen como: Métodos descriptivos y métodos predictivos. El método predictivo especifica el modelo para datos en base a un conocimiento teórico previo, a este modelo se le van asignado una cantidad de datos con valores diferentes y una vez el modelo este cargado este estará capacitado para predecir una variable. Para que un método sea aceptado primero tiene que pasar por diferentes fases, la primera fase se conoce como la identificación objetiva: a partir de los datos recolectados se aplican reglas que permitan obtener el mejor modelo posible, estimación: proceso en el cual se calculan los parámetros del modelo elegido en el paso anterior, diagnosis: se encarga de validar dicho modelo, y por último la predicción: que es el proceso de utilización del modelo seleccionado el cual estará capacitado para predecir variables futuras.
Un ejemplo de un método predictivo es un software de seguimiento de ciclones, en este se van recolectando los datos que se encuentran en el ambiente como los vientos y temperaturas (entre otros factores), luego se darán una serie de reglas en base a los datos recolectados anteriormente y con esto ya se tienen futuras predicciones de cómo pueda comportarse un ciclón. Esto puede ser aplicado para otro tipo de tormentas como huracanes, tifones. El método descriptivo, no se asigna ningún papel a las variables, a diferencia del método predictivo en este no existen un modelo previo para los datos ya que los modelos se crean automáticamente por patrones. Entre estos se encuentra la técnica de clustering que se encarga de la clasificación automática de los datos cuya finalidad es revelar las concentraciones de los datos para agrupar estos de una manera eficiente según su homogeneidad, teniendo en cuenta que pueden usarte tanto variables cualitativas como cuantitativas.
...