Procesamiento de datos
Enviado por Erik Tarango • 9 de Abril de 2021 • Apuntes • 323 Palabras (2 Páginas) • 120 Visitas
1.2 Procesamiento de datos
1.2.1 Integración y transformación de datos
La transformación de datos es el proceso de convertir datos de un formato a otro, normalmente del formato de un sistema origen al formato requerido de un sistema destino. La transformación de datos es un componente que la mayoría de las tareas de integración y gestión de datos. El proceso de transformación de datos puede automatizarse, manejarse manualmente o completarse mediante una combinación de ambos.
Hoy en día, la realidad del big data significa que la transformación de datos es más importante para las empresas que nunca. Un número cada vez mayor de programas, aplicaciones y dispositivos producen continuamente grandes volúmenes de datos. Y con tantos datos dispares que fluyen desde una variedad de fuentes, la compatibilidad de datos siempre está en riesgo. Ahí es donde entra el proceso de transformación de datos: permite a las empresas y organizaciones convertir datos de cualquier fuente a un formato que puede ser integrado, almacenado, analizado y en una última instancia extraído para obtener inteligencia empresarial procesable.
1.2.2 Discretización de datos y jerarquías conceptuales
Algunos algoritmos que se usan para crear modelos de minería de datos requieren tipos de contenido específicos para funcionar correctamente. Por ejemplo, el algoritmo de Bayes no puede utilizar columnas continuas como entrada y no puede predecir valores continuos. Además, algunas columnas pueden contener tantos valores que el algoritmo no puede identificar fácilmente los patrones interesantes en los datos a partir de los cuales crear un modelo.
Discretizar los datos en las columnas puede permitir el uso de los algoritmos para producir un modelo de minería. La Discretización es el proceso de poner valores en depósitos para que haya un número limitado de cados posibles.
De acuerdo con (Hernández, Rodríguez, 2008) “La discretización es una parte de la reducción de datos, pero con importancia particular, especialmente para datos numéricos”. Esta reducción hace perder variación entre puntos o elementos que no están en la sección transversal de la información.
...