Análisis de la información, Análisis de 2 Bases de datos
edward.andres16Ensayo17 de Septiembre de 2018
1.609 Palabras (7 Páginas)139 Visitas
[pic 3]
Análisis de la información, Análisis de 2 Bases de datos
Juan Forero Miguel Arbeláez
Gabriel Garcia
Universidad Militar Nueva Granada Facultad de Ingeniería, Departamento de Multimedia
Bogotá, Colombia 2018
[pic 4]
Análisis de la información, Análisis de 2 Bases de datos
Juan Forero
Miguel Arbeláez
Gabriel Garcia
Trabajos, entrega número dos Ingeniería Multimedia, Análisis de la Información
Ricardo E. Gutiérrez Carvajal
Análisis de la información
Universidad Militar Nueva Granada Facultad de Ingeniería, Departamento de Multimedia
Bogotá, Colombia 2018
[pic 5]
Resumen
En los estudios sociales se requiere analizar el comportamiento de un conjunto de datos con el objetivo de determinar hechos o características de interés con el fin de tomar decisiones de una manera acertada. Para la clase de análisis de la información se nos pide escoger 2 bases de datos que tuvieran más de 10.000 filas y 15 columnas del repositorio nacional de datos de Colombia (www.datos.gov.co) en este documento se describe los procesos que utilizamos para el análisis de estas bases de datos.
Palabras clave: Bases de datos, homicidios, icfes, análisis estadístico, análisis de la información, R, estadística.
[pic 6]
Abstract
In social studies it is necessary to analyze the behavior of a set of data in order to determine facts or characteristics of interest in order to make decisions in an accurate manner. In the class of information analysis, it is necessary to choose 2 databases that had more than 10,000 rows and 15 columns of the Colombian national data repository (www.datos.gov.co). This document describes the processes that we use for the analysis of these databases.
Keywords: Databases, homicides, icfes, statistical analysis, information analysis, R, statistics.
[pic 7]
Contenido | |
Pág. | |
Lista de figuras | 6 |
Introducción | 1 |
1.2 Objetivos específicos | 7 |
| 8 |
13 | |
13 | |
Bibliografía | 14 |
[pic 8]
Lista de | figuras | |
Pág. | ||
Figura 2-1: | Diagrama caja de bigotes, edad de la víctima, homicidios 2017 | 9 |
Figura 2-2: | histograma, edad de la víctima, homicidios 2017 | 9 |
Figura 2-3: | Distribución conjunta, tipo de arma y zona, homicidios 2017 | 10 |
Figura 2-4: | Distribución conjunta, hota con departamento, homicidios 2017 | 11 |
Figura 2-5: | Distribución conjunta, edad, sexo y zona, homicidios 2017 | 11 |
Figura 2-6: | Distribución conjunta, arma empleada y departamento, abuso sexual 2016 | 12 |
Figura 2-7: | Distribución conjunta, sexo y zona, abuso sexual 2016 | 12 |
Figura 2-8: | Distribución conjunta, sexo y móvil agresor, abuso sexual 2016 | 13 |
[pic 9]
Lista de tablas
Pág.
Tabla 2-1: Participación de las energías renovables primaria [14]. 7
Nota: Si es requerido, se puede incluir la lista de cuadros, en caso que se utilicen en el desarrollo de la tesis o trabajo de investigación. Tenga presente que estas listas deben ser generadas de forma automatizada utilizando las opciones que proporciona el software de procesamiento de texto.
[pic 10]
Introducción
En los estudios sociales se requiere analizar el comportamiento de un conjunto de datos con el objetivo de determinar hechos o características de interés con el fin de tomar decisiones de una manera acertada. El análisis estadístico es una herramienta para el análisis de datos, en donde una de sus finalidades es reconocer y profundizar en la información que dichos datos puedan aportar a un área de estudio o fuente de información.
El objetivo del análisis estadístico es la identificación de patrones o tendencias, por ejemplo, la causa de que en determinados sectores sociales sea más común los casos de violencia intrafamiliar o según su nivel de escolaridad, etc. A continuación, se introduce algunos términos que se requieren para este proyecto.
- CRISP-DM (Cross Industry Standard Process for Data Mining): en la minería de datos llamado crisp-dm. se trata de un modelo estándar abierto del proceso que describe los enfoques comunes que utilizan los expertos en minería de datos. Es el modelo analítico más usado.
- Media: la media es un conjunto de números, conocido como el promedio, es la suma de los datos dividida entre el número total de datos.
- Mediana: la mediana de un conjunto de datos es el número medio en el conjunto, después de que los datos han sido organizados de mayor a menos o si hay un número de datos par, la mediana es el promedio de los dos números medios.
- Moda: la moda de un conjunto de datos es aquel dato que más se repite o aparece más a menudo.
[pic 11]
Para la clase de análisis de la información se nos pide escoger 2 bases de datos que tuvieran más de 10.000 filas y 15 columnas del repositorio nacional de datos de Colombia (www.datos.gov.co) a continuación se describe lo que se realiza. En primer lugar, escogimos los homicidios que se dieron en el 2017 en Colombia y la segunda base de datos fueron los resultados de las pruebas saber 2016-2 en Colombia.
[pic 12]
Objetivo general
Realizar una limpieza de las bases de datos con el fin de obtener información valiosa y relevante para la toma de decisiones.
...