CLASIFICACIÓN DE DATOS
Enviado por jhonny10000 • 7 de Febrero de 2014 • 3.616 Palabras (15 Páginas) • 475 Visitas
1. Introducción al Análisis de Datos
El análisis de datos de la encuesta tiene como objetivo la detección de grupos variables altamente relacionados, para ello se utilizan los siguientes análisis :
1. Análisis Descriptivo : ayudará a observar el comportamiento de la muestra en estudio, a través de tablas, gráficos.....
Los resultados recogidos en la muestra se resumen en una matriz de datos N x M , en la cual N es el número de unidades de análisis utilizadas ( número de casos ) y M es el número de características de dichas unidades , unidades de las que tenemos información.
2. Análisis Exploratorio : la analización exploratoria pretende partir de un conocimiento profundo y creciente de los datos para , trabajando inductivamente , llegar a un modelo ajustado de los datos. Los pasos en este tipo de análisis son los siguientes :
2.1. Análisis de cada una de las variables incluidas en la matriz de datos. Los datos se agrupan de un modo rápido y a ser posible gráfico , las técnicas mas utilizadas son :
Tronco y hoja
La caja
Ambas pretenden :
Conocer la variable analizada para determinar si su distribución es simétrica o no.
Poder descubrir valores extremos y analizarlos antes de poder pasar al análisis multivariante.
3. Transformación de los datos : la transformación persigue la consecución de una distribución aproximada a la normal. Tipos de transformación :
Lineales : suma , resta , división , multiplicación , cambia los valores brutos ( datos obtenidos ) de la variable sin alterar nada mas.
No lineales monotónicas : cambian los valores originales y tambien sus distancias pero no el orden
No lineales no monotónicas : similar a la anterior pero no altera el orden..
4. Análisis Confirmatorio / Explicativo : la mayor parte de las técnicas tradicionales de análisis estadístico de los datos tienen un carácter deductivo confirmatorio. De todas las técnicas de análisis confirmatorio la más útil para el sociólogo es aquella que parte del análisis de variables , entre las que cabe distinguir : nominales y de intervalo o de razón . En la investigación sociológica las de tipo ordinal son muy frecuentes , pero las técnicas de análisis escasas , de modo que se tratan como variables de intervalo o razón , labor muy complicada o como nominales.
5. Investigación con Variables Nominales
En la investigación con variables nominales se utilizan técnicas como el análisis de varianza o factorial.
Dentro de las técnicas multivariantes de análisis de variables nominales existen dos de caracterespecial :
• Los coeficientes <d> J. Davis ha perfeccionado un modelo que se basa en las diferencias porcentuales. Los coeficientes <d> son diferencias entre proporciones y se utilizan como indicadores del impacto causal de unas variables sobre otras.
• Modela <log-linear> explican la probabilidad de que una persona elegida al azar presente una determinada combinación de categorías/ niveles del conjunto de variables de clasificación utilizados
6. Investigación con variables de intervalo o de razón : en estas se utiliza el análisis de regresión : puede utilizarse siempre que la variable dependiente sea una variable de intervalo.
2. Análisis de los Datos de Encuesta
El análisis de los datos de la encuesta , como cualquier otro tipo de datos de interés científico , ha de guardar relación con el problema de conocimiento que se trata de esclarecer y con la métrica de la información empírica que se tiene entre manos , es decir lo primero que se debe realizar en una encuesta no es ver que dicen los datos sino que dicen en relación con el problema que se plantea y las hipótesis que uno se había planteado previamente.
Una serie de conclusiones importantes sobre los datos de una encuesta son :
• La cantidad y calidad del conocimiento que se desea obtener sobre un problema no está necesariamente en función del tamaño de la muestra empleada para hacer una encuesta.
• Ni el margen global de error en los resultados de una encuesta disminuye necesariamente aumentando el tamaño de la muestra.
• Los datos de la encuesta son mas útiles cuanto mayor sea la posibilidad de poderlos comparar con otros similares y anteriores en el tiempo o procedentes simultáneamente de otras poblaciones.
Tipos de Análisis :
Análisis de Correlación : Con los datos mas simples de respuestas a varias preguntas se pueden fabricar medidas combinatorias de los mismos en forma de índices o escalas.
Estas medidas constituyen la operacionalización de los conceptos, es la referencia empírica reducida a valores empíricamente manejables.
Los conceptos son elaboraciones teóricas con las que definimos un determinado aspecto de la realidad y de la que nos servimos para expresar teorías e hipótesis.
Las variables : son dimensiones de la realidad que deseamos estudiar.
Los indicadores : son expresiones numerables de las distintas dimensiones de un concepto.
Con los datos indexados podemos hacer análisis de correlación de diferentes tipo.
La correlación entre dos o mas variables expresa la extensión en que una incide en la otra intersección, la intersección de ambas, su grado de asociación... . Pero no indica si a partir de los valores de una de ellas podemos predecir los valores de la otra , esto se consigue mediante el coeficiente de regresión que indica si la correlación entre variables es tal que a partir de una podemos calcular los valores de otra. Todo esto lo podemos realizar con medidas de la estadística no paramétrica no pueden ser calculadas.
A partir del Análisis de Correlación se puede trabajar con distintos modelos de análisis multivariable :
Un conjunto de modelos de análisis podría denominarse como el del análisis causal : aquí se incluirían los análisis de cadena (< path análisis>) , el de regresión múltiple y el de segmentación por arborescencia (<tree análisis>) el cual es una técnica multivariable que produce una serie de agrupamientos dicotomizados en un modelo que se asemeja a las ramas de un arbol. La división de las cosas en grupos dicotomizados
...