Analisis Multivariado
Enviado por IreneTubay • 29 de Septiembre de 2013 • 1.267 Palabras (6 Páginas) • 479 Visitas
Análisis Multivariado
En el análisis multivariado se utilizan diferentes enfoques tales como la simplificación de la estructura de datos, el cual es una manera simplificada de representar el universo de estudio, mediante la transformación (combinación lineal o no lineal) de un conjunto de variables interdependientes en otro conjunto independiente o en un conjunto de menor dimensión.
Este tipo de análisis permite ubicar las observaciones dentro de grupos o bien concluir que los individuos están dispersos aleatoriamente en el multiespacio; también pueden agruparse variables.
El objetivo es examinar la interdependencia de las variables, la cual abarca desde la independencia total hasta la colinealidad (cuando el punto de vista, el punto imagen y el punto objeto se encuentran en la misma recta.) cuando una de ellas es combinación lineal de algunas de las otras o, en términos aún más generales, es una función f(x) cualquiera de las otras.
Entre los métodos de análisis multivariado para detectar la interdependencia entre variables y también entre individuos se incluyen:
El análisis de factores.
El análisis por conglomerados o clusters.
El análisis de correlación canónica.
El análisis por componentes principales.
El análisis de ordenamiento multidimensional, y algunos métodos no paramétricos.
Los métodos para detectar dependencia comprenden:
El análisis de regresión multivariado.
El análisis de contingencia múltiple.
El análisis discriminante.
ANALISIS DE COMPONENTES PRINCIPALES
El método de análisis de componentes principales es uno de los más difundidos,
*permite la estructuración de un conjunto de datos multivariados obtenidos de una población.
En estadística, el análisis de componentes principales (en español ACP, en inglés, PCA) es una técnica utilizada para reducir la dimensionalidad de un conjunto de datos. Intuitivamente la técnica sirve para hallar las causas de la variabilidad de un conjunto de datos y ordenarlas por importancia.
Técnicamente, el ACP busca la proyección según la cual los datos queden mejor representados en términos de mínimos cuadrados. El ACP* se emplea sobre todo en análisis exploratorio de datos y para construir modelos predictivos. El ACP comporta el cálculo de la descomposición en autovalores de la matriz de covarianza, normalmente tras centrar los datos en la media de cada atributo.
Una de las ventajas del ACP para reducir la dimensionalidad de un grupo de datos, es que retiene aquellas características del conjunto de datos que contribuyen más a su varianza, manteniendo un orden de bajo nivel de los componentes principales e ignorando los de alto nivel. El objetivo es que esos componentes de bajo orden a veces contienen el aspecto "más importante" de esa información.
Ejemplo:
Un análisis consideró las calificaciones escolares n = 15 estudiantes en m = materias (lengua, matemáticas, física, inglés, filosofía, historia, química, gimnasia). Los dos primeros componentes principales explicaban juntos el 82,1% de la varianza. El primer de ellos parecía fuertemente correlacionado con las materias de humanidades (lengua, inglés, filosofía, historia) mientras que el segundo aparecía relacionado con las materias de ciencias (matemáticas, física, química). Así parece que existe un conjunto de habilidades cognitivas relacionadas con las humanidades y un segundo relacionado con las ciencias, estos dos conjuntos de habilidades son estadísticamente independientes por lo que un alumno puede puntuar alto en sólo uno de ellos, en los dos o en ninguno.2
Un análisis de metodología docente, consideró las calificaciones de n = 54 estudiantes de la facultad de Biología de la ULA y m = 8 tipos de habilidades. El primer factor principal que explicaba las calificaciones era la inteligencia del estudiante y en segundo lugar la metodología de aprendizaje usada.3
Una análisis de 11 indicadores socioeconómicos de 96 países, reveló que los resultados podían explicarse en alto grado a partir de sólo dos componentes principales, el primero de ellos tenía que ver con el nivel de PIB total del país y el segundo
...