Análisis estadístico multivariable con la técnica por componentes principales
Enviado por Erik Castagnoli Sepúlveda • 20 de Octubre de 2015 • Trabajo • 1.189 Palabras (5 Páginas) • 167 Visitas
Análisis por componentes principales
Alejandro Bascuñán Pulgar
Paulina Novoa Riquelme
Ingeniería Comercial, Facultad de Ingeniería
Universidad Católica de Temuco.
Resumen………………………………………………………………………………………………………………..……..…1
Introducción……………………………………………………………………………………………………………..……..1
Colegios…………………………………………………………………………………………………………..…………......2
Promedios y porcentajes de ingreso a la Universidad……………………………………………….………2
Gráficos……………………………………………………………………………………………………………….……..…..4
Análisis y resultados…………………………………………………………………………………………………….….6
Conclusión………………………………………………………………………………………………………….….………..7 Bibliografía……………………………………………………………………………………………………………..……….8
Resumen ejecutivo
Para la elaboración del informe, se extrajeron datos del MINEDUC, dicha base consiste en el promedio de egresados de enseñanza media y postulantes a educación superior (universidad).
Durante la investigación se identifica por medio de Análisis por componentes principales, la cantidad de egresados de enseñanza media de la región de la Araucanía, que postulan y entran a las universidades, con beneficios como créditos y becas.
Introducción
En el presente informe se desarrollara análisis estadístico multivariable con la técnica por componentes principales ya que el objetivo del análisis factorial es reducir las variables para conocer de mejor manera la relación que existe entre estas y poder así adquirir conclusiones con respecto a los datos analizados. Esta base de datos entrega información respectiva a los promedios, participación, y postulación a universidad de estudiantes de la región de la Araucanía de los diferentes establecimientos.
Se puede analizar esta situación con el manejo de software como IBM-SPSS y Past.
Se decide abarcar solo la región de la Araucanía para así tener datos concluyentes que puedan servir en análisis futuros relacionados con el estudio.
Objetivo general
Sistematizar y relacionar las diferentes causas de postulación a las universidades según tipo de establecimientos educacionales (particulares, medio-subvencionado, municipales) y promedios con los cuales egresaron correspondientes al año 2011 en la región de la Araucanía.
Método
Se realizó un análisis estadístico factorial, por componentes principales, de una distribución de variables cuantitativas, siendo la unidad de observación los establecimientos educacionales de la región de la Araucanía, Chile.
Para el análisis estadístico se utilizaron el software IBM-SPSS y Past.
Resultados
Antes de realizar el análisis se evaluó los 3 supuestos principales: la normalidad de los datos, linealidad y multicolinealidad de las puntuaciones, con el objetivo de detectar la existencia de casos atípicos o con valores extremos que puedan complicar los resultados del análisis.
Luego de la administración de los diferentes test para la verificación de posibles problemas futuros se determinara si las variables están suficiente mente relacionadas para que el método por componentes principales pueda aplicarse satisfactoriamente.
KMO y prueba de Bartlett | ||
Medida de adecuación muestral de Kaiser-Meyer-Olkin. | ,836 | |
Prueba de esfericidad de Bartlett | Chi-cuadrado aproximado | 4381,725 |
gl | 45 | |
Sig. | ,000 |
El test de esfericidad de Bartleff nos permitió rechazar la hipótesis nula que afirma que las variables no están correlacionadas. Por lo tanto según los resultados obtenidos se rechaza la hipótesis nula siendo estos significativos.
Luego de verificación del cumplimiento de los supuestos se seleccionó el método por componentes principales, debido al tipo de extracción y la facilidad del análisis de los datos.
PC Eigenvalue % variance
1 6.60299 73.367
2 1.34534 14.948
3 0.617388 6.8599
4 0.340243 3.7805
5 0.0538212 0.59801
6 0.0163689 0.18188
7 0.01243 0.13811
8 0.00916994 0.10189
9 0.00224286 0.024921
(Programa Past)
Varianza total explicada | ||||||
Componente | Autovalores iniciales | Sumas de las saturaciones al cuadrado de la extracción | ||||
Total | % de la varianza | % acumulado | Total | % de la varianza | % acumulado | |
1 | 7,516 | 75,159 | 75,159 | 7,516 | 75,159 | 75,159 |
2 | 1,327 | 13,268 | 88,427 | 1,327 | 13,268 | 88,427 |
3 | ,639 | 6,389 | 94,816 | |||
4 | ,385 | 3,845 | 98,661 | |||
5 | ,054 | ,544 | 99,205 | |||
6 | ,047 | ,473 | 99,678 | |||
7 | ,012 | ,124 | 99,802 | |||
8 | ,011 | ,108 | 99,910 | |||
9 | ,007 | ,071 | 99,981 | |||
10 | ,002 | ,019 | 100,000 | |||
Método de extracción: Análisis de Componentes principales. |
Se determina que la extracción nos concluye con dos variables que representan todos los datos en un porcentaje acumulado de un 88,427%
...