Analis Cluster
Enviado por Puchun • 12 de Septiembre de 2014 • 449 Palabras (2 Páginas) • 202 Visitas
Analisis Cluster
• Se utiliza la información de una serie de variables para cada sujeto u objeto y, conforme a estas variables se mide la similitud entre ellos.
• Una vez medida la similitud se agrupan en: grupos homogéneos internamente y diferentes entre sí.
• La "nueva dimensión" lograda con el cluster se aprovecha después para facilitar la aproximación "segmentada" de un determinado análisis.
Conviene tener claro que:
• Que la técnica no tiene vocación / propiedades inferenciales
• Que por tanto, los resultados logrados para una muestra sirven sólo para ese diseño (su valor atañe sólo a los objetivos del analista): elección de individuos, variables relevantes utilizadas, criterio similitud utilizado, nivel de agrupación final elegido.... definen diferentes soluciones.
• Que cluster y discriminante no tiene demasiado en común: el discriminante intenta explicar una estructura y el Cluster intenta determinarla.
Etapas de un análisis Cluster
1. SELECCIÓN DE LA MUESTRA DE DATOS
• Adecuar al máximo la muestra al objeto de análisis
• Depuración de atípicos (interesan elementos como miembros de grupos,no interesa la excesiva "individualidad")
2. SELECCIÓN y TRANSFORMACIÓN DE VARIABLES A UTILIZAR
CANTIDAD
• No elegir variables indiscriminadamente: RECORDAMOS: cada estructura se manifiesta en una serie de variables y cada grupo de variables revela, sólo, una determinada estructura.
• Resultado muy sensible a la inclusión de alguna variable irrelevante.
• La inclusión indiscriminada de variables aumenta la probabilidad de atípicos.
TRANSFORMACIÓN
• Depende / Afecta a muchas decisiones posteriores (medida de distancia /similitud empleada, por ejemplo)
• Estandarización por variable: aunque resulta útil para mediciones posteriores de distancia puede afectar al resultado del análisis y no se recomienda si las diferencias de medidas reflejan alguna cualidad natural de interés conceptual.
• Estandarización por encuestado: singular, pero en baterías de indicadores elimina patrones de respuesta en los sujetos, ofreciendo la importancia relativa de cada indicador.
• Factorización: puede resultar interesante factorizar previamente las variables y realizar el Cluster con factores en lugar de con variables.
• El tipo de escala de medida afectará a fases posteriores del procedimiento.
3. SELECCIÓN DE CONCEPTO DE DISTANCIA O SIMILITUD Y MEDICIÓN DE LAS MISMAS
4. SELECCIÓN y APLICACIÓN DEL CRITERIO DE AGRUPACIÓN
5. DETERMINACIÓN DE LA ESTRUCTURA CORRECTA (Elección del número de grupos)
Análisis Multiravariante
Es considerado como todos los métodos estadísticos que analiza de manera simultánea medidas múltiples
...