CORRELACION
Enviado por kitp • 21 de Mayo de 2014 • 1.117 Palabras (5 Páginas) • 224 Visitas
Coeficiente de contingencia
El coeficiente de contingencia C (de Karl Pearson) es una medida de relación estadística. El coeficiente de contingencia de Pearson expresa la intensidad de la relación entre dos (o más) variables nominales u ordinales. Se basa en la comparación de las frecuencias efectivamente calculadas de dos características con las frecuencias que se hubiesen esperado con independencia de estas características.
Índice [ocultar]
1 El coeficiente (coeficiente Chi-cuadrado)
1.1 Usos
1.2 Ejemplo
2 Contingencia cuadrática media
3 Coeficiente de contingencia de Karl Pearson
3.1 Coeficiente de contingencia corregido
4 Cramérs V
4.1 Procedimiento
4.2 Interpretación
5 Coeficiente Phi
5.1 Cálculo
5.2 Ejemplos
5.3 Nota
6 Véase también
7 Bibliografía
8 Referencias
9 Enlaces externos
El coeficiente \chi ^2 (coeficiente Chi-cuadrado)[editar]
El coeficiente \chi ^2 (también llamado contingencia cuadrática),1 sobre el que se basa el coeficiente de contingencia, es una medida de la "intensidad" de la relación entre las características observadas :
\chi^2=\sum_{i=1}^k \sum_{j=1}^m \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}
El valor informativo del coeficiente \chi ^2 es reducido debido a que su límite superior, es decir, el valor que asume en el caso de la completa dependencia de las características observadas es dependiente de la magnitud (dimensión) de la tabla de contingencia (es decir de la cantidad de valores posibles de las variables) y del tamaño del universo estudiado n. No está dada entonces la factibilidad de la comparación de valores del coeficiente \chi^2 sobre diferentes tablas de contingencia y tamaños muestrales.1 2 En el caso de la completa independencia de las características, \chi^2=0.
Rige que:3
0 \leq \chi^2 \leq n \cdot \min\{k-1,m-1\}
siendo k\, el número de filas y m\, el número de columnas de la tabla de contingencia.
Usos[editar]
El valor de \chi^2 se necesita para determinar el coeficiente de contingencia C. En las pruebas de significación estadística también se utiliza el valor de \chi^2 (véase Prueba de Chi cuadrado).
Ejemplo[editar]
Sea la siguiente una tabla de contingencia proveniente de una encuesta:
automóvil tipo sedán automóvil tipo familiar Totales
Obreros 19 18 37
Empleados 43 20 63
Totales 62 38 100
Cálculo del coeficiente \chi^2:
\frac{(19 -\frac{37 * 62}{100})^2}{\frac{37 * 62}{100}} + \frac{(18 -\frac{37 * 38}{100})^2}{\frac{37 * 38}{100}} + \frac{(43 -\frac{63 * 62}{100})^2}{\frac{63 * 62}{100}} + \frac{(20 -\frac{63 * 38}{100})^2}{\frac{63 * 38}{100}} = 2{,}83
Contingencia cuadrática media[editar]
Otra medida para especificar la intensidad de la dependencia de las características en una tabla de contingencia es la contingencia cuadrática media, que en lo esencial representa una ampliación del coeficiente \chi ^2:
\frac{\chi^2}{n}=\frac{1}{n} \sum_{i=1}^k \sum_{j=1}^m \frac{(h_{i,j} -\frac{h_i. h._j}{n})^2}{\frac{h_i. h._j}{n}}
Cuanto mayor es esta medida, tanto más intensa es la relación entre las dos características analizadas. Si ambas características (variables) son independientes, entonces cada uno de los sumandos se hace 0, a consecuencia de que se hace 0 el numerador de la fracción y con ello la medida misma también. En el caso de una tabla de contingencia de 2x2 la medida está normada y asume valores en el intervalo [0,1].
Coeficiente de contingencia de Karl Pearson[editar]
\chi ^2 puede asumir valores en principio muy grandes y no está limitado al intervalo [0,1]. Para excluir la dependencia del coeficiente de contingencia del tamaño de la muestra, se calcula en base a \chi ^2 el coeficiente de contingencia C (también denominado CC o K) de Karl Pearson:
C=\sqrt{\frac{\chi ^2}{\chi^2 + n}}.
donde n es el tamaño de la muestra.
Este puede asumir valores en el intervalo [0,1). Resulta problemático que el límite superior del coeficiente de contingencia C sea dependiente del número de las dimensiones observadas:4
Aquí
...