Importancia De Chi Cuadrada
Enviado por erickcdt • 28 de Octubre de 2013 • 1.590 Palabras (7 Páginas) • 2.315 Visitas
DISTRIBUCIÓN CHI2 CUADRADO DE PEARSON
Si (X1,X2,...,Xn) son n variables aleatorias normales independientes de media 0 y varianza 1, la variable definida como
se dice que tiene una distribución CHI con n grados de libertad. Su función de densidad es
siendo la función gamma de Euler, con P>0. La función de distribución viene dada por
La media de esta distribución es E(X)=n y su varianza V(X)=2n. Esta distribución es básica en un determinado número de pruebas no paramétricas.
Si consideramos una variable aleatoria Z~N(0,1), la variable aleatoria X=Z2 se distribuye según una ley de probabilidad distribución CHI con un grado de libertad
Si tenemos n variable aleatoria independientes Zi~N(0,1), la suma de sus cuadrados respectivos es una distribución CHI con n grados de libertad,
La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n
Ejemplo, El espesor de un semiconductor se controla mediante la variación estándar no mayor a =0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades, y se considera que el sistema está fuera de control cuando la probabilidad de que 2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?
Solución. Existe fuera de control si con n=20 y =0.60, excede
Entonces,
Por tanto, el sistema está fuera de control
La función de distribución CHI tienen importantes variaciones de acuerdo con los grados de libertad y del tamaño muestral (menor tamaño muestral y mayor tamaño muestral respectivamente),
En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada
, se tiene
La distribución Chi muestra su importancia cuando queremos determinar la variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central siguiendo un mecanismo normal.
Teorema (Cochran). Sean X1,…,Xn con distribución N(,), la variable aleatoria independiente, entonces
La función Chi-cuadrado es igual a la función normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribución de Chi-cuadrado. Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, y se le calcula el estadígrafo χ2 usando el valor muestral de la varianza y el poblacional con:
Esta función matemática está caracterizada por el valor del número de grados de libertad υ=n-1 (donde n es el tamaño muestral). Al igual que la t-Student, el valor total del área bajo la curva es igual a la unidad, pero la diferencia principal es que esta no es simétrica respecto al origen, sino que se extiende desde 0 hasta + ∞ porque no puede ser negativa.
A medida que los grados de libertad aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadísticas, donde se muestran los valores del área bajo la curva, para los principales valores de χ2, a la derecha de éste. O sea, se muestra la zona de rechazo para diferentes niveles de significación y de grados de libertad, lo cuales varían entre 1 y 100. Más allá, conviene usar directamente la función de Gauss.
Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significación, parecida a la de Gauss. El problema de calcular los valores críticos, para un nivel de confianza dado, se resuelve de dos maneras: usando computadoras para resolver los cálculos, y la otra más común, usando tablas resumidas, en forma análoga a la vista para el modelo de t-Student. La distribución de χ2 se usa principalmente para analizar dispersiones. Se compara la dispersión muestral expresada a través de sus cuadrados medios contra la dispersión poblacional cuantificada a través de la varianza (σ2).
Existen otros criterios, como el de Thonks, que usa un error relativo admisible máximo, y se calcula como un cuarto del rango de los valores normales de referencia, dividido por el valor medio de dicho intervalo (referido a la magnitud clínica en cuestión y expresado en porcentajes). También se emplea a este modelo para realizar la llamada prueba de chi-cuadrado en las comparaciones de frecuencias observadas contra las frecuencias esperadas, con datos de recuento. Más adelante se desarrolla mejor este tema, lo mismo que su so para testear la independencia de dos o más factores en una Tabla de Contingencia.
En la industria farmacéutica se la usa para analizar la dispersión de los componentes de los productos terminados. Todo remedio fabricado debe cumplir estrictas normas de calidad, generalmente referidas al contenido en peso de sus principales componentes. Se usan dos límites: el superior e inferior, dentro de los cuales se los debe mantener controlados. Este rango de valores define la dispersión máxima admisible y lo ideal es que la dispersión de los productos terminados sea bastante inferior a dicho rango. Ese control de la dispersión es muy similar al explicado más arriba, para los bioquímicos.
...