PRUEBAS DE BONDAD DE AJUSTE
angel148644Tarea11 de Junio de 2014
1.272 Palabras (6 Páginas)363 Visitas
PRUEBAS DE BONDAD DE AJUSTE
Estas pruebas permiten verificar que la población de la cual provieneuna muestra tiene una
distribución especificada o supuesta.
Sea X: variable aleatoria poblacional
f
0
(x) la distribución (o densidad) de probabilidad especificada o supuesta para X
Se desea probar la hipótesis:
Ho: f(x) = f0
(x)
En contraste con la hipótesis alterna:
Ha: f(x) no= f0
(x) (negación de Ho)
PRUEBA JI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas.
Sea una muestra aleatoria de tamaño ntomada de una población con una distribución especificada
f
0
(x) que es de interés verificar.
Suponer que las observaciones de la muestra están agrupadas en kclases, siendo o
i
la cantidad de
observaciones en cada clase i = 1, 2, ..., k
Con el modelo especificado f
0
(x)se puede calcular la probabilidad pi
que un dato cualquiera
pertenezca a una clase i.
Con este valor de probabilidad se puede encontrar la frecuencia esperada e
i
para la clase i, es
decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i:
e
i= pi
n, i = 1, 2, ..., k
Tenemos entonces dos valores de frecuencia para cada clase i
o
i
: frecuencia observada (corresponde a los datos de la muestra)
e
i
: frecuencia esperada (corresponde al modelo propuesto)
La teoría estadística demuestra que la siguiente variable esapropiada para realizar una prueba de
bondad de ajuste:
Definición
Estadístico para la prueba de bondad de ajuste Ji-cuadrado
χ χχ χ
2
= ∑
=
−
k
1 i
i
2
i i
e
e o ) (
,distribución Ji-cuadradocon ν νν ν=k–r–1grados de libertad
donde r es la cantidad de parámetros de la distribución que deben estimarse a partir de la muestra
Es una condición necesaria para aplicar esta prueba que ∀ ∀∀ ∀i, ei ≥ ≥≥ ≥5 .
Dado un nivel de significancia α αα αse define un valor crítico
2
α αα α
χ χχ χ para el rechazo de la hipótesis
propuesta Ho: f(x) = f0
(x).
Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas
con el modelo propuesto, entonces el valor de estadístico de prueba χ χχ χ
2
será cercano a cero, pero si
estas diferencias son significativas, entonces el valor del estadístico χ χχ χ
2
estará en la región de rechazo
de Ho
2 2
0
H rechazo
α
χ χ > ⇔ :
Región de rechazo de Ho
Ejemplo
Se ha tomado una muestra aleatoria de 40 baterías yse ha registrado su duración en años. Estos
resultados se los ha agrupado en 7 clases en el siguiente cuadro
i clase (duración) frecuencia observada (oi
)
1 1.45 – 1.95 2
2 1.95 – 2.45 1
3 2.45 – 2.95 4
4 2.95 – 3.45 15
5 3.45 – 3.95 10
6 3.95 – 4.45 5
7 4.45 – 4.95 3
Verificar con 5% de significancia que la duración en años de las baterías producidas por este
fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7
Solución
Sea X: duración en años (variable aleatoria contínua)
1) Ho: ) . , . ( ~ 7 0 5 3 N X (distribución normal, µ=3.5, σ=0.7)
2) Ha: no H0
3) α αα α= 0.05
Cálculo de la probabilidad correspondiente a cada intervalo
p
1= P(X≤1.95) = P(Z≤(1.95 – 3.5)/0.7) = 0.0136
p
2
= P(1.95≤X≤2.45) = P((1.95 – 3.5)/0.7 ≤Z≤(2.45 – 3.5)/0.7) = 0.0532
p
3
= P(2.45≤X≤2.95) = P((2.45 – 3.5)/0.7 ≤Z≤(2.95 – 3.5)/0.7) = 0.135
... (etc)
Cálculo de las frecuencias esperadas
e
1
= p1
n = 0.0136 (40) ≈0.5
e
2
= p2
n = 0.0532 (40) ≈2.1
e
3
= p3
n = 0.135 (40) ≈5.4
... (etc)
Resumen de resultados
duración (años) frecuencia observada (oi
) frecuencia esperada (ei
)
1.45 – 1.95 2 0.5
1.95 – 2.45 1 2.1
2.45 – 2.95 4 5.4
2.95 – 3.45 15 10.3 Ojo con el redondeo,
3.45 – 3.95 10 10.7 la suma debe ser n =40
3.95 – 4.45 5 7
4.45 – 4.95 3 3.5
Es necesario que se cumpla la condición ∀ ∀∀
...