PRUEBAS DE BONDAD DE AJUSTE
Enviado por angel148644 • 11 de Junio de 2014 • Tarea • 1.272 Palabras (6 Páginas) • 320 Visitas
PRUEBAS DE BONDAD DE AJUSTE
Estas pruebas permiten verificar que la población de la cual provieneuna muestra tiene una
distribución especificada o supuesta.
Sea X: variable aleatoria poblacional
f
0
(x) la distribución (o densidad) de probabilidad especificada o supuesta para X
Se desea probar la hipótesis:
Ho: f(x) = f0
(x)
En contraste con la hipótesis alterna:
Ha: f(x) no= f0
(x) (negación de Ho)
PRUEBA JI-CUADRADO
Esta prueba es aplicable para variables aleatorias discretas o continuas.
Sea una muestra aleatoria de tamaño ntomada de una población con una distribución especificada
f
0
(x) que es de interés verificar.
Suponer que las observaciones de la muestra están agrupadas en kclases, siendo o
i
la cantidad de
observaciones en cada clase i = 1, 2, ..., k
Con el modelo especificado f
0
(x)se puede calcular la probabilidad pi
que un dato cualquiera
pertenezca a una clase i.
Con este valor de probabilidad se puede encontrar la frecuencia esperada e
i
para la clase i, es
decir, la cantidad de datos que según el modelo especificado deberían estar incluidos en la clase i:
e
i= pi
n, i = 1, 2, ..., k
Tenemos entonces dos valores de frecuencia para cada clase i
o
i
: frecuencia observada (corresponde a los datos de la muestra)
e
i
: frecuencia esperada (corresponde al modelo propuesto)
La teoría estadística demuestra que la siguiente variable esapropiada para realizar una prueba de
bondad de ajuste:
Definición
Estadístico para la prueba de bondad de ajuste Ji-cuadrado
χ χχ χ
2
= ∑
=
−
k
1 i
i
2
i i
e
e o ) (
,distribución Ji-cuadradocon ν νν ν=k–r–1grados de libertad
donde r es la cantidad de parámetros de la distribución que deben estimarse a partir de la muestra
Es una condición necesaria para aplicar esta prueba que ∀ ∀∀ ∀i, ei ≥ ≥≥ ≥5 .
Dado un nivel de significancia α αα αse define un valor crítico
2
α αα α
χ χχ χ para el rechazo de la hipótesis
propuesta Ho: f(x) = f0
(x).
Si las frecuencias observadas no difieren significativamente de las frecuencias esperadas calculadas
con el modelo propuesto, entonces el valor de estadístico de prueba χ χχ χ
2
será cercano a cero, pero si
estas diferencias son significativas, entonces el valor del estadístico χ χχ χ
2
estará en la región de rechazo
de Ho
2 2
0
H rechazo
α
χ χ > ⇔ :
Región de rechazo de Ho
Ejemplo
Se ha tomado una muestra aleatoria de 40 baterías yse ha registrado su duración en años. Estos
resultados se los ha agrupado en 7 clases en el siguiente cuadro
i clase (duración) frecuencia observada (oi
)
1 1.45 – 1.95 2
2 1.95 – 2.45 1
3 2.45 – 2.95 4
4 2.95 – 3.45 15
5 3.45 – 3.95 10
6 3.95 – 4.45 5
7 4.45 – 4.95 3
Verificar con 5% de significancia que la duración en años de las baterías producidas por este
fabricante tiene duración distribuida normalmente con media 3.5 y desviación estándar 0.7
Solución
Sea X: duración en años (variable aleatoria contínua)
1) Ho: ) . , . ( ~ 7 0 5 3 N X (distribución normal, µ=3.5, σ=0.7)
2) Ha: no H0
3) α αα α= 0.05
Cálculo de la probabilidad correspondiente a cada intervalo
p
1= P(X≤1.95) = P(Z≤(1.95 – 3.5)/0.7) = 0.0136
p
2
= P(1.95≤X≤2.45) = P((1.95 – 3.5)/0.7 ≤Z≤(2.45 – 3.5)/0.7) = 0.0532
p
3
= P(2.45≤X≤2.95) = P((2.45 – 3.5)/0.7 ≤Z≤(2.95 – 3.5)/0.7) = 0.135
... (etc)
Cálculo de las frecuencias esperadas
e
1
= p1
n = 0.0136 (40) ≈0.5
e
2
= p2
n = 0.0532 (40) ≈2.1
e
3
= p3
n = 0.135 (40) ≈5.4
... (etc)
Resumen de resultados
duración (años) frecuencia observada (oi
) frecuencia esperada (ei
)
1.45 – 1.95 2 0.5
1.95 – 2.45 1 2.1
2.45 – 2.95 4 5.4
2.95 – 3.45 15 10.3 Ojo con el redondeo,
3.45 – 3.95 10 10.7 la suma debe ser n =40
3.95 – 4.45 5 7
4.45 – 4.95 3 3.5
Es necesario que se cumpla la condición ∀ ∀∀
...