La bondad de ajuste de un modelo estadístico
Enviado por Luiz11 • 30 de Junio de 2015 • Ensayo • 2.391 Palabras (10 Páginas) • 516 Visitas
La bondad de ajuste de un modelo estadístico describe lo bien que se ajusta un conjunto de observaciones. Las medidas de bondad en general resumen la discrepancia entre los valores observados y los k valores esperados en el modelo de estudio. Tales medidas se pueden emplear en el contraste de hipótesis, EJ. El test de normalidad de los residuos, comprobar si dos muestras se obtienen a partir de dos distribuciones idénticas (test de Kolmogorov-Smirnov), o si las frecuencias siguen una distribución específica (chi cuadrado).
Recién en 1999 surgió la primera prueba de ajuste, a partir de la cual los científicos pudieron poner a prueba sus modelos e incluso seleccionar entre varios modelos propuestos para un mismo fenómenos, cuáles con adecuados y cuáles no lo son. Esa primera prueba es la llamada prueba χ2 de Pearson.
Pearson propuso evaluar el ajuste de una función de distribución F0 a una muestra de variables i.i.d., mediante el uso de un estadístico de tipo cuadrático. Este planteamiento constituye la primera evaluación rigurosa de la calidad del ajuste a una distribución. Anteriormente a Pearson solo se intentaron comparaciones subjetivas.
Dadas las observaciones (X1,. . ., Xn) independientes, con distribución F, deseamos probar la hipótesis nula H0: “F = F0”. En principio, la hipótesis alternativa será H: “F ≠ F0”, pero es posible que dentro de esta alternativa múltiple haya algunas distribuciones para las que nos interese especialmente que la prueba tenga una buena potencia. La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución supuesta. Si se desea examinar otra distribución específica, deberá realizarse de nuevo la otra prueba suponiendo que la hipótesis nula es esta nueva distribución. Al especificar la hipótesis nula, el conjunto de parámetros definidos por que puede ser conocido o desconocido. En caso de que los parámetros sean desconocidos, es necesario estimarlos mediante alguno de los métodos de estimación analizados con anterioridad.
Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos o criterios:
a) La naturaleza de los datos a analizar. Por ejemplo, si tratamos de investigar la distribución que siguen los tiempos de falla de unos componentes, podríamos pensar en una distribución exponencial, o una distribución gama o una distribución Weibull, pero en principio no consideraríamos una distribución normal. Si estamos analizando los caudales de un río en un determinado sitio, podríamos pensar en una distribución logarítmica normal, pero no en una distribución normal.
b) Histograma. La forma que tome el histograma de frecuencia es quizás la mejor indicación del tipo de distribución a considerar. (Llinás Solano, 2006)
IN12110033 INDUSTRIAL 6A SIM PBAMONTECARLO 3
PRUEBA ANDERSON DARLING La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribución especifica. Esta prueba es una modificación de la prueba de Kolmogorov- Smirnov donde se le da más peso a las colas de la distribución que la prueba de Kolmogorov-Smirnov.
En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre si los datos de una muestra provienen de una distribución específica. La fórmula para el estadístico determina si los datos (observar que los datos se deben ordenar) vienen de una distribución con función acumulativa F. (Marquez dos Santos)
Ilustración 1 Formulas y Estadístico de prueba para la prueba ANDERSON-DARLING
Donde:
n es el número de datos
F(x): es la función de distribución de probabilidad teórica
FS(X): es la función de distribución empírica.
Para definir la regla de rechazo para esta prueba es necesario, también, obtener el estadístico ajustado para luego compararlo con los valores críticos de la tabla de Anderson- Darling.
IN12110033 INDUSTRIAL 6A SIM PBAMONTECARLO 4
Ilustración 2 Tabla de valores críticos para la prueba ANDERSN-DARLING
Una vez obtenido el estadístico ajustado, la regla de rechazo se realiza análogamente a la utilizada en la prueba de K-S.
El estadístico de la prueba se puede entonces comparar contra las distribuciones del estadístico de prueba (dependiendo que F se utiliza) para determinar el P- valor. (Marquez dos Santos)
IN12110033 INDUSTRIAL 6A SIM PBAMONTECARLO 5
CHI-CUADRADO La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relación entre dos variables categóricas. Es necesario resaltar que esta prueba nos indica si existe o no una relación entre las variables, pero no indica el grado o el tipo de relación; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. (Carolina, 2015)
Propiedades de la Distribución Chi-cuadrado
1. Los valores de X2 son mayores o iguales que 0.
2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).
La distribución chi-cuadrado es
...