ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Prueba De Significancia Regresionsimple


Enviado por   •  31 de Mayo de 2015  •  2.498 Palabras (10 Páginas)  •  826 Visitas

Página 1 de 10

En una ecuación de regresión lineal simple, la media o valor esperado de y es una función lineal de x: E(y) = β0 + β1x. Pero si el valor de β1 es cero, E(y) = β0 + (0)x = β0. En este caso, el valor medio de y no depende del valor de x y por lo tanto se puede concluir que x y y no están relacionadas linealmente. Pero si el valor de β1 es distinto de cero, se concluirá que las dos variables están relacionadas. Por lo tanto, para probar si existe una relación de regresión significante, se debe realizar una prueba de hipótesis para determinar si el valor de β1 es distinto de cero. Hay dos pruebas que son las más usadas. En ambas, se requiere una estimación de σ2, la varianza de ϵ en el modelo de regresión.

Estimación de σ2

De acuerdo con el modelo de regresión y con sus suposiciones, se puede concluir que σ2, la varianza de ϵ, representa también la varianza de los valores de y respecto a la recta de regresión. Recuérdese que a las desviaciones de los valores de y de la recta de regresión estimada se les conoce como residuales. Por lo tanto, SCE, la suma de los cuadrados de los residuales, es una medida de la variabilidad de las observaciones reales respecto a la línea de regresión estimada. El error cuadrado medio (ECM) proporciona una estimación de σ2; esta estimación es SCE dividida entre sus grados de libertad.

Como ŷi = b0 + b1xi, SCE se puede expresar como

A cada suma de cuadrados le corresponde un número llamado sus grados de libertad. Se ha demostrado que SCE tiene n ‒ 2 grados de libertad porque para calcular SCE es necesario estimar dos parámetros (β0 y β1). Por lo tanto, el cuadrado medio se calcula dividiendo SCE entre n ‒ 2. ECM proporciona un estimador insesgado de σ2. Como el valor del ECM proporciona un estimado de σ2, se emplea también la notación s2.

Se encontró que en el ejemplo de Armand’s Pizza Parlors, SCE = 1530; por lo tanto,

es un estimador insesgado de σ2.

Para estimar σ se saca la raíz cuadrada de s2. Al valor que se obtiene, s, se le conoce como el error estándar de estimación.

En el ejemplo de Armand’s Pizza Parlors, s = √ECM = √191.25 = 13.829. El error estándar de estimación se emplea en la discusión siguiente acerca de las pruebas de significancia de la relación entre x y y.

Prueba t

El modelo de regresión lineal simple es y = β0 + β1x + ϵ. Si x y y están relacionadas linealmente, entonces β1 ≠ 0. El objetivo de la prueba t es determinar si se puede concluir que β1 ≠ 0. Para probar la hipótesis siguiente acerca del parámetro β1, se emplearán los datos muestrales.

H0: β = 0

Ha: β ≠ 0

Si se rechaza H0, se concluirá que β1 ≠ 0 y que entre las dos variables existe una relación estadísticamente significante. La base para esta prueba de hipótesis la proporcionan las propiedades de la distribución muestral de b1, el estimador de β1, obtenido mediante el método de mínimos cuadrados.

Primero, considérese que es lo que ocurriría si para el mismo estudio de regresión se usara otra muestra aleatoria simple. Supóngase, por ejemplo, que Armand’s Pizza Parlors usa una muestra de las ventas de otros 10 restaurantes. El análisis de regresión de esta otra muestra dará como resultado una ecuación de regresión parecida a la ecuación de regresión anterior ŷ= 60 + 5x. Sin embargo, no puede esperarse que se obtenga exactamente la misma ecuación (una ecuación en la que la intersección con el eje y sea exactamente 60 y la pendiente sea exactamente 5). Los estimadores b0 y b1, obtenidos por el método de mínimos cuadrados, son estadísticos muestrales que tienen su propia distribución muestral. A continuación se presentan las propiedades de la distribución muestral de b1.

Obsérvese que el valor esperado de b1 es β1, por lo que b1 es un estimador insesgado de β1. Como no se conoce el valor de σ, se obtiene una estimación de σb1, que se denota, estimando σ mediante s en la ecuación anterior. De esta manera se obtiene el estimador siguiente de σb1.

En el ejemplo de Armand’s Pizza Parlors, s = 13.829. Por lo tanto, dado que ∑(xi ‒ )2 = 568 como se muestra en la tabla 14.2, se tiene que

Es la desviación estándar estimada de b1.

La prueba t para determinar si la relación es significativa se basa en el hecho de que el estadístico de prueba

sigue una distribución t con n ‒ 2 grados de libertad. Si la hipótesis nula es verdadera, entonces β1 = 0 y t = b1/sb1.

Ahora se realizará esta prueba de significancia con los datos de Armand’s Pizza Parlors, empleando como nivel de significancia α = 0.01. El estadístico de prueba es

En las tablas de la distribución t se encuentra que para n ‒ 2 = 10 ‒ 2 = 8 grados de libertad, t = 3.355 da un área de 0.005 en la cola superior. Por lo tanto, el área en la cola superior de la distribución t correspondiente al valor del estadístico de prueba t = 8.62 debe ser menor a 0.005. Como esta prueba es una prueba de dos colas, este valor se duplica y se concluye que el valor-p para t = 8.62 debe ser menor a 2(0.005) = 0.01. Empleando Excel o Minitab se encuentra valor-p = 0.000. Dado que el valor-p es menor a α = 0.01 se rechaza H0 y se concluye que β1 no es igual a cero. Esto es suficiente evidencia para concluir que existe una relación significativa entre la población de estudiantes y las ventas trimestrales. A continuación se presenta un resumen de la prueba t de significancia para la regresión lineal simple

Intervalo de confianza para β1

La fórmula para un intervalo de confianza para β1 es la siguiente:

El estimador puntual es b1 y el margen de error es tα/2sb1. El coeficiente de confianza para este intervalo es 1 ‒ α y tα/2 es el valor t que proporciona un área α/2 en la cola superior de la distribución t con n ‒ 2 grados de libertad. Supóngase, por ejemplo, que en el caso de Armand’s Pizza Parlors se desea obtener una estimación de β1 mediante un intervalo de 99% de confianza. En la tabla 2 del apéndice B se encuentra que el valor t correspondiente a α = 0.01 y n ‒ 2 = 10 – 2 = 8 grados de libertad es t0.005 = 3.355. Por lo tanto, la estimación mediante un intervalo de 99% de confianza es

o el intervalo que va de 3.05 a 6.95.

Al emplear la prueba t de significancia la hipótesis probada fue

H0: β = 0

Ha: β ≠ 0

Empleando α = 0.01 como nivel de significancia, se puede usar el intervalo de 99% de confianza como alternativa para llegar a la conclusión de la prueba de hipótesis que se obtiene con los datos de Armand’s. Como 0, que es el valor hipotético de β1,

...

Descargar como (para miembros actualizados) txt (14 Kb)
Leer 9 páginas más »
Disponible sólo en Clubensayos.com