Unidad 1 De Estadistica 2
Enviado por keylasaucedo • 2 de Enero de 2013 • 1.601 Palabras (7 Páginas) • 1.199 Visitas
1.1 Modelo de Regresión Simple
Modelos de Regresión
Un modelo de regresión, es una manera de expresar dos ingredientes esenciales de una relación estadística:
- Una tendencia de la variable dependiente Y a variar conjuntamente con la variación de la o las X de una manera sistemática
- Una dispersión de las observaciones alrededor de la curva de relación estadística
Estas dos características están implícitas en un modelo de regresión, postulando que:
- En la población de observaciones asociadas con el proceso que fue muestreado, hay una distribución de probabilidades de Y para cada nivel de X.
- Las medias de estas distribuciones varían de manera sistemática al variar X.
Representación gráfica del modelo de Regresión Lineal
Nota: en esta figura se muestran las distribuciones de probabilidades de Y para distintos valores de X
Análisis de Regresión
• Objetivo: determinar la ecuación de regresión para predecir los valores de la variable dependiente (Y) en base a la o las variables independientes (X).
• Procedimiento: seleccionar una muestra a partir de la población, listar pares de datos para cada observación; dibujar un diagrama de puntos para dar una imagen visual de la relación; determinar la ecuación de regresión.
Supuestos de Regresión Lineal Clásica
• Cada error está normalmente distribuido con:
- Esperanza de los errores igual a 0
- Variancia de los errores igual a una constante σ².
- Covariancia de los errores nulas para todo i ≠ Ψ
1.2 Supuestos.
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:
1. La relación entre las variables es lineal.
2. Los errores en la medición de las variables explicativas son independientes entre sí.
3. Los errores tienen varianza constante. (Homocedasticidad)
4. Los errores tienen una esperanza matemática igual a cero (los errores de una misma magnitud y distinto signo son equiprobables).
5. El error total es la suma de todos los errores.
1.3 Determinación de la ecuación de regresión.
Proceso de estimación de la regresión lineal simple
Modelo de regresión
y = β0+ β1x + ε
Ecuación de regresión
E(y) = β0+ β1x
Parámetros desconocidos
β0.β1 Datos de la muestra
x y
x1
x2
.
.
.
xn y1
y2
.
.
.
yn
b0 y b1
proporcionan estimados
β0 y β1 Ecuación estimada de regresión
y = b0+b1x
Estadísticos de la muestra
b0.b1
Líneas posibles de regresión en la regresión lineal simple
Sección A
Relación lineal positiva
Sección C
No hay relación
Sección B
Relación lineal negativa
Estimación de la ecuación de Regresión Simple
Y´ = a + b.X, donde:
- Y´ es el valor estimado de Y para distintos X.
- a es la intersección o el valor estimado de Y cuando X=0
- b es la pendiente de la línea, o el cambio promedio de Y´ para cada cambio en una unidad de X
- el principio de mínimos cuadrados es usado para obtener a y b:
a = (∑Y)/n - b.(∑X)/n
Mínimos cuadrados - Supuestos
El modelo de regresión es lineal en los parámetros.
Los valores de X son fijos en muestreo repetido.
El valor medio de la perturbación εi es igual a cero.
Homocedasticidad o igual variancia de εi.
No autocorrelación entre las perturbaciones.
La covariancia entre εi y Xi es cero.
El número de observaciones n debe ser mayor que el número de parámetros a estimar.
Variabilidad en los valores de X.
El modelo de regresión está correctamente especificado.
No hay relaciones lineales perfectas entre las explicativas.
1.4 Medidas de Variación
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Estimación de la variancia de los términos del error (σ²)
Debe ser estimada por varios motivos
Para tener una indicación de la variabilidad de las distribuciones de probabilidad de Y.
Para realizar inferencias con respecto a la función de regresión y la predicción de Y.
La lógica del desarrollo de un estimador de σ² para el modelo de regresión es la misma que cuando se muestrea una sola población
La variancia de cada observación Yi es σ²,la misma que la de cada término del error
Dado que los Yi provienen de diferentes distribuciones de probabilidades con medias diferentes que dependen del nivel de X, la desviación de una observación Yi debe
...