REGRESION LINEAL
Enviado por HectorValero77 • 18 de Noviembre de 2014 • 881 Palabras (4 Páginas) • 164 Visitas
Probabilidad y Estadística
5.3 Regresión y correlación.
Cuando se tiene una variable, llamada dependiente, cuyos resultados son un valor promedio de una función de una o mas variables no aleatorias, llamadas independientes (el concepto de independencia y dependencia se establece en términos matemáticos, no probabilístico), se tiene que recurrir a un tipo de técnicas que permitan modelar esta situación.
Existen dos formas de obtener estos modelos: funciones determinísticas, y funciones probabilísticas, nuestro interés es sobre estos últimos. Aunque para fines prácticos, si el error es despreciable se deben de usar los determinísticos, pero si se quiere estimar el error se deben usar los probabilísticos, a pesar de que no representen exactamente a la realidad.
Si la función es de tipo lineal, en la cual el exponente de las variables independientes no es mayor de uno, el modelo se denomina de regresión lineal, si no es el caso entra en lo que se denomina superficies de respuesta.
Si solo existe una variable independiente se llama simple y si son dos o más variables independientes se les llama múltiple.
MODELO DE REGRESIÓN LINEAL SIMPLE
Cuando se busca un modelo en el cual se tiene una sola variable independiente, y esta es una función lineal, el modelo se puede expresar de la forma:
Donde:
ε es el error aleatorio con media cero y la misma varianza de la población, que representa todas las variables que no entran en el modelo, por no poderse incluir a todas y afectar mínimamente a Y, lo que hace que no sea una representación exacta de la realidad.
La técnica que se mostrará a continuación, estima a los parámetros de este modelo usando la técnica que se conoce como mínimos cuadrados. Los supuestos en que se requieren para aplicar esta técnica son:
• La variable dependiente es una variable aleatoria, cuyo valor promedio está determinado por la variable independiente.
• La relación entre las variables dependiente e independiente es lineal.
• Las varianzas de las distribuciones condicionales de la variable dependiente, para diversos valores de la variable independiente, son iguales. Propiedad llamada Homoscedasticidad.
Si se desea realizar estimación por intervalos, se debe cumplir adicionalmente con el supuesto de:
• Las distribuciones condicionales de la variable dependiente, para diversos valores de la variable independiente, son todas distribuciones normales para la población de valores.
Técnica:
1. Dibujar un diagrama de dispersión, el cual permite una primera aproximación para averiguar si se cumplen algunos de los supuestos del modelo.
2. Calcular los valores de los parámetros en base a las fórmulas establecidas al ajustar el modelo por mínimos cuadrados.
3. Realizar los cálculos necesarios para efectuar las inferencias que se deseen (estimación puntual, estimación por intervalos, prueba
...