Regresion Lineal, Análisis Bajo.
Enviado por csalazar.s • 18 de Septiembre de 2014 • 2.609 Palabras (11 Páginas) • 387 Visitas
Estadística y métodos numéricos aplicados a las finanzas
ANÁLISIS DE REGRESIÓN
El análisis de regresión es un proceso estadístico para relacionar variables. La regresión lineal es un método matemático que modela una variable dependiente (y) relacionada con varias variables independientes (xi) y un término aleatorio .
MODELO DE REGRESIÓN LINEAL MÚLTIPLE – (MRLM)
Este modelo une a la teoría económica, la estadística, y la matemática para establecer relaciones entre una variable dependiente llamada “y” y dos o más variables explicativas llamadas “x”, con el fin establecer un predicción o en su defecto el impacto que tienen las variables explicativas sobre la variable explicada. A la variable dependiente y, también se le llama: regresando, explicada, predicha o endógena) y las variables independientes, también se le conoce como: Regresores, explicativas, predictoras o exógenos).
Uriel y Aldás (2005), nos dice que el MRLM es uno de los más conocidos y aplicados del análisis multivariante y constituye el núcleo en el cual se ha desarrollado la econometría.
La variable respuesta es de tipo cuantitativa y las variables explicativas deben ser cuantitativas y/o categóricas (en situaciones especiales). (Sifuentes, V 2002)
VENTAJAS DEL MRLM
Nos permite encontrar el efecto combinado de dos o más variables sobre una variable que es explicada. Además nos permite conocer la relación de una sola explicativa (x) sobre la explicada (y), dejando todo lo demás constantes. En economía y en administración este concepto se llama CETERIS PARIBUS.
MODELO ESTADÍSTICO DE LA REGRESIÓN LINEAL MÚLTIPLE
y = es la variable aleatoria cuantitativa para el i-ésimo objeto.
, son los parámetros desconocidos. Donde es el término independiente. y Siendo “p” el número de de variables independientes.
, es la perturbación aleatoria (ruido blanco), se supone tiene distribución normal, con media 0. Es decir y varianza constante. .
En la práctica los valores de los parámetros generalmente no se conocen, en ese sentido tendrían que estimarse a partir de datos muestrales.
ECUACION DE REGRESION MÚLTIPLE ESTIMADA
Son los valores estimados de la variable aleatoria dependiente “y”
Entonces los valores de los estadísticos muestrales son los estimadores de .
Para el caso particular de dos variables independientes, la línea de regresión múltiple estimada sería:
En este caso el cálculo de b0, b1 y b3 es similar cuando se trabajaba con un modelo de regresión lineal simple donde se tenía una variable independiente.
MÉTODO DE MÍNIMOS CUADRADOS
En el tema anterior de regresión lineal simple, para estimar los parámetros se usó el método de mínimos cuadrados ordinarios, que permitió minimizar la expresión siguiente: CRITERIO DE MÍNIMOS CUADRADOS
Como se dijo a se le llama error aleatorio, es la diferencia entre el valor observado ( ) menos el valor esperado ( ). Esta es una distancia entre ambos valores y puede ser negativa o positiva. Para hacer estudios inferenciales de regresión el error debe tener las siguientes propiedades:
La primera propiedad indica que en promedio los errores es igual a cero, la segunda que las varianza de cada error, para un conjunto de variables “x” determinado son constantes (homocedástico) y la tercera que es que debe existir incorrelación entre los errores. (Sifuentes, 2002).
En regresión lineal simple se trabaja con conjuntos de datos relativamente pequeños, ahí fue posible usar las fórmulas para obtener mediante cálculos manuales.
En la regresión múltiple, las fórmulas para los coeficientes de regresión
, se utiliza el álgebra matricial y se obtiene los resultados manualmente luego de un proceso no muy rápido; este no es el objetivo del presente capítulo el uso de estas fórmulas. Para la estimación de dichos parámetros se utilizará el paquete estadístico SPSS en cualquier versión.
Solo para ilustrar, si son dos las variables independientes, entonces las tres ecuaciones normales son:
Que luego resolviendo el sistema de tres ecuaciones, se determina los valores de .
COEFICIENTE DE CORRELACIÓN MÚLTIPLE Y COEFICIENTE DE DETERMINACIÓN MÚLTIPLE
Al igual de determinación simple, el coeficiente de determinación múltiple R2, mide el porcentaje de la varianza de y que queda explicada al conocer dos o más variables independientes. Cuanto mayor es R2, mayor es el ajuste del plano de regresión y menor es la dispersión de los datos.
El coeficiente de regresión múltiple se puede definir de manera general como la raíz cuadrada de la suma de los cuadrados explicados sobre la suma de los cuadrados totales.
O
Donde:
SCR = Suma de cuadrados debido a la regresión
SCT = Suma de cuadrados totales
SCE = Suma de cuadrados debido a los errores
EJEMPLO 01:
Una empresa comercializadora de fotocopiadoras realiza ventas por teléfono a diversas empresas, para ello cuenta con representantes de ventas. En la siguiente tabla se muestra el número de llamadas realizadas en un día a sus potenciales clientes y el número de fotocopiadoras vendidas al día, además los años de experiencia de cada representante.
Con estos datos tridimensionales, determina la línea de regresión múltiple de y sobre x1 y x2 y el coeficiente de correlación múltiple
SOLUCIÓN:
Reemplazando valores en las tres ecuaciones normales:
Tenemos el sistema de ecuaciones normales de mínimos cuadrados:
57 = 8b0 + 153b1 + 26b2
1171 = 153b0 + 3103b1 + 527b2
203 = 26b0 + 527b1 + 92b2
Resolviendo el sistema de ecuaciones lineales en el MATLAB o en el R, tenemos:
b0 = -1,675 b1 = 0,178 b2 = 1,661
Reemplazando valores en la línea de regresión tenemos:
INTERPRETACIONES:
Las interpretaciones que se dan en un modelo de regresión lineal múltiple difiere a lo visto en la regresión lineal simple, debido a la inclusión de una mayor cantidad de variables.
En este tipo de análisis de regresión múltiple la interpretación es de la siguiente manera:
bi : Representa la estimación del cambio en “y” debido a un cambio en una unidad de xi, mientras todas las demás variables
...