Regresion Lineal, Análisis Bajo.
csalazar.s18 de Septiembre de 2014
2.609 Palabras (11 Páginas)422 Visitas
Estadística y métodos numéricos aplicados a las finanzas
ANÁLISIS DE REGRESIÓN
El análisis de regresión es un proceso estadístico para relacionar variables. La regresión lineal es un método matemático que modela una variable dependiente (y) relacionada con varias variables independientes (xi) y un término aleatorio .
MODELO DE REGRESIÓN LINEAL MÚLTIPLE – (MRLM)
Este modelo une a la teoría económica, la estadística, y la matemática para establecer relaciones entre una variable dependiente llamada “y” y dos o más variables explicativas llamadas “x”, con el fin establecer un predicción o en su defecto el impacto que tienen las variables explicativas sobre la variable explicada. A la variable dependiente y, también se le llama: regresando, explicada, predicha o endógena) y las variables independientes, también se le conoce como: Regresores, explicativas, predictoras o exógenos).
Uriel y Aldás (2005), nos dice que el MRLM es uno de los más conocidos y aplicados del análisis multivariante y constituye el núcleo en el cual se ha desarrollado la econometría.
La variable respuesta es de tipo cuantitativa y las variables explicativas deben ser cuantitativas y/o categóricas (en situaciones especiales). (Sifuentes, V 2002)
VENTAJAS DEL MRLM
Nos permite encontrar el efecto combinado de dos o más variables sobre una variable que es explicada. Además nos permite conocer la relación de una sola explicativa (x) sobre la explicada (y), dejando todo lo demás constantes. En economía y en administración este concepto se llama CETERIS PARIBUS.
MODELO ESTADÍSTICO DE LA REGRESIÓN LINEAL MÚLTIPLE
y = es la variable aleatoria cuantitativa para el i-ésimo objeto.
, son los parámetros desconocidos. Donde es el término independiente. y Siendo “p” el número de de variables independientes.
, es la perturbación aleatoria (ruido blanco), se supone tiene distribución normal, con media 0. Es decir y varianza constante. .
En la práctica los valores de los parámetros generalmente no se conocen, en ese sentido tendrían que estimarse a partir de datos muestrales.
ECUACION DE REGRESION MÚLTIPLE ESTIMADA
Son los valores estimados de la variable aleatoria dependiente “y”
Entonces los valores de los estadísticos muestrales son los estimadores de .
Para el caso particular de dos variables independientes, la línea de regresión múltiple estimada sería:
En este caso el cálculo de b0, b1 y b3 es similar cuando se trabajaba con un modelo de regresión lineal simple donde se tenía una variable independiente.
MÉTODO DE MÍNIMOS CUADRADOS
En el tema anterior de regresión lineal simple, para estimar los parámetros se usó el método de mínimos cuadrados ordinarios, que permitió minimizar la expresión siguiente: CRITERIO DE MÍNIMOS CUADRADOS
Como se dijo a se le llama error aleatorio, es la diferencia entre el valor observado ( ) menos el valor esperado ( ). Esta es una distancia entre ambos valores y puede ser negativa o positiva. Para hacer estudios inferenciales de regresión el error debe tener las siguientes propiedades:
La primera propiedad indica que en promedio los errores es igual a cero, la segunda que las varianza de cada error, para un conjunto de variables “x” determinado son constantes (homocedástico) y la tercera que es que debe existir incorrelación entre los errores. (Sifuentes, 2002).
En regresión lineal simple se trabaja con conjuntos de datos relativamente pequeños, ahí fue posible usar las fórmulas para obtener mediante cálculos manuales.
En la regresión múltiple, las fórmulas para los coeficientes de regresión
, se utiliza el álgebra matricial y se obtiene los resultados manualmente luego de un proceso no muy rápido; este no es el objetivo del presente capítulo el uso de estas fórmulas. Para la estimación de dichos parámetros se utilizará el paquete estadístico SPSS en cualquier versión.
Solo para ilustrar, si son dos las variables independientes, entonces las tres ecuaciones normales son:
Que luego resolviendo el sistema de tres ecuaciones, se determina los valores de .
COEFICIENTE DE CORRELACIÓN MÚLTIPLE Y COEFICIENTE DE DETERMINACIÓN MÚLTIPLE
Al igual de determinación simple, el coeficiente de determinación múltiple R2, mide el porcentaje de la varianza de y que queda explicada al conocer dos o más variables independientes. Cuanto mayor es R2, mayor es el ajuste del plano de regresión y menor es la dispersión de los datos.
El coeficiente de regresión múltiple se puede definir de manera general como la raíz cuadrada de la suma de los cuadrados explicados sobre la suma de los cuadrados totales.
O
Donde:
SCR = Suma de cuadrados debido a la regresión
SCT = Suma de cuadrados totales
SCE = Suma de cuadrados debido a los errores
EJEMPLO 01:
Una empresa comercializadora de fotocopiadoras realiza ventas por teléfono a diversas empresas, para ello cuenta con representantes de ventas. En la siguiente tabla se muestra el número de llamadas realizadas en un día a sus potenciales clientes y el número de fotocopiadoras vendidas al día, además los años de experiencia de cada representante.
Con estos datos tridimensionales, determina la línea de regresión múltiple de y sobre x1 y x2 y el coeficiente de correlación múltiple
SOLUCIÓN:
Reemplazando valores en las tres ecuaciones normales:
Tenemos el sistema de ecuaciones normales de mínimos cuadrados:
57 = 8b0 + 153b1 + 26b2
1171 = 153b0 + 3103b1 + 527b2
203 = 26b0 + 527b1 + 92b2
Resolviendo el sistema de ecuaciones lineales en el MATLAB o en el R, tenemos:
b0 = -1,675 b1 = 0,178 b2 = 1,661
Reemplazando valores en la línea de regresión tenemos:
INTERPRETACIONES:
Las interpretaciones que se dan en un modelo de regresión lineal múltiple difiere a lo visto en la regresión lineal simple, debido a la inclusión de una mayor cantidad de variables.
En este tipo de análisis de regresión múltiple la interpretación es de la siguiente manera:
bi : Representa la estimación del cambio en “y” debido a un cambio en una unidad de xi, mientras todas las demás variables permanecen constantes.
b1 = 0,178, es la estimación del aumento esperado en la cantidad de fotocopiadoras vendidas por cada llamada que se haga, cuando la cantidad de años de experiencia permanece constante.
b2 = 1,661, es la estimación del aumento esperado en la cantidad de fotocopiadoras vendidas por cada año de experiencia que se tenga en ventas, cuando la cantidad de llamadas que se realice permanece constante.
El coeficiente de regresión es:
R2 = 0.978 fuente SPSS
Quiere decir que la variable y (número de copiadores vendidas) es explicado en un 97,8% al conocer las dos variables independientes.
SIGNIFICADO DE LAS BONDADES DE AJUSTE:
R2: Mide el porcentaje de explicación del modelo
R2 corregido: Permite comprar modelos con distintos números de regresores. No está acotado por la parte inferior. Puede tomar valores negativos cuando el ajuste realizado es muy malo.
AIC: Informa que cuánto más pequeño es el valor del estadístico, mejor es el ajuste del modelo. (Uriel Et al., 2005)
EJEMPLO 2
La empresa Buenosaires se dedica a la fabricación y venta de abanicos, habiendo obtenido en los últimos años unos resultados económicos relativamente aceptables. Los directivos de la empresa consideran que los resultados habrían sido muchos mejores si el absentismo laboral en la empresa no fuera tan elevado.
Este absentismo tiene una incidencia negativa que se refleja en los costes de personal y en desajustes en las operaciones de fabricación y distribución.
Por las razones expuestas, la dirección de la empresa tiene gran interés en conocer cuáles pueden ser los factores más relevantes del absentismo laboral que sufre la empresa.
Se nos encarga el estudio, y para ello el jefe de personal facilita información acerca de los días que en el último año han faltado al trabajo cada uno de los empleados de planilla (excluidos los directivos). Esta información aparece en el siguiente cuadro.
PASOS PARA PROPONER UN MODELO DE REGRESIÓN LINEAL:
Analice la existencia de la multicolinealidad.
rX1,X2= 0.872 r Y,X1= 0.675
r Y,X2= 0.715 Si hay multicolinealidad
rX1,X3= 0.316 r Y,X1= 0.675
r Y,X3= 0.667 No hay multicolinealidad
rX2,X3= 0.439 r Y,X2= 0.715
r Y,X3= 0.667 No hay multicolinealidad
Determine el mejor modelo de regresión lineal múltiple.
Los modelos propuestos son: YX1, YX2, YX3, YX1X3, YX2X3
Correr la regresión lineal múltiple para cada modelo propuesto.
Identifique el coeficiente de determinación corregido para cada modelo.
MODELO 1: YX1
Resumen del modelo
...