Perfección En Subjuego
Enviado por martin_v04 • 23 de Septiembre de 2013 • 3.924 Palabras (16 Páginas) • 341 Visitas
1.1. EL ANÁLISIS DE REGRESIÓN
1.1.1 Interpretación
El inglés Francis Galton1 (1822 - 1911) fue el primero en introducir el término regresión.
Cuando estudiaba la relación entre las estaturas de los hijos y los padres observó que la estatura
de los hijos era alta o baja cuando los padres eran altos o bajos, respectivamente. Sin embargo,
la estatura promedio de los hijos cuyos padres tenían una estatura dada, tendía a moverse o
converger hacia el promedio de la población. Así, determinó una regresión de la estatura de los
hijos hacia el promedio o, en términos de Galton, “una regresión hacia la mediocridad”.
La Ley de Regresión Universal de Galton fue confirmada, años después, por Karl Pearson,
quien realizó un estudio similar utilizando más de mil observaciones. Con el estudio de Pearson
se confirmó que la estatura promedio de los hijos de un grupo de padres altos era menor que la
estatura de sus padres y la estatura promedio de los hijos de padres de estatura baja era mayor
que la de sus padres. Así, se observa que los hijos de estatura alta o baja, “regresan” en forma
similar hacia la estatura promedio de la población.
En este sentido, la regresión de una variable aleatoria Y sobre otra variable X fue entendida
como la media de Y condicional en X, a través de una relación funcional entre X e Y. El
estimador de los coeficientes involucrados en esta forma funcional fue hallado utilizando el
criterio de estimación de Mínimos Cuadrados Ordinarios (MCO), que será estudiado en el
siguiente capítulo, y las observaciones muestrales de X e Y.
1 Francis Galton, “Family Likeness in Stature”, Proceedings of Royal Society, Londres,vol, 40, 1886, pp. 42-72.
Econometría Moderna El Modelo de Regresión Lineal
10
Una interpretación más moderna de regresión indica que la misma es cualquier aproximación
de la distribución de probabilidad de Y condicionada a los valores de las observaciones de X,
siendo Y una función de X. En otras palabras, el análisis de regresión estudia la relación
existente entre una variable endógena o dependiente (Y) y una o más variables exógenas o
independientes (X), con el objeto de estimar la media o valor promedio poblacional de la
primera en términos de los valores conocidos o fijos de las últimas. Ahora, resulta más clara la
relación entre el estudio de Galton y la definición moderna del término regresión.
A menudo se confunden los términos regresión y correlación, los cuales están estrechamente
ligados a pesar de que existen diferencias substanciales entre ellos. Por un lado el análisis de
correlación pretende medir el grado de asociación lineal entre dos variables a través del
coeficiente de correlación2. Por ejemplo, se puede estar interesado en conocer la correlación
entre la cuenta de capitales y la tasa de interés, entre los términos de intercambio y la balanza
comercial, entre la tasa de encaje y créditos del sistema bancario, etc. En cambio, cuando se
analiza una regresión se trata de estimar o de predecir el valor promedio de una variable
(llamada explicada, dependiente o endógena) utilizando valores fijos3 de las variables
explicativas (también llamadas independientes o exógenas) . Utilizando el ejemplo anterior,
puede ser que se desee predecir el saldo de la cuenta de capitales teniendo información muestral
de la tasa de interés o que se desee predecir el monto total de créditos conociendo la tasa de
encaje bancaria. Así, y conociendo la relación existente entre estas variables a través de un
análisis de regresión, será posible predecir valores de la variable dependiente utilizando
realizaciones de las independientes.
1.1.2 ¿Cómo se conecta el análisis económico con el análisis de regresión?
El análisis económico toma en consideración diversas variables en conjunto. La relación
entre las tasas de inflación y el desempleo, la relación intertemporal entre las tasas de interés y
el consumo o la relación entre éste y los precios de los bienes relacionados de un bien, son
algunos de los tantos ejemplos que se encuentran en el análisis empírico en economía. Como
ejemplo concreto, se puede citar la Ley de Okun4, la cual afirma que por cada punto porcentual
que caiga la tasa de desempleo el producto tiende a crecer 3 puntos porcentuales. Esto significa
que existe una relación negativa entre las dos variables y, para contrastar el modelo, se
necesitará utilizar simultáneamente datos de ambas variables.
Para ello, se deben utilizar distribuciones de probabilidad conjuntas o multivariadas5. Se sabe
por nociones básicas de estadística que la función de probabilidad conjunta se puede plantear de
la siguiente forma:
f( y/ x1 , x2 , x3 ) = F ( y/ x1 , x2 , x3 ) * f (x1 , x2 , x3 ) (1.1)
2El coeficiente de correlación entre dos variables aleatorias expresa el grado de dependencia entre el comportamiento
de dichas variables. Formalmente:
( )( )
( , )
x y
Cov Y X
σ σ
ρ =
3 Se debe resaltar que las variables explicativas pueden ser de naturaleza estocástica, pero por simplicidad para el
análisis de regresión se asume que los valores de X no cambian en diversas muestras, es decir son fijos en el muestreo
repetido. De hecho este supuesto deberá imponerse al momento de querer obtener estimados de los verdaderos
parámetros. El problema asociado a la presencia de regresores (variables exógenas) estocásticos, será abordado en
otro capítulo.
4 Se puede expresar matemáticamente de la siguiente manera: 3( 1) ( 1 )
f
un − u+ = Q+ −Q , donde un y Qf indican que el
producto está en pleno empleo y por tanto la tasa de desempleo (u) es la natural.
5 Son las funciones de probabilidad generadas por el comportamiento aleatorio conjunto de dos o más variables y se
utilizan en el estudio de las relaciones existentes entre éstas.
Econometría Moderna El Modelo de Regresión Lineal
11
Siendo la primera la función de probabilidad condicional y la segunda la marginal. En el
análisis econométrico, y tal como se indicó anteriormente, se busca estimar la distribución
condicional mientras que la marginal no se utilizará, por el momento.
De esta manera, si se tiene la siguiente función conjunta: C = f (r, Yd, w, Yp), ésta nos
indica
...