ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Nociones de regresion lineal


Enviado por   •  20 de Enero de 2013  •  Tutorial  •  12.257 Palabras (50 Páginas)  •  370 Visitas

Página 1 de 50

NOCIONES DE REGRESION LINEAL

Julio H. Cole

Profesor de Economía

Universidad Francisco Maroquín

1. Introducción.

El objeto de un análisis de regresión es investigar la relación estadística que existe entre una variable dependiente (Y) y una o más variables independientes ( , ... ). Para poder realizar esta investigación, se debe postular una relación funcional entre las variables. Debido a su simplicidad analítica, la forma funcional que más se utiliza en la práctica es la relación lineal. Cuando solo existe una variable independiente, esto se reduce a una línea recta:

donde los coeficientes b0 y b1 son parámetros que definen la posición e inclinación de la recta. (Nótese que hemos usado el símbolo especial para representar el valor de Y calculado por la recta. Como veremos, el valor real de Y rara vez coincide exactamente con el valor calculado, por lo que es importante hacer esta distinción.)

El parámetro b0, conocido como la “ordenada en el origen,” nos indica cuánto es Y cuando X = 0. El parámetro b1, conocido como la “pendiente,” nos indica cuánto aumenta Y por cada aumento de una unidad en X. Nuestro problema consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X. En el análisis de regresión, estas estimaciones se obtienen por medio del método de mínimos cuadrados.

Como ejemplo, consideremos las cifras del Cuadro 1, que muestra datos mensuales de producción y costos de operación para una empresa británica de transporte de pasajeros por carretera durante los años 1949-52 (la producción se mide en términos de miles de millas-vehículo recorridas por mes, y los costos se miden en términos de miles de libras por mes). Para poder visualizar el grado de relación que existe entre las variables, como primer paso en el análisis es conveniente elaborar un diagrama de dispersión, que es una representación en un sistema de coordenadas cartesianas de los datos numéricos observados. En el diagrama resultante, en el eje X se miden las millas-vehículo recorridas, y en el eje Y se mide el costo de operación mensual. Cada punto en el diagrama muestra la pareja de datos (millas-vehículo y costos de operación) que corresponde a un mes determinado. Como era

DIAGRAMA DE DISPERSIÓN

Cuadro 1. Operaciones Mensuales en una Empresa de Transporte de Pasajeros.

————————————————————————————————————

Costos Millas- Costos Millas-

Totales Vehículo Totales Vehículo

(miles) (miles) (miles) (miles)

Mes Nº Y X Mes Nº Y X

————————————————————————————————————

1 213.9 3147 18 213.2 3338

2 212.6 3160 19 219.5 3492

3 215.3 3197 20 243.7 4019

4 215.3 3173 21 262.3 4394

5 215.4 3292 22 252.3 4251

6 228.2 3561 23 224.4 3844

7 245.6 4013 24 215.3 3276

8 259.9 4244 25 202.5 3184

9 250.9 4159 26 200.7 3037

10 234.5 3776 27 201.8 3142

11 205.9 3232 28 202.1 3159

12 202.7 3141 29 200.4 3139

13 198.5 2928 30 209.3 3203

14 195.6 3063 31 213.9 3307

15 200.4 3096 32 227.0 3585

16 200.1 3096 33 246.4 4073

17 201.5 3158

————————————————————————————————————

Fuente: J. Johnston, Análisis Estadístico de los Costes (Barcelona: Sagitario, S. A., 1966), p. 118.

————————————————————————————————————

de esperarse, existe una relación positiva entre estas variables: una mayor cantidad de millas-vehículo recorridas corresponde un mayor nivel de costos de operación.

Por otro lado, también se aprecia por qué este gráfico se denomina un diagrama de “dispersión”: no existe una relación matemáticamente exacta entre las variables, ya que no toda la variación en el costo de operación puede ser explicada por la variación en las millas-vehículo. Si entre estas variables existiera una relación lineal perfecta, entonces todos los puntos caerían a lo largo de la recta de regresión, que también ha sido trazada y que muestra la relación “promedio” que existe entre las dos variables. En la práctica, se observa que la mayoría de los puntos no caen directamente sobre la recta, sino que están “dispersos” en torno a ella. Esta dispersión representa la variación en Y que no puede atribuirse a la variación en X.

2. Estimación de la Recta de Regresión.

Para estimar los coeficientes por medio de mínimos cuadrados, se utilizan las siguientes fórmulas:

En nuestro ejemplo, aplicando estas fórmulas tenemos:

25,216,020.3 – 219.1242(113,879)

b1 = —————————————— = 0.044674

398,855,769 – 3,450.879(113,879)

b0 = 219.1242 – 0.044674(3,450.879) = 64.96

...

Descargar como (para miembros actualizados) txt (54 Kb)
Leer 49 páginas más »
Disponible sólo en Clubensayos.com