ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresion


Enviado por   •  8 de Septiembre de 2013  •  18.067 Palabras (73 Páginas)  •  308 Visitas

Página 1 de 73

1. REGRESIÓN LINEAL SIMPLE

Ajuste de una línea recta por mínimos cuadrados

1.1 Introducción

Parece que Sir Francis Galton (1822-1911) un antropólogo y metereológo británico fue responsable de la introducción de la palabra “regresión”, mostró que si Y = “estatura de los niños” y X = “estatura de los padres”, una ecuación de ajuste adecuada era . El artículo de Galton es fascinante como se cuenta en The Story of the Statistics , el método de mínimos cuadrados aparentemente fue descubierto por Carl Frederick Gauss (1777-1855) .

El método de análisis llamado análisis de regresión, investiga y modela la relación entre una variable Y dependiente o de respuesta en función de otras variables de predicción X’s, a través del método de mínimos cuadrados.

Como ejemplo supóngase que un ingeniero industrial de una embotelladora está analizando la entrega de producto y el servicio requerido por un operador de ruta para surtir y dar mantenimiento a maquinas dispensadoras. El ingeniero visita 25 locales al azar con máquinas dispensadoras, observando el tiempo de entrega en minutos y el volumen de producto surtido en cada uno. Las observaciones se grafican en un diagrama de dispersión (Fig. 1.1), donde claramente se observa que hay una relación entre el tiempo de entrega y el volumen surtido; los puntos casi se encuentran sobre una línea recta, con un pequeño error de ajuste.

En general los modelos de regresión tienen varios propósitos como son:

 Descripción de datos a través de ecuaciones

 Estimación de parámetros para obtener una ecuación modelo

 Predicción y estimación.

 Control.

1.2 El modelo de regresión lineal simple

Al tomar observaciones de ambas variables Y respuesta y X predicción o regresor, se puede representar cada punto en un diagrama de dispersión.

Y

*

* *

*** *

*** **

***

X

Fig. 1.1 Diagrama de dispersión y recta de ajuste

El modelo de ajuste o modelo de regresión lineal es:

(1.1)

Donde los coeficientes 0 y 1 son parámetros del modelo denominados coeficientes de regresión, son constantes, a pesar de que no podemos determinarlos exactamente sin examinar todas las posibles ocurrencias de X y Y, podemos usar la información proporcionada por una muestra para hallar sus estimados . El error es difícil de determinar puesto que cambia con cada observación Y. Se asume que los errores tienen media cero, varianza desconocida 2 y no están correlacionados (el valor de uno no depende del valor de otro). Por esto mismo las respuestas tampoco están correlacionadas.

Conviene ver al regresor o predictor X como la variable controlada por el analista y evaluada con el mínimo error, mientras que la variable de respuesta Y es una variable aleatoria, es decir que existe una distribución de Y con cada valor de X.

La media de esta distribución es:

(1.1 a)

y su varianza es:

(1.1b)

De esta forma la media de Y es una función lineal de X a pesar de que la varianza de Y no dependa de los valores de X.

1.2.1 Estimación de los parámetros por mínimos cuadrados

El método de mínimos cuadrados se usa para estimar 0 y 1 se estimará 0 y 1 de manera que la suma de cuadrados de las diferencias entre la observaciones yi y la línea recta sea mínima. Los parámetros 0 y 1 son desconocidos y deben ser estimados usando datos de una muestra. Supongamos que se tienen n pares de datos (y1, x1), (y1, x1), (y2, x2),....., (yn, xn) de un experimento o por historia.

De la ecuación modelo de regresión de la población

Usando los pares de datos se puede establecer el criterio de mínimos cuadrados como:

Los estimadores de mínimos cuadrados de 0 y 1 por decir debe satisfacer es:

y

Simplificando estas dos ecuaciones se obtienen las ecuaciones de mínimos cuadrados:

La solución a las ecuaciones normales anteriores:

Donde los promedios para X y para Y son los siguientes::

Aplicando el método de mínimos cuadrados del error, se obtiene el modelo que nos da un valor estimado Y en función de X, denominado ecuación de predicción o de regresión lineal, como sigue:

(1.2)

Donde:

(1.3)

(1.4)

por tanto:

(1.5)

Cuando se tiene el punto que se encuentra en la línea ajustada y representa el centro de gravedad de los datos.

Ejemplo 1.1 Se realizaron 25 observaciones de la variable Y y X como sigue:

Y X

10.98 35.3

11.13 29.7

12.51 30.8

8.4 58.8

9.27 61.4

8.73 71.3

6.36 74.4

8.5 76.7

7.82 70.7

9.14 57.5

8.24 46.4

12.19 28.9

11.88 28.1

9.57 39.1

10.94 46.8

9.58 48.5

10.09 59.3

8.11 70

6.83 70

8.88 74.5

7.68 72.1

8.47 58.1

8.86 44.6

10.36 33.4

11.08 28.6

Haciendo cálculos con el paquete Minitab con X en la columna C2 y Y en la columna C1 se tiene:

Regression Analysis: C1 versus C2

The regression equation is

C1 = 13.6 - 0.0798 C2

Predictor Coef SE Coef T P

Constant 13.6230 0.5815 23.43 0.000

C2 -0.07983 0.01052 -7.59 0.000

S = 0.8901 R-Sq = 71.4% R-Sq(adj) = 70.2%

Por lo anterior la ecuación de regresión obtenida es:

(1.6)

Después de obtener esta ecuación, surgen algunas preguntas:

- ¿qué tan bien ajusta los datos esta ecuación?

- ¿el útil el modelo para hacer predicciones?

- ¿se viola alguna condición como varianza constante y no correlación en los errores, de ser así que tan seria es?

Todo esto debe ser aclarado antes de usar el modelo.

1.2.2 Análisis de Varianza

El análisis de varianza es una herramienta que sirve para probar la adecuación del modelo

...

Descargar como (para miembros actualizados) txt (114 Kb)
Leer 72 páginas más »
Disponible sólo en Clubensayos.com