ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Regresion Simple


Enviado por   •  12 de Noviembre de 2012  •  2.706 Palabras (11 Páginas)  •  780 Visitas

Página 1 de 11

Objetivos: Introducir la técnica de regresión lineal simple, en la que para cada valor x de una variable no aleatoria X -conocida como predictora, regresora o independiente-, interviene una variable aleatoria Yx, denominada variable respuesta o dependiente; relacionadas, a través del valor medio o esperado de la variable respuesta, por la expresión

Regresión lineal simple. Tiene como objetivo el estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica es una línea recta.

Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá:

De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces

Ei es el error o desviación aleatoria de Yi

Estimación de los parámetros de la recta de regresión. El primer problema a abordar es obtener los estimadores de los parámetros de la recta de regresión, partiendo de una muestra de tamaño n, es decir, n pares (x1, Y1) , (x2, Y2), ..., (xn, Yn); que representan nuestra intención de extraer para cada xi un individuo de la población o variable Yi .

Una vez realizada la muestra, se dispondrá de n pares de valores o puntos del plano (x1, y1) , (x2, y2), ..., (xn, yn). El método de estimación aplicable en regresión, denominado de los mínimos cuadrados, permite esencialmente determinar la recta que "mejor" se ajuste o mejor se adapte a la nube de n puntos. Las estimaciones de los parámetros de la recta de regresión obtenidas con este procedimiento son:

Por tanto la recta de regresión estimada será:

Un ejemplo. La recta de regresión representada corresponde a la estimación obtenida a partir de 20 pares de observaciones: x representa la temperatura fijada en un recinto cerrado e Y el ritmo cardíaco de un vertebrado.

Problema:

Se trata de encontrar la recta de regresión, junto con su gráfica, que mejor se ajuste o mejor aproxime los siguientes datos, de distintas temperaturas de un recinto cerrado y los correspondientes ritmos cardiacos de una especie de lagarto:

temp. (ºC) 22 22 24 24 26 26 28 28 30 30 32 32 34 34 36 36 38 38 40 40

lat./minuto 20.8 22.3 24.1 25.6 25.7 27.2 27.3 28.8 29.4 31.9 32.4 33.8 32.8 34.1 32.4 37.9 38.0 36.5 39.0 41.0

________________________________________

SUPUESTOS EN LOS QUE SE BASA EL ANÁLISIS DE REGRESIÓN

Suposiciones de la Regresión Lineal

1.

Los valores de la variable independiente X son fijos, medidos sin error.2.

La variable Y es aleatoria3.

Para cada valor de X, existe una distribución normal de valores de Y (subpoblaciones Y)4.

Las variancias de las subpoblaciones Y son todas iguales.5.

Todas las medias de las subpoblaciones de Y están sobre la recta.6.

Los valores de Y están normalmente distribuidos y son estadísticamente independientes.

DIAGRAMA DE DISPERSIÓN

Diagrama de dispersión: es una herramienta gráfica que permite comprobar la existencia de relación entre dos variables y la intensidad de la misma.Para construir un diagrama de este tipo hay que recoger los datos de losdos factores y construir un conjunto de pares de datos. Estos pares dedatos se representan en un plano cartesiano, lo que permitirá obtener unanube de puntos que permita analizar la tendencia de los valores ydeterminar la existencia de la correlación.Gráfico 5 - Ejemplo de Diagrama de Dispersión

Ejemplo de las alturas y los pesos

Consideremos las observaciones de los pesos y alturas de un conjunto de 10 personas: elindividuo 1 tiene 161 cm de altura y 63 kg de peso, el individuo 2 tiene 152 cm de alturay 56 kg de peso, etc., tal como se ve en la tabla siguiente:

El diagrama de dispersión también nos puede ayudar a encontrar algún valoratípico entre los datos de la muestra que pueda tener su origen en una malaobservación o en el hecho de ser una observación correspondiente a un indi-viduo excepcional dentro de la muestra. Cuando tenemos un valor atípico, de-bemos controlar las influencias que pueda tener en el análisis.

MÉTODO DE MÍNIMOS CUADRADOS.-

Método de Mínimos Cuadrados

El procedimiento mas objetivo para ajustar una recta a un conjunto de datos presentadosen un diagrama de dispersión se conoce como "el método de los mínimos cuadrados". Elejemplo mas simple de una aproximación por mínimos cuadrados es el ajuste de una línea recta a un conjunto de parejas de datos observadas:

En donde:

Y1 = Valor de la variable dependiente en la i- ésima observación

0 = Primer parámetro de la ecuación de regresión que indica el valor de y cuando x = 0

1 = Segundo parámetro de la ecuación de regresión que indica la pendiente de la regresión lineal

X1 = Valor especificado de la variable independiente en la i-ésima observación

ei = Error aleatorio de muestreo en la i-ésima observación

En la mayoría de las ocasiones el error aleatorio es tan pequeño que puede despreciarse y entonces la ecuación de la línea recta cambia a:

= b0 + b1X

Las fórmulas para el cálculo de los parámetros b0 y b1 son las siguientes:

Al determinar la ecuación lineal que se ajusta a los datos observados, podremos hacer predicciones para cualquier otro valor de la variable independiente (X), conociendo así el valor de la variable dependiente ( )

El método de los mínimos cuadrados es un método estadístico que permite encontrar la recta que mejor ajusta a una serie de datos experimentales. El método se basa en minimizar las diferencias entre los datos experimentales y los que proporcionaría la recta que sustituye a los datos. Como es lógico, el método solo tiene utilidad si se aplica a series de datos que presentan una tendencia lineal, aunque se puede generalizar para ajustar datos a funciones arbitrarias.

Dada una serie de datos la recta de mejor ajuste a esos datos está dada por y = mx =b, donde la pendiente es

...

Descargar como (para miembros actualizados) txt (17 Kb)
Leer 10 páginas más »
Disponible sólo en Clubensayos.com