Regresión lineal simple. Aplicaciones de la regresión lineal
Enviado por Valefsanchezz • 24 de Noviembre de 2018 • Apuntes • 2.622 Palabras (11 Páginas) • 2.628 Visitas
- Regresión lineal simple
La regresión lineal es una forma de estimación que comprende el análisis de los datos muéstrales para saber si se relacionan entre sí dos o más variables de una población.
En la regresión lineal simple se desarrolla una línea recta o ecuación matemática lineal que describa la relación entre dos variables por ejemplo: un fabricante de autos podría estimar la demanda semanal [pic 1]basándose en una muestra aleatoria acerca del precio del auto [pic 2]
La ecuación que se obtiene se puede usar de diversas formas. Una de ellas es para explicar los valores de una variable en términos de la otra. Por ejemplo: un economista puede explicar los cambios en la demanda de automóviles usados en términos de nivel de desempleo. Otro uso de la ecuación es para predecir los valores futuros de una variable, por ejemplo: a menudo se llevan a cabo pruebas de selección para posibles estudiantes para predecir la potencialidad de tener éxito en la escuela.
[pic 3]
Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los siguientes supuestos:
- La relación entre las variables es lineal.
- Los errores son independientes.
- Los errores tienen varianza constante.
- Los errores tienen una media igual a cero.
- El error total es la suma de todos los errores.
Cuando se requiere hacer predicciones si el valor utilizado para hacer una predicción se encuentra en el rango de [pic 4] la estimación es un interpolación y esta es válida en la medida que la relación de entre las variables sea buena. Cuando el valor de [pic 5]esta fuera del rango de valores de [pic 6] esta es una extrapolación, y no es válida aún teniendo una buena asociación de variables.
[pic 7]
Aplicaciones de la regresión lineal
Líneas de tendencia
Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo período. Este tipo de líneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado período. Se puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la línea.
Medicina
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias. En el caso del tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresión.
En el ejemplo del tabaquismo, un hipotético gen podría aumentar la mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas mucho más confiables que los análisis de regresión.
Método de los mínimos cuadrados
El procedimiento estadístico para encontrar la recta de mejor ajuste para un conjunto de puntos es el criterio de bondad que se conoce como el principio de los mínimos cuadrados y se establece como sigue: escoger la recta de mejor ajuste que minimice la suma de los cuadrados de las desviaciones (errores “ε”) de los valores observados de [pic 8] respecto a los pronosticados.
La ecuación de regresión lineal simple es
[pic 9]
Para obtener los coeficientes [pic 10] y [pic 11] se siguen las fórmulas:
[pic 12][pic 13] [pic 14][pic 15]
Donde los parámetros [pic 16][pic 17] y [pic 18][pic 19] se obtienen de la siguiente forma:
[pic 20][pic 21] [pic 22][pic 23]
Donde [pic 24] es el tamaño de la muestra.
3.2 Pruebas de hipótesis en regresión lineal simple
Es necesario probar estadísticamente la validez de la relación entre las variables que interfieren en la regresión.
La relación entre las variables puede ser:
- Positiva para [pic 25]
- Negativa para [pic 26]
- Nula para [pic 27]
[pic 28]
En la regresión generalmente se está interesado en probar la relación entre variables, para esto se contrastan las siguientes hipótesis.
1.- Hipótesis Nula [pic 29]: [pic 30][pic 31]
No hay relación entre las variables. El modelo de regresión no es adecuado. (Se acepta si [pic 32][pic 33])
2.- Hipótesis Alternativa [pic 34]: [pic 35][pic 36]
Si hay relación entre las variables. El modelo de regresión es adecuado. (Se acepta si [pic 37][pic 38])
...