La Regresión Lineal y la correlación, como herramienta de Pronóstico.
Enviado por c_davila • 1 de Julio de 2016 • Ensayo • 2.343 Palabras (10 Páginas) • 737 Visitas
La Regresión Lineal y la correlación, como herramienta de Pronóstico
Christian Armando Dávila Grados
La correlación y la regresión lineal son dos procedimientos empleados para estimar, predecir y probar la significancia de la proyección de las muestras. En el análisis de la correlación “la atención se dedica a la medición del grado de asociación entre dos variables”, mientras que el análisis de regresión lineal “se usa con propósitos de predicción, y su meta es desarrollar un modelo estadístico que se puede usar para predecir los valores de una variable dependiente, basados en los valores de al menos una variable independiente. La regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables en una variedad de situaciones y hoy en día en este mundo industrializado, todos los profesionales requerimos de herramientas útiles que nos ayuden a tomar decisiones acertadas, con alta precisión y en base a una data histórica. Estas estimaciones deben acercarse a lo real, para así haber sido eficientes y precisos en nuestras proyecciones y por ende en nuestros planes de producción y presupuestos a corto, mediano y largo plazo.
Pero la interrogante que muchos profesionales se hacen es: cuándo debo aplicar una regresión lineal a mis datos y como debo usar esta herramienta estadística? Será confiable mi estimación? cuantas variables son suficientes? Algunas de estas preguntas son sencillas o difíciles de responder según el contexto en el que se aplique esta herramienta tan útil.
El término regresión fue introducido por Galton en su libro “Natural inheritance” (1889) donde se refirió a la “ley de la regresión universal”, cada peculiaridad en un hombre es compartida por sus descendientes, pero en media, en un grado menor. Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (una variable) a partir de los de sus padres (otra variable). Pearson (un amigo suyo) realizó un estudio con más de 1000 registros de grupos familiares observando una relación del tipo: Altura del hijo = 85cm + 0,5 • altura del padre (aprox.). Donde se tuvo como conclusión que los padres muy altos tienen tendencia a tener hijos que heredan parte de esta altura, aunque tienen tendencia a acercarse (regresar) a la media. Lo mismo puede decirse de los padres muy bajos. Hoy en día el sentido de regresión es el de predicción de una medida basándonos en el conocimiento de otra.
“El análisis de regresión es una herramienta cuantitativa extremadamente valiosa. El uso de diagramas de dispersión ayuda a visualizar las relaciones entre las variables. La prueba F se utiliza para determinar si los resultados pueden considerarse útiles. El coeficiente de determinación se utiliza para medir la proporción de variabilidad de Y que se explica mediante el modelo de regresión. El coeficiente de correlación mide la relación entre las dos variables.”
Barry Render, Ralph M. Stair, Michael E. Hanna. (2006), Métodos cuantitativos para los negocios
En estadística la regresión lineal o ajuste lineal es un modelo matemático usado para aproximar la relación de dependencia entre una variable dependiente Y, y las variables independientes Xi y un término aleatorio E. Este modelo puede ser expresado como:[pic 1]
Donde:
[pic 2]: Variable dependiente, explicada o regresando.
[pic 3]: Variables explicativas, independientes o regresores.
[pic 4]: Parámetros, miden la influencia que las variables explicativas tienen sobre el regrediendo.[pic 5]
Figura 1: Ejemplo de una regresión lineal con una variable dependiente y una variable independiente. Fuente: https://commons.wikimedia.org/wiki/File:Linear_regression.svg
La historia nos explica que la primera forma de regresión lineal documentada fue el método de mínimos cuadrados que fue publicado por Legendre en 1805. Legendre intentó minimizar la suma de cuadrados en las diferencias de las ordenadas entre los pun tos generados por la función elegida y los correspondientes valores en los datos. También sabemos que Gauss publicó un trabajo en donde desarrollaba de manera más profunda el método de los mínimos cuadrados y en donde se incluyó una versión del teorema de Gauss – Márkov.
Pero lo más importante es entender primero en qué campos aplicamos esta herramienta estadística. Se mencionan algunos:
Líneas de tendencia: Una línea de tendencia representa una tendencia en una serie de datos obtenidos a través de un largo período. Este tipo de líneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PBI1, el precio del petróleo o el valor de las acciones) han aumentado o decrementado en un determinado período. Se puede dibujar una línea de tendencia a simple vista fácilmente a partir de un grupo de puntos, pero su posición y pendiente se calcula de manera más precisa utilizando técnicas estadísticas como las regresiones lineales. Las líneas de tendencia son generalmente líneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado2 dependiendo de la curvatura deseada en la línea.
En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresión lineal. Los investigadores incluyen una gran cantidad de variables en su análisis de regresión en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias3. En el caso del tabaquismo, los investigadores incluyeron el estado socio-económico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educación o posición económica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresión. En el ejemplo del tabaquismo, un hipotético gen podría aumentar la mortalidad y aumentar la propensión a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razón, en la actualidad las pruebas controladas aleatorias son consideradas mucho más confiables que los análisis de regresión.
...