Análisis de Regresión
Enviado por unitec_enrique • 1 de Agosto de 2014 • Ensayo • 1.339 Palabras (6 Páginas) • 189 Visitas
Análisis de Regresión
Julio Di Rienzo
Regresión lineal múltiple
Cuando observamos las respuestas de un ensayo o los resultados de un plan de muestreo, tratamos de explicar los valores observados mediante un modelo estadístico. Así, si estuviéramos observando un ensayo comparativo de rendimientos para el cultivo de maíz, trataremos de describir o justificar la mayor parte de la variación de las observaciones de forma tal que podamos identificar cuales son los factores más relevantes a la hora de pronosticar rendimientos o de mejorarlos. Otro ejemplo sería el volumen maderable de los ejemplares de una especie maderable, sometidos a distintos manejos. Aunque se espera que la una parte importante de la variación en el volumen maderable sea explicada por el tipo de manejo, se sabe que la enfermedades, la calidad del sitio, los errores de implementación del manejo, la carga genética de cada ejemplar, etc., podrían también modificar la respuesta. Los modelos que tratamos de construir son modelos para las esperanzas de la variable de respuesta y son simplificaciones del mundo real sujetas a un conjunto más o menos grande de restricciones. Es muy difícil obtener modelos generales aplicables a cualquier situación, al menos en el campo de lo biológico o lo social, ya que existen muchos factores condicionantes de las respuestas que ni siquiera conocemos que existen. Por ejemplo la respuesta de un cultivo a la disponibilidad de agua dependerá del tipo de suelo, de la evapotranspiración y de otros factores, a veces no cuantificados, como el estado sanitario de las plantas que puede aumentar o disminuir la capacidad del cultivo para soportar momentos de falta de agua. Estos argumentos implican que cuando buscamos modelos para predecir o simplemente comprender la variabilidad de una respuesta deberemos estar advertidos de los alcances pero también de las importantes limitaciones que estos modelos conllevan.
Para iniciar con el desarrollo de los modelos de regresión lineal comencemos por decir que la variable respuesta las simbolizaremos con la letra , y que con los elementos del un vector, que llamaremos , representaremos constantes observables que, de manera resumida, caracterizan la condición en la que es observada.
Luego diremos que y leeremos como: La observación es el resultado de sumar a su esperanza un término aleatorio . Donde es una función del vector de constantes observables y de un vector de parámetros desconocidos. Además, supondremos que el término aleatorio tiene esperanza cero y varianza , usualmente, desconocida.
Lo que caracteriza a este modelo como lineal es la forma de . Si es una combinación lineal de los elementos de donde los coeficientes son funciones conocidas de - -, entonces decimos que es un modelo de regresión lineal y su expresión general podría escribirse de la siguiente forma:
(1.1)
Aunque cuando pensamos en modelos de regresión lineal podemos anticipar que se trata de modelos muy restrictivos, la expresión (1.1) muestra que pueden ser muy ricos como instrumentos de modelación.
Algunos ejemplo de modelos de regresión lineal
Supongamos que , esto es y . En este caso la esperanza de tendrá la forma de una recta con ordenada al origen y pendiente . Aunque este es un ejemplo sencillo, las curvas y superficies que pueden modelarse pueden ser muy diversas como se muestra en la Figura 1. El problema de encontrar, mediante modelos lineales, expresiones para superficies muy estructuradas radica en la dificultad de identificar las funciones que no siempre pueden justificarse. En general las formas más comunes de son: y . De esta manera, el modelo lineal queda expresado como:
(1.2)
o igualmente comunes, son los polinomios:
(1.3)
Figura 1: Curvas y superficies generadas por modelos lineales en una (arriba) y
dos variables x’s (abajo)
Cuando se ajusta un modelo de regresión lineal pueden estar persiguiéndose dos objetivos diferentes: la predicción y la identificación del modelo. En el primer caso hay mayor flexibilidad
...