El Mejor
Enviado por alex3000 • 21 de Junio de 2014 • Ensayo • 1.833 Palabras (8 Páginas) • 200 Visitas
De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces
Ei es el error o desviación aleatoria de Yi .
Definición VALOR MEDIO. Constante que representa el centro de gravedad de la ley de probabilidad de una variable aleatoria y que, en casos de notable simetría en la función de densidad, puede interpretarse que dicha constante nos señala la zona donde se sitúan los valores de máxima probabilidad de la variable aleatoria.
El valor medio o valor esperado de una variable aleatoria X se define como
Siempre que dicho valor exista, donde f es la función de densidad de la variable.
1.2. Supuestos
Supuestos del modelo clásico de regresión lineal
Como el propósito del modelo no es solo estimar B1 y B2 sino hacer inferencia sobre los verdaderos B1 y B2, entonces se hace necesario establecer los siguientes supuestos:
1. El modelo de regresión es lineal en los parámetros.
Las variables deben ser lineales en sus valores originales o después de alguna transformación adecuada.
2. El valor esperado de la perturbación aleatoria debe ser cero para cualquier observación.
para todo i
3. La varianza de las perturbaciones es constante – homoscedasticidad (IGUAL VARIANZA).
para toda i
4. Independencia o no autocorrelación entre las perturbaciones
Dados dos valores cualesquiera de X, xi xj para i ¹ j, la correlación entre Ui, Uj es cero.
para cualquier i ¹ j
5. Independencia entre Ui y Xj para toda i y j
para toda i y j , esto para separar el efecto sobre Y de U y X
6. Los valores de X son fijos en muestreos repetidos es decir son no estocásticos.
7. Debe disponerse de una información estadística suficientemente amplia sobre el conjunto de variables observables implicadas en el modelo. Como requisito mínimo para que pueda determinarse una solución se exige que el número de datos (n) debe ser superior al número de parámetros (k) (n>k) se habla para datos anuales mínimo 15.
8. En modelos de regresión múltiples se necesita que no haya relación lineal perfecta entre las variables independientes o explicativas, a esto se le llama no multicolinealidad. X de nxk con rango k (rango completo).
9. Normalidad Ui esta normalmente distribuido para toda i
Lo anterior implica que:
Estimados los a partir de datos muestrales, se requiere de alguna medida para verificar la confiabilidad o precisión de los estimadores y En estadística la precisión de un valor estimado es medida por su desviación estándar o error estándar.
Desarrollando una demostración matemática se puede concluir que:
El estimador de mínimos cuadrados de la verdadera varianza de los errores es:
1.3. Determinación de la ecuación de regresión
Generalidades
La regresión y los análisis de correlación nos muestran como determinar tanto la naturaleza como la fuerza de una relación entre dos variables
En el análisis de regresión desarrollaremos una ecuación de estimación, esto es, una fórmula matemática que relaciona las variables conocidas con la variable desconocida. Entonces podemos aplicar el análisis de correlación para determinar el grado de en el que están relacionadas las variables. El análisis de correlación, entonces, nos dice qué tan bien están relacionadas las variables. El análisis de correlación, entonces, nos dice que tan bien la ecuación de estimación realmente describe la relación
Principales técnicas utilizadas en el análisis de regresión lineal simple
1) Ordenamiento y análisis de la información original
3) Diagrama de dispersión e interpretación
El primer paso para determinar si existe o no una relación entre dos variables es observar la grafica de datos observados. Esta grafica se llama diagrama de dispersión.
Un diagrama nos puede da dos tipos de información, visualmente podemos buscar patrones que nos indiquen que las variables están relacionadas. Entonces si esto sucede, podemos ver que tipo de línea, o ecuación de estimación, describe esta relación.
Primero tomamos los datos de la tabla que deseamos analizar y dependiendo de que se desea averiguar se construye la grafica colocando la variable dependiente en el eje Y y la independiente en el eje X, Cuando vemos todos estos puntos juntos, podemos visualizar la relación que existe entre estas dos variables. Como resultado, también podemos trazar, “o ajustar” una línea recta a través de nuestro diagrama de dispersión para representar la relación. Es común intentar trazar estas líneas de forma tal que un número igual de puntos caiga a cada lado de la línea.
Diagrama de dispersión
Estimación mediante la línea de regresión
Hasta el momento las líneas de regresión se colocaron al ajustar las líneas visualmente entre los puntos de datos, pero para graficar estas líneas de una forma más precisa podemos utilizar una ecuación que relaciona las dos variables matemáticamente.
La ecuación para una línea recta donde la variable dependiente Y está determinada por la varianza dependiente X es:
Usando esta ecuación podemos tomar un valor dado en X y calcular el valor de Y la a se denomina intersección en Y por qué su valor es el punto en el cual la línea de regresión cruza el eje Y por qué su valor es el punto en el cual la línea de regresión cruza el eje Y, es decir el eje vertical. La b es la pendiente de la línea, representa que tanto cada cambio de unidad de la variable independiente X cambia la variable dependiente Y. Tanto a como b son constantes numéricas, puesto que para cada recta dada, sus valores no cambian.
Recta de regresión por el método de mínimos cuadrados.
Ahora que hemos visto como determinar
...