Análisis de Regresión. Diagramas de dispersión
Enviado por nayeq • 7 de Junio de 2019 • Documentos de Investigación • 742 Palabras (3 Páginas) • 206 Visitas
Análisis de Regresión.
La regresión y la correlación son dos herramientas estadísticas muy útiles y versátiles que se pueden utilizar para solucionar problemas comunes en la industria, en los negocios, en la medicina, etc. Muchos estudios se basan en la creencia de que se puede identificar alguna relación funcional entre dos o más variables. Se dice que una variable depende de la otra.
Debido a que Y depende de X, Y es una variable dependiente y X es la variable independiente. Es importante identificar cual es la variable dependiente y cuál es la variable independiente en el modelo de regresión. Esto depende de la lógica y de lo que el estadístico intente medir. El director de una universidad desea analizar la relación entre las notas de los estudiantes y el tiempo que pasan estudiando, se recolectaron datos sobre ambas variables, es lógico presumir que las notas dependen de la cantidad y calidad de tiempo que los estudiantes pasan con sus libros.
El primero en desarrollar el análisis de regresión fuel científico inglés Sir Francis Galton (1822-1911).
Se debe diferenciar entre la regresión simple y la regresión múltiple, en la regresión simple, se establece que Y es una función de solo una variable independiente. Con frecuencia se le denomina regresión bivariada porque solo hay dos variables, una dependiente y una independiente, en un modelo de regresión múltiple, Y es una función de dos o más variables independientes.
En el modelo de regresión lineal, la relación entre X y Y puede representarse por medio de una línea recta, sostiene que a medida que X cambia, Y cambia en una cantidad constante. La regresión curvilínea utiliza una curva para expresar la relación entre X y Y. Sostiene que a medida que cambia X, Y cambia en una cantidad diferente cada vez.
Diagramas de dispersión.
Ecuaciones.
La regresión y la correlación están vinculadas de manera muy estrecha. En su nivel más básico ambas implican la relación entre dos variables y tanto una como la otra utilizan el mismo conjunto de datos básicos. La correlación se asocia con la magnitud y dirección de la relación. La regresión se enfoca en el uso de esa relación para la predicción. Ésta es bastante sencilla cuando la relación es perfecta. Si este es el caso, todos los puntos coinciden en una línea recta y todo lo que necesitaremos es hallar la ecuación de tal línea y utilizarla para elaborar las predicciones.
La regresión es un concepto que considera el empleo de la relación entre dos o más variables para efectuar predicciones.
Una línea de regresión es la línea que mejor se ajusta y que se utiliza para hacer predicciones.
Predicción y relaciones imperfectas.
Tomando por ejemplo un conjunto de datos que involucran el promedio de calificaciones y el coeficiente intelectual (CI), la grafica muestra un diagrama de dispersión de los datos, en una relación imperfecta, positiva y lineal. El problema al cual nos enfrentamos es como determinar la línea recta única que mejor describe los datos. La solución utilizada con más frecuencia es trazar la línea que minimice los errores de predicción de acuerdo con un criterio mínimos cuadrados. En términos apropiados, esta línea se llama línea de regresión de mínimos cuadrados.
Estudiante |
| Promedio de |
número | CI | calificaciones |
1 | 110 | 1.0 |
2 | 112 | 1.6 |
3 | 118 | 1.2 |
4 | 119 | 2.1 |
5 | 122 | 2.6 |
6 | 125 | 1.8 |
7 | 127 | 2.6 |
8 | 130 | 2.0 |
9 | 132 | 3.2 |
10 | 134 | 2.6 |
11 | 136 | 3.0 |
12 | 138 | 3.6 |
Figuras de diagramas de dispersión de CI y promedio de calificaciones, dos líneas de regresión y el error de predicción.
La línea de regresión de mínimos cuadrados es aquella que minimiza el error estándar de predicción, de acuerdo con el criterio de mínimos cuadrados ∑ (Y – Y´) 2
Elaboración de la línea de regresión de mínimos cuadrados: regresión de Y en X.
Ecuación de regresión.
Cálculos mediante fórmulas.
Ejemplo: continuando con el ejemplo de las calificaciones y el CI, tenemos la siguiente tabla.
Estudiante |
| Promedio de |
|
|
número | CI | calificaciones |
|
|
| X | Y | XY | X2 |
1 | 110 | 1.0 | 110 | 12100 |
2 | 112 | 1.6 | 179.2 | 12544 |
3 | 118 | 1.2 | 141.6 | 13924 |
4 | 119 | 2.1 | 249.9 | 14161 |
5 | 122 | 2.6 | 317.2 | 14884 |
6 | 125 | 1.8 | 225 | 15625 |
7 | 127 | 2.6 | 330.2 | 16129 |
8 | 130 | 2.0 | 260 | 16900 |
9 | 132 | 3.2 | 422.4 | 17424 |
10 | 134 | 2.6 | 348.4 | 17956 |
11 | 136 | 3.0 | 408 | 18496 |
12 | 138 | 3.6 | 496.8 | 19044 |
total | 1503 | 27.3 | 3488.7 | 189187 |
Ecuaciones, línea de regresión para el promedio de calificaciones y CI.
Problema de práctica: Una psicóloga del desarrollo está interesada en determinar si es posible utilizar la estatura de los niños varones pequeños para predecir su estatura en la madurez. A fin de responder a esta pregunta, recopila los datos que se muestran en la siguiente tabla.
...