Análisis de Regresión. Introducción..
Enviado por billy140893 • 22 de Noviembre de 2016 • Informe • 3.438 Palabras (14 Páginas) • 344 Visitas
1.- Análisis de Regresión. Introducción.
Esta importante herramienta se fundamente en dos acciones principales. Primero obtener una ecuación y su línea, recta o curva, que represente la relación entre las dos variables que se estudia. Estas se conocen como ecuación de regresión y línea de regresión. Segundo, calcular para la variable dependiente el valor de la estimación que corresponde a cada valor que se le asigne a la variable independiente, basados en la relación descrita en la ecuación de regresión.
2.- Francis Galton. (Inglés. 16 de febrero de 1822 – 17 de enero de 1911). Primo segundo de Charles Darwin. Reconocido caballero a la edad de 87 años. Contribuyó en diferentes áreas de la ciencia. Fue antropólogo, geógrafo, explorador, inventor, meteorólogo, estadístico y psicólogo. Las investigaciones de Galton fueron fundamentales para la constitución de la ciencia de la estadística:
- Inventó el uso de la línea de regresión, siendo el primero en explicar el fenómeno de la regresión a la media.
- En las décadas de 1870 y 1880 fue pionero en el uso de la distribución normal.
- Inventó la máquina Quincunx, un instrumento para demostrar la ley del error y la distribución normal.
- Descubrió las propiedades de la distribución normal bivariada y su relación con el análisis de regresión.
- Descubrió las propiedades de la distribución normal bivariada y su relación con el análisis de regresión.
En su trabajo “Regression towards mediocrity in hereditary stature” publicado en 1885, analizó la relación entre la estatura media de los dos padres de una familia y la estatura media de sus hijos adultos. En un diagrama X-Y (X estatura media de los padres - Y es la estatura media de los hijos adultos), cada punto representa la estatura de una familia. Como era de esperarse los padres altos tienden a tener hijos altos y padres bajos tienden a tener hijos de baja estatura. Pero observó que la estatura de los hijos se desviaba menos de la estatura media de todos los hijos que las estaturas de sus padres de la estatura media de todos los padres. Los padres altos o bajos tienen hijos con estaturas más medianas que ellos mismos. Así, las estaturas de los hijos tienden a regresar hacia la estatura promedio de la población. Galton llamó línea de regresión a la línea que describe la relación promedio entre dos variables.
3.- Conceptos:[pic 1]
- Diagrama de dispersión. Es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable determinado por la posición en el eje vertical. Un diagrama de dispersión se llama también gráfico de dispersión.
- Ecuación de regresión. Útil para calcular tendencias. En estadística la ecuación de regresión lineal o ajuste lineal es un método matemático que modela la relación entre una variable dependiente Y, las variables independientes Xi en un fenómeno aleatorio. Este modelo puede ser expresado como: Línea o curva de regresión. Se dibuja por entre el diagrama de dispersión. [pic 2]
Yr = f(x) = mx + b
Donde [pic 3]
[pic 4]
- Estimación. Dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.
- Error estándar de regresión. Comúnmente llamado error estándar de estimación. Se calcula utilizando los propios datos y es el promedio estándar de las variaciones de los datos con respecto de la línea de regresión, medidos sobre el eje Y
[pic 5]
- Estimación corregida (o Rango de confianza en la estimación). Este rango está asociado con una determinada probabilidad o nivel de confianza. Los porcentajes en la estimación son:
- Estimación ± 1 Syx 68% de probabilidad.
- Estimación ± 2Syx 95% de probabilidad.
- Estimación ± 3 Syx 99% de probabilidad.
4.- Leer y resolver juntos el ejercicio de análisis de regresión.
Práctica. En el análisis de los datos que se obtienen al estudiar una situación específica, puede resultar que algunas variables estén relacionadas, y con una dependencia que será más fuerte en algunos casos que en otros. Por ejemplo, si se estudia un grupo de personas, cabe esperar que la relación entre las variables edad y estatura sea más significativa entre personas jóvenes que entre personas adultas. Cuando los datos de las variables se llevan a las coordenadas X-Y, la gráfica que resulta se denomina “diagrama de dispersión” o “nube de puntos”.
...