Probabilidad Y Estadistica
Enviado por WalkiriaYans • 7 de Septiembre de 2014 • 1.197 Palabras (5 Páginas) • 196 Visitas
Objetivos
Saber el significado de Regresión lineal
Ver el modelo de regresión lineal
Estudiar las ecuaciones para obtener el modelo
Definir coeficiente de correlación
Saber que es un diagrama de dispersión
Introducción
Los métodos de correlación y la regresión lineal simple constituyen el tema de este capítulo; ambos se utilizan para: analizar datos bivariados con la finalidad de determinar si una juste lineal es adecuado, calcular la ecuación de la recta si es adecuado, y usar esta ecuación con el fin de hacer inferencias respecto de la relación entre ambas cantidades
Una de las primeras aplicaciones de la estadística consistió en estudiar la variación de las características físicas en poblaciones humanas. Con ese fin, los estadígrafos crearon una cantidad llamada coeficiente de correlación y otros temas de los que se hablaran
Marco Teórico
El coeficiente de correlación lineal nos permite determinar si, efectivamente, existe relación entre las dos variables. Una vez que se concluye que sí existe relación.
La regresión nos permite definir la recta que mejor se ajusta a esta nube de puntos. El primer coeficiente de correlación publicado fue producto del trabajo de sir Francis Galton, quien, en 1888, midió la estatura y longitud del antebrazo, respectivamente, de 348 hombres adultos. (En realidad, midió la distancia del codo a la punta del dedo cordial, lo que se conocía como un cúbito.) Si se denota la estatura del i-ésimo hombre mediante xi, y la longitud de su antebrazo como yi, entonces los datos de Galton consistían de348 pares ordenados (xi, yi). .
(16 de febrero de 1822 – 17 de enero de 1911) fue un polímata, antropólogo, geógrafo, explorador,inventor, meteorólogo, estadístico, psicólogo británico con un amplio espectro de intereses.
No tuvo cátedras universitarias y realizó la mayoría de sus investigaciones por su cuenta.
Los puntos tienden a inclinarse hacia arriba y a la derecha, lo que indica que los hombres
más altos tienden a tener antebrazos más largos. Se dice que hay una asociación positiva
entre la estatura y la longitud del antebrazo
La pendiente es casi constante en toda la gráfica, esto indica que los puntos están agrupados alrededor de una línea recta. La línea sobrepuesta sobre la gráfica representa una recta especial conocida como recta de mínimos cuadrados.
El grado en que los puntos en un diagrama similar tienden a agruparse alrededor de una
recta refleja la fuerza de la relación lineal entre x y y. La impresión visual de una gráfica de
puntos puede ser engañosa respecto de lo anterior, debido al cambio de escala de los ejes, lo
que puede hacer que el agrupamiento parezca más junto o más disperso. En consecuencia, se
define el coeficiente de correlación, que es una medida numérica de la fuerza de la relación
lineal entre dos variables. Este coeficiente se denota con la literal r.
Sean (x1, y1), . . . , (xn, yn) los n puntos del diagrama de dispersión. Para calcular la correlación,
primero se deducen las medias y las desviaciones estándar de las x y de las y, que
se representan mediante x–, y–, sx y sy. Después se convierte cada x y cada y a las unidades estándar;
en otras palabras, se calculan los puntajes z: (xi – x–)/sx, (yi – y–)/sy. El coeficiente de correlación representa el promedio de los productos de los puntajes z, excepto que se divide entre n – 1 en lugar de n:
En principio, el coeficiente de correlación se puede calcular para cualquier conjunto de
puntos. Éstos, en muchos casos, constituyen una muestra aleatoria de una población de puntos.
En dichos casos el coeficiente de correlación con frecuencia se llama correlación muestral,
y es una estimación de la correlación poblacional. (En la sección 2.6 se analizaron
...