Análisis de correlación y regresión
Enviado por Erikza • 7 de Septiembre de 2017 • Ensayo • 2.733 Palabras (11 Páginas) • 374 Visitas
República Bolivariana de Venezuela
Ministerio del P.P para Educación Universitaria, Ciencia y Tecnología
Instituto Universitario de Tecnología Industrial
“Rodolfo Loero Arismendi”
Extensión Punto Fijo
Relaciones Industriales
Unidad curricular: Estadística II
[pic 1]
Análisis de correlación y regresión
Integrantes:
Navas Augusto
C.I 18.449.012
Ventura Erikza
C.I 18.155.654
Agosto, 2017
INTRODUCCIÓN
Un problema de estimación que es particularmente importante en casi cualquier campo de estudio es el de pronosticar o predecir el valor de una variable de algún proceso a partir de los valores conocidos de otras variables que estén relacionadas. En cierto sentido, el proceder de tipo estadístico que se haga en cada problema es simplemente una formalización del procedimiento que se haría siguiendo la intuición.
Por otro lado, la regresión es una extensión de la metodología de la correlación a más de una variable independiente, y sus aplicaciones son interesantes y variadas. No todos los esfuerzos para construir ecuaciones de predicción en varias variables, para la respuesta bajo estudio llevan a soluciones tan buenas, sin embargo, hay un número suficiente de aplicaciones exitosas que llevan a concluir que el análisis de regresión es una herramienta muy poderosa que se utiliza en una gran variedad de áreas dentro de los negocios.
El término regresión fue utilizado por primera vez como un concepto estadístico en 1877 por sir Francis Galton, quien llevó a cabo un estudio que mostró que la estatura de los niños nacidos de padres altos tiende a retroceder o “regresar” hacia la estatura media de la población. En el análisis de regresión, se desarrolla una ecuación de estimación, esto es, una fórmula matemática que relaciona las variables conocidas con la variable desconocida. Después de conocer el patrón de esta relación, podremos aplicar el análisis de correlación para determinar el grado en el que las variables se relacionan. El análisis de correlación, entonces, nos indica qué tan bien la ecuación de estimación describe realmente la relación.
A través de esta investigación se pretende tratar el estudio al problema de predecir “y” cuando es una función lineal de una sola variable independiente y adicionalmente, se buscará una ecuación de predicción a manera de procedimientos de estimación y pruebas estadísticas, referido usualmente como método de regresión.
CONTENIDO
ANÁLISIS DE CORRELACIÓN
1.- ¿Qué es una correlación lineal?
El término “correlación” literalmente significa relación mutua; de este modo, el análisis de correlación mide e indica el grado en el que los valores de una variable se relacionan con los valores de otra.
Más exactamente, el análisis que se ocupa de medir la relación entre una sola variable independiente y la variable dependiente se llama análisis de correlación simple
2.- ¿Qué es un diagrama de dispersión?
Es un diagrama que permite determinar si existe una relación entre dos variables al examinar los datos observados (o conocidos) de un evento.
Un diagrama de dispersión nos puede dar dos tipos de información. Visualmente, podemos identificar patrones que indiquen que las variables están relacionadas. Si esto sucede, podemos ver qué tipo de línea, o ecuación de estimación, describe esta relación.
Desarrollaremos y utilizaremos un diagrama de dispersión específico. Suponga que el director de admisiones de una universidad nos pide determinar si existe una relación entre las calificaciones de un estudiante en su examen de admisión y su promedio general al graduarse. El director ha reunido una muestra aleatoria de datos de los registros de la universidad. La tabla 1 contiene esta información.
Tabla 1.- Calificaciones de estudiantes en exámenes de admisión y promedios de generales acumulados al graduarse
[pic 2]
Para comenzar, debemos transferir la información de la tabla 1 a una gráfica. Puesto que el director desea utilizar las calificaciones de los exámenes para pronosticar éxitos en la universidad, hemos colocado el promedio de calificaciones acumulado (la variable dependiente) en el eje vertical o Y, y la calificación del examen de admisión (la variable independiente) en el eje horizontal o X. La figura 1 nos muestra el diagrama de dispersión completo.
[pic 3]
Figura 1.- Diagrama de dispersión de las calificaciones de estudiantes en exámenes de admisión graficadas contra el promedio general acumulado
A primera vista se sabe por qué llamamos así al diagrama de dispersión. El patrón de puntos resulta al registrar cada par de datos de la tabla 1 como un punto. Cuando vemos todos estos puntos juntos, podemos visualizar la relación que existe entre las dos variables. Como resultado, podemos trazar, o “ajustar” una línea recta a través de nuestro diagrama de dispersión para representar la relación; la figura 2 ilustra esto. Es común intentar trazar estas líneas de forma tal que un número igual de puntos caiga en cada lado de la línea.
[pic 4]
Figura 2.- Diagrama de dispersión en donde la línea recta representa la relación entre X y Y “ajustada”
En este caso, la línea trazada a través de los puntos representa una relación directa, porque Y se incrementa al aumentar X. Como los puntos están relativamente cerca de esta línea, podemos decir que existe un alto grado de asociación entre las calificaciones de exámenes y el promedio de calificaciones acumulativo. En la figura 2, podemos ver que la relación descrita por los puntos está bien descrita por una línea recta. Por tanto, podemos decir que es una relación lineal.
La relación entre las variables X y Y también puede tomar la forma de una curva. Los especialistas en estadística la llaman relación curvilínea. Para repasar las relaciones posibles en un diagrama de dispersión, examinemos las gráficas de la figura 3. Las gráficas (a) y (b) muestran relaciones lineales directas e inversas. Las gráficas (c) y (d) son ejemplos de relaciones curvilíneas que indican asociaciones directas e inversas entre variables, respectivamente. La gráfica (e) ilustra una relación lineal inversa con un patrón de puntos ampliamente disperso. Esta mayor dispersión indica que existe menor grado de asociación entre las variables independiente y dependiente que el existente en la gráfica (b). El patrón de puntos en la gráfica (f) parece indicar que no existe relación entre las dos variables; por tanto, conocer el pasado referente a una variable no nos permitirá pronosticar ocurrencias futuras de la otra.
...