Resumen de Correlación
Enviado por JuanAFM75 • 7 de Julio de 2021 • Resumen • 1.552 Palabras (7 Páginas) • 92 Visitas
República Bolivariana de Venezuela.
Ministerio del Poder Popular para la Educación.
Instituto Universitario de Tecnología. “Antonio José de Sucre”.
Barcelona – Edo. Anzoátegui.
Carrera: Tecnología Mecánica mención Mantenimiento.
Área: Estadística.
[pic 1]
[pic 2][pic 3]
Barcelona, 31 de mayo de 2021.
En muchas situaciones de la vida cotidiana, existe la posibilidad de relacionar dos o más variables, presentes en objetos de estudios estadísticos. Permitiendo así, la predicción del comportamiento de ambas variables a un futuro determinado. Por lo que, es la correlación, junto con el apoyo de cálculos y métodos gráficos, la que permite predecir el comportamiento de las variables que relaciona. Entonces, para poder comprender como lo hace y así aplicarla en nuestras diversas fases de la vida; es necesario adquirir una información básica y fácilmente entendible que a continuación será presentada con gran detalle:
- Correlación: Consiste en establecer una relación, dependencia o asociación entre dos variables numéricas encontradas dentro de una distribución bidimensional, en la cual, si cambia una de las variables la otra también se verá afectada por la manifestación. Donde ambas pueden presentar una tendencia creciente o decreciente. Por lo que, una ofrece información acerca de la otra.
- Interpretación de la Correlación: La correlación permite medir el signo y la magnitud de la tendencia entre las dos variables. Dónde:
El signo, indica la dirección de la relación, en la cual si el valor es positivo, se muestra una relación directa, si es negativo, señala una relación indirecta e inversa. Y si es nulo, la tendencia entre ambas variables dejará de existir.
En cuanto a la magnitud, se encarga de indicar la fuerza de la relación entre ambas variables, comprendiendo valores entre el -1 al 1. Por lo que, mientras más cercano se encuentre el valor a los extremos de este intervalo, más fuerte será la tendencia de las variables; y por tanto se reduce la dispersión existente entre los puntos alrededor de dicha tendencia. En cambio, si el coeficiente de correlación, se halla más cerca del cero, más débil se hará la tendencia y habrá una mayor dispersión en la nube de puntos.
Vale destacar que, si la correlación vale 1 o -1, se estará hablando de una correlación perfecta. Y si la misma llega a valer 0, simplemente las variables no se encontrarán correlacionadas entre sí.
Sin embargo, el grado de correlación, indica la proximidad existente entre los puntos de la nube de puntos. En el cual, será más fuerte cuanto más cerca estén los puntos de la línea de ajuste. Y será débil, cuanto más separados se hallen los mismos puntos de la recta.
- Diagrama de Dispersión: Consiste en un tipo de diagrama o gráfico matemático, que utiliza las coordenadas cartesianas para mostrar gráficamente la relación existente entre dos variables cuantitativas sobre un mismo grupo de individuos o conjunto de datos. Es decir, permite estudiar las relaciones entre dos conjuntos asociados de datos que aparecen en pares, exponiendo a los mismos como una nube de puntos. En este sentido, las relaciones entre ambos conjuntos de datos se deducen a partir de las nubes y de acuerdo a la relación que exista entre ellas, se define su tipo de correlación.
- Correlación Positiva: Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Dándose una relación proporcional.
- Correlación Negativa: Se exhibe cuando una variable se comporta de forma contraria o a la otra, es decir que si una variable aumenta, la otra disminuye. Entonces, existe una relación inversamente proporcional.
- Correlación Nula: Si no se encuentra un comportamiento entre las variables. Donde ambas variables aumentan y disminuyen independientemente entre sí.
- Dispersión: Esta se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio. Por lo que a partir de esta definición, se derivan las medidas de dispersión estadísticas como el rango, la varianza, la desviación, covarianza, coeficiente de correlación, etc.
- Usos del diagrama de dispersión: El diagrama de dispersión suele utilizarse principalmente para descubrir y demostrar las relaciones entre dos conjuntos asociados de datos y así confirmar las posibles relaciones anticipadas entre ambos conjuntos. Por lo que, puede aplicarse para determinar las posibles causas de un problema de calidad o para hallar los factores que influyan en la misma.
- Procedimiento para Elaborar un Diagrama de Dispersión: Para ello, debe tenerse en cuenta los siguientes aspectos mencionados a continuación:
- Determinar las variables a estudiar. Teniendo en cuenta una posible relación entre ellas, para así caracterizar el estudio estadístico.
- Recolectar los datos de ambas variables que se encuentren ofrecidos en el mismo período de tiempo. En el cual es conveniente contar con 30 pares de datos aproximadamente.
- Inscribir los ejes del plano de coordenadas cartesianas. (X, Y)
- Ubicar los valores en los ejes cartesianos respectivamente. Donde por lo general, se escoge la variable independiente, como la menos afectada por las manifestaciones de la otra, ubicada en el eje x. Y la variable restante, mayor influenciada por la primera, se localiza en el eje y. De esta manera, se procede a ubicar los datos de ambas variables acuerdo a sus localizaciones anteriormente mencionadas. (X, Y)
- Encontrar los valores mínimo y máximo, tanto para el eje X, como para el eje Y. Para así utilizar a los mismos en la elaboración de la escala de los ejes cartesianos. Donde ambos deben tener aproximadamente la misma longitud.
- Graficar los datos en forma de pares. Donde para cuando haya dos pares de datos que tengan los mismos valores; se procede a dibujar círculos concéntricos al punto graficado.
- Examinar la forma de la nube de puntos ya graficados, para descubrir los tipos y las fuerzas de las relaciones. Mediante la línea de ajuste.
- Establecer el coeficiente de correlación, el cual refleja la forma tomada por el gráfico de dispersión y consiste en el cociente de la covarianza y la multiplicación de la desviación típica de las dos variables.
- Analizar con base al coeficiente y el gráfico presentado. Para así poder definir la relación de ambas variables y tomar las decisiones pertinentes.
- Línea de Ajuste: Es utilizada para realizar predicciones basadas en los datos pasados ya presentados, dentro de un diagrama de dispersión, capaz de representar la tendencia de los mismos. Por lo que, al dibujar esta línea o recta, se asegura de encajar la mayor parte de los datos. Y en caso, de haber un punto muy por encima o por debajo con respecto al resto (puntos atípicos), se dejará fuera de la recta.
- Coeficiente de Correlación de Pearson: Es una medida de correlación lineal utilizada para medir el grado de relación o dependencia entre dos conjuntos de datos o variables; siempre y cuando ambas sean cuantitativas. La cual, consiste en ser la covarianza de las dos variables, dividida por el producto de sus desviaciones estándar; por lo tanto, es esencialmente una medida normalizada de la covarianza, de modo que el resultado siempre tiene un valor entre -1 y 1. Al igual que con la covarianza en sí, la medida solo puede reflejar una correlación lineal de variables e ignora muchos otros tipos de relación o correlación. Y prácticamente determina la fuerza y el sentido de la relación lineal entre las dos variables.
[pic 4]
[pic 5]
- Covarianza: La covarianza de una muestra bidimensional es la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La cual, suele representarse por [pic 6]. Y en algunas ocasiones mediante [pic 7], aunque no es recomendable
[pic 8]
La covarianza indica el sentido de la correlación entre las variables
...