Realcion Lineal Y Correlacion Simple
Enviado por crystalship • 23 de Junio de 2013 • 1.523 Palabras (7 Páginas) • 586 Visitas
REGRESIO LINEAL SIMPLE
El análisis de regresión es una técnica estadística para investigar la relación funcional entre dos o más variables, ajustando algún modelo matemático.
La regresión lineal simple utiliza una sola variable de regresión y el caso más sencillo es el modelo de línea recta. El análisis de regresión es una técnica estadística para investigar la relación
funcional entre dos o más variables, ajustando algún modelo matemático.
La regresión lineal simple utiliza una sola variable de regresión y el caso más sencillo es el modelo de línea recta.
Se considera que la variable X es la variable independiente o regresiva y se mide sin error, mientras que Y es la variable respuesta para cada
valor específico xi de X; y además Y es una variable aleatoria con alguna función de densidad para cada nivel de X.
Una forma de determinar si puede existir o no dependencia entre variables, y en caso de haberla deducir de qué tipo puede ser, es gráficamente representando los pares de valores observados. A dicho gráfico se le llama nube de puntos o diagrama de dispersión.
La estructura del modelo de regresión lineal es la siguiente:
Y = β0 + β1X + ε
En esta expresión estamos admitiendo que todos los factores o causas que influyen en la variable respuesta Y pueden dividirse en dos grupos: el primero contiene a una variable explicativa X y el segundo incluye un conjunto amplio de factores no controlados que englobaremos bajo el nombre de perturbación o error aleatorio, ε, que provoca que la dependencia entre las variables dependiente e independiente no sea perfecta, sino que esté sujeta a incertidumbre. Por ejemplo, en el consumo de gasolina de un vehículo (Y ) influyen la velocidad (X) y una serie de factores como el efecto conductor, el tipo de carretera, las condiciones
ambientales, etc, que quedarían englobados en el error.
GRAFICAS DE DISPERSION
Una gráfica de dispersión puede ser usada para datos en la forma de parejas ordenadas de números. El resultado será un montón de puntos "dispersos" alrededor del plano.
Si la tendencia general es que los puntos suban a la derecha de la gráfica, entonces decimos que hay una correlación positiva entre las dos variables medidas. Si los puntos caen a la izquierda de la gráfica, decimos que hay una correlación negativa. Si no hay tendencia general, entonces no hay correlación.
Si la tendencia no es muy pronunciada – esto es, los puntos están dispersos ampliamente – entonces decimos que las variables están débilmente correlacionadas. Si la correlación es más pronunciada, decimos que las variables están fuertemente correlacionadas. Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con un intervalo de confianza determinado. La correlación puede ser positiva (aumento), negativa (descenso), o nula (las variables no están correlacionadas). Se puede dibujar una línea de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las variables. Una ecuación para la correlación entre las variables puede ser determinada por procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido como regresión lineal y garantiza una solución correcta en un tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su capacidad para mostrar las relaciones no lineales entre las variables. Además, si los datos son representados por un modelo de mezcla de relaciones simples, estas relaciones son visualmente evidentes como patrones superpuestos.
El diagrama de dispersión es una de las herramientas básicas de control de calidad, que incluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de control, el diagrama de Ishikawa y el (diagrama de flujo).
RECTA DE MINIMOS CUADRADOS
Mínimos cuadrados es una técnica de análisis numérico enmarcada dentro de la optimización matemática, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la función, dentro de dicha familia, que mejor se aproxime a los datos (un "mejor ajuste"), de acuerdo con el criterio de mínimo error cuadrático.En su forma más simple, intenta minimizar la suma de cuadrados de las diferencias en las ordenadas (llamadas residuos) entre los puntos generados por la función elegida y los correspondientes valores en los datos. Específicamente, se llama mínimos cuadrados promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de descenso por gradiente para minimizar el residuo cuadrado. Se puede demostrar que LMS minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por iteración), pero requiere un gran número de iteraciones para converger.Desde un punto de vista estadístico, un requisito implícito
...