Analisis de regresion y correlacion
Enviado por marlonvasquez • 4 de Febrero de 2019 • Biografía • 1.688 Palabras (7 Páginas) • 169 Visitas
- ANALISIS DE REGRESION Y CORRELACION
- INTRODUCCION. En la realidad cotidiana encontramos muchos fenómenos donde se observa que existe una relación entre dos ó más variables por ejemplo: a) número de clientes y ventas semanales. b) cantidades de ventas hechas por varios vendedores y los años de experiencia de cada vendedor. Con el fín de expresar esta relación en forma matemática (ecuación que relacione las variables) hacemos uso del análisis de regresión “el cuál básicamente se utilizará para hacer predicciones”, el objetivo es predecir los valores de una variable repuesta ó dependiente (a menudo se identifica con la letra “y” ) basados en los valores de una variables independiente ó explicatoría (que por lo general se identifica con la letra “x”), y para medir la intensidad de la asociación de las variables se usará el análisis de correlación”.
- DIAGRAMA DE DISPERSION. (Diagrama de esparcimiento ó nube de datos) El primer paso del análisis de regresión es coleccionar los datos indicando el valor de las variables (tabla 1.) y se representa en un sistema de coordenadas cartesianas, al conjunto de estos puntos se le llama: diagrama de dispersión (ver gráfica).
Tabla 1. Número de clientes y Ventas semanales (muestra 20 almacenes)
Almacenes | Clientes | Ventas |
1 | 907 | 11.20 |
2 | 926 | 11.05 |
3 | 506 | 6.84 |
4 | 741 | 9.21 |
5 | 789 | 9.42 |
6 | 889 | 10.08 |
7 | 874 | 9.45 |
8 | 510 | 6.73 |
9 | 529 | 7.24 |
10 | 420 | 6.12 |
11 | 679 | 7.63 |
12 | 872 | 9.43 |
13 | 924 | 9.46 |
14 | 607 | 7.64 |
15 | 452 | 6.92 |
16 | 729 | 8.95 |
17 | 794 | 9.33 |
18 | 844 | 10.23 |
19 | 1010 | 11.77 |
20[pic 1] | 621 | 7.41 |
- 24 -
En este diagrama observamos una línea que representa aproximadamente los datos, a la cuál se le denomina: “línea interpolante”.
3.3. TIPOS MODELOS DE REGRESION. La naturaleza de la relación puede tomar formas desde las más sencillas hasta la funciones matemáticas complicadas. La más sencilla es la relación lineal como la del ejemplo y que se representa por: Y = a + bx + error
El modelo matemático apropiado que se debe seleccionar está influenciado por la distribución de los valores de x y y en el diagrama de dispersión, como ejemplo tenemos los siguientes de la gráfica de abajo. En el panel A sería como el ejemplo, en el B que sería una relación lineal negativa, un ejemplo podría ser el precio de un producto y las ventas. En el panel C no observamos ninguna relación entre variables. El panel D muestra una relación curvilínea positiva entre X y Y. Los valores de y aumentan al aumentar x pero luego este incremento disminuye cuando se sobrepasan ciertos valores de x, un ejemplo podría ser la edad y el costo de mantenimiento de una máquina, el panel E muestra una relación parabólica ó en forma de U, entre X y Y. Conforme aumenta X al principio Y disminuye pero a medida que X sigue incrementándose y no solamente deja de disminuir sino que en realidad aumenta por encima de su valor mínimo. Un ejemplo podría ser el número de errores por hora cometidos en una cierta tarea y el número de horas trabajadas en ella. En el panel F se presenta una relación exponencial ó curvilínea negativa, Y disminuye rápidamente en la medida que X aumenta, pero luego la disminución se hace más lenta conforme X sigue aumentando. Un ejemplo sería el valor de reventa de un tipo particular de automóvil con respecto a su antigüedad.
[pic 2][pic 3]
A F
[pic 4][pic 5]
B C
[pic 6][pic 7]
D E
- 25 -
- USO DE ECUASIONES NORMALES.
- ERROR ESTÁNDAR DE LA ESTIMACION.
- METODO DE MINIMOS CUADRADOS. El Tipo mas simple de curva de regresión es el de la línea recta, aunque como ya vimos pueden existir otros tipos, lo que al final buscamos es encontrar “la línea que mejor se ajusta a los datos” matemáticamente esto significa hallar la línea que minimice la suma de los cuadrados de las distancias entre la línea del modelo y los puntos de la base de datos original (medidas en dirección vertical y); para esto se requiere del cálculo diferencial (ver apéndice B en Estadística para negocios de Hanke). Con las siguientes fórmulas encontraremos la pendiente (b) y la ordenada al origen de la recta de regresión muestral.
[pic 8][pic 9]
Donde: ∑ x = suma de valores de x.
∑ y = suma de valores y
∑ x^2 = suma de los cuadrados de los valores de x
(∑x)^2= cuadrado de la suma de los valores de x
...