INFORME DE ANALISIS DEL DATASET (REGRESION LINEAL SIMPLE)
Enviado por Axel Salinas • 10 de Julio de 2018 • Informe • 386 Palabras (2 Páginas) • 454 Visitas
[pic 1][pic 2]
INFORME DE ANALISIS DEL DATASET (REGRESION LINEAL SIMPLE)
- Nombre del DATASET
(Datos de Altura y Cubo de Galton 1888).
- Descripción
Francis Galton introdujo la "correlación" en 1888 con un documento que analiza cómo medir la relación entre dos variables. Su ejemplo principal fue la relación entre la altura y la longitud del antebrazo. La tabla de datos (cubits) está tomada de Galton (1888). Desafortunadamente, parece que hay algunos errores en la tabla de datos original en el sentido de que los totales marginales no coinciden con la tabla.
El marco de datos, heightsse convierte de esta tabla usando table2df.
Uso datos (alturas)
Formato -Un marco de datos con 348 observaciones sobre las siguientes 2 variables.
height
Altura en pulgadas
cubit
Longitud del antebrazo en pulgadas
- Detalles
Sir Francis Galton (1888) publicó la primera demostración del coeficiente de correlación. La regresión (o reversión a la mediocridad) de la altura a la longitud del antebrazo izquierdo (un codo) se encontró a .8. La tabla original cubitsestá tomada de Galton (1888). Parece que hay algunos errores en la tabla, como se publicó en que las sumas de filas no concuerdan con las sumas de fila reales. Estos datos se utilizan para crear una matriz usando table2matrixpara demostraciones de análisis y visualizaciones de los datos.
- Regresión Simple en R- Studio del Dataset.
- Primero cargamos los datos con el siguiente comando de R
procesamiento_datos<-read.table("C:/Users/asali/Documents/R/cubo.data", header = TRUE)
[pic 3]
- Seguido atamos el dataset con:
attach(procesamiento_datos)
[pic 4]
- Graficamos los diagramas de Dispersion con:
Pairs(procesamiento_datos)
[pic 5]
- Para cuantificar el grado de relación lineal, calculamos la matriz de coeficientes de correlación con:
cor(procesamiento_datos)
[pic 6]
- Ajustamos el modelo de regresión lineal simple, aplicar el ajuste del modelo de regresión lineal
Y=B0+B1x
Bo=coordenada en el origen
B1=pendiente
Utilizando:
regresion <- lm(height~cubit, data = procesamiento_datos)
summary(regresion)
[pic 7]
Los parámetros de la ecuación de la recta de mínimos cuadrados que relaciona las ventas en función de la temperatura vienen dados por la columna ´Estimate´ de la tabla ´Coefficients´ de la salida anterior. Por lo tanto, en este ejemplo la ecuación de la recta de mínimos cuadrados es:
...