Prueba normalidad a datos de la variable Aluminio
Enviado por angelacar74 • 19 de Mayo de 2018 • Examen • 2.680 Palabras (11 Páginas) • 97 Visitas
- Prueba normalidad a datos de la variable Aluminio
Shapiro-Wilk normality test
data: Aluminio$Al
W = 0.90756, p-value = 1.989e-07
HO: Datos comportamiento normal
HA: Datos no se comportan normal. Acepto
Como el valor p-value = 1.989e-07, es menor al nivel de significancia=0.05, entonces se puede afirmar que los datos de la variable respuesta Aluminio no tienen un comportamiento normal, por lo tanto es necesario realizar una transformación con boxcoxfit, para estimar los parámetros y transformar los datos de la variable aluminio.
Debido a que en la variable aluminio se encuentra datos iguales a cero, es necesario correr los datos a la derecha, sumando +0.01, luego de hacer esta se obtiene el lambda=0.55382029
Fitted parameters:
lambda beta sigmasq
0.55382029 -0.01623512 0.63988055
Convergence code returned by optim: 0
Como , entonces se trabaja con la siguiente ecuación de transformación .[pic 1][pic 2]
Luego de realizar la transformación de los datos de aluminio, nuevamente se realiza una prueba de normalidad y se obtiene el siguiente resultado.
Shapiro-Wilk normality test
data: Al.t
W = 0.95357, p-value = 0.0002153
Como el valor p-value=0.0002153, es menor al nivel de significancia=0.05, entonces se puede afirmar que los datos de aluminio, no tienen un comportamiento normal después de la transformación. Sin embargo el valor p después de la transformación es más cercano al nivel de significancia
- Análisis descriptivo para la variable aluminio
- Estadísticos descriptivos variable sin transformar
n | Mean | Sd | Min | Max | Kurtosis |
130 | 1.12 | 0.79 | 0 | 4.2 | 2.07 |
- Estadísticos descriptivos variable transformada
n | Mean | Sd | Min | Max | Kurtosis |
130 | -0.02 | 0.8 | -1.66 | 2.2 | 0.44 |
Teniendo en cuenta que el valor de kurtosis=2.07, es mayor que cero, en la variable de aluminio sin transformar tiene un comportamiento leptocurtico, es decir que los datos presentan un alto grado de concentración alrededor de los valores centrales de la variable.
Sin embargo en el caso de la variable transformada, el valor de la Kurtosis=0.44, es cercano a cero, por lo tanto los datos después de la transformación tienen un alto grado de concentración alrededor de la variable central, por lo tanto la variable transformada tienen un comportamiento mas mesocurtica, es decir que los datos se parecen mas a una distribución normal.
- Gráficos univariados de Aluminio de la variable sin transformar y después de la transformación
[pic 3]
El histograma de color blanco me indica que los datos de la variable aluminio sin transformar, presentan una frecuencia mayor al 20%, se encuentran entre 0 y 2.
El histograma de color azul me indica que los datos de la variable aluminio transformada, presentan una frecuencia mayor al 10%, se encuentran entre -1 y 1.
[pic 4]
Los anteriores gráficos de cajas y bigotes, me indican que la distribución la variable aluminio después de la tranformación tiene una distribución cercana a la normal (gráfico azul), además disminuye la cantidad de valores atípicos que me generan ruido por fuera de la caja, como es el caso de la variable sin transformar (gráfico blanco).
[pic 5]
- Análisis de varianza de los ejes con la variable aluminio
## Análisis para la variable Xc con Aluminio
Df Sum Sq Mean Sq F value Pr(>F)
Aluminio$Xc 1 6.45 6.451 11.02 0.00118 **
Residuals 128 74.94 0.585
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
## Análisis para la variable Yc con Aluminio
Df Sum Sq Mean Sq F value Pr(>F)
Aluminio$Yc 1 30.91 30.908 78.37 5.97e-15 ***
Residuals 128 50.48 0.394
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Ho. Varianza igualp>0.05
Ha.varianza diferente p<0.05
De acuerdo a los análisis de varianza realizado para los ejes de las coordenadas con la variable aluminio, se puede afirmar con un 95% de confianza que hay diferencia en la varianza, siendo mayor en el eje Yc, debido a que su valor p=5.97e-15, con respecto al valor p=0.00118.
- Correlación de coordenadas con Aluminio sin transformar y Aluminio transformado
Al Al.t
Xc -0.2815310 -0.3016063
Yc 0.6162498 0.6314482
Los anteriores valores de correlación me indican que la variable aluminio tiene una correlación negativa con respecto al eje Xc y una correlación positiva con respecto al eje Yc.
También permite concluir que los valores de la correlación de la variable después de la transformación son mayores, por lo tanto se puede inferir que los datos de aluminio después de la transformación tienen una menor dispersión.
A continuación se presenta la representación gráfica de la correlación de la variable aluminio sin transformar (gráficos de color blanco) y la variable aluminio transformada (gráficos de color azul)
[pic 6]
[pic 7]
- Análisis gráfico exploratorio geoestadístico para la variable Aluminio
- Gráfico de aluminio con relación a las coordenadas
[pic 8]
En el gráfico de aluminio con relación los ejes de las coordenadas, se puede observar que la tendencia de la media de la variable aluminio se encuentra desplazada hacia el eje Yc, superior a los 100 metros.
...