ANÁLISIS PRELIMINAR DE DATOS
Enviado por AnaidC • 10 de Marzo de 2014 • 3.404 Palabras (14 Páginas) • 2.640 Visitas
ANÁLISIS PRELIMINAR DE DATOS
El primer paso en el análisis de datos, una vez introducidos los mismos, es realizar un análisis descriptivo de la muestra. Este análisis nos permitirá controlar la presencia de posibles errores en la fase de introducción de los datos, es decir, detectaremos con él valores fuera de rango o la presencia de valores perdidos. Este análisis inicial también nos proporcionará una idea de la forma que tienen los datos: su posible distribución de probabilidad con sus parámetros de centralización; media, mediana y moda; así como sus parámetros de dispersión; varianza, desviación típica, etc.
PROCEDIMIENTO
ANÁLISIS DESCRIPTIVO DE LAS VARIABLES
Análisis de Una Variable
Es uno de los principales procedimientos para analizar una sola columna de datos numéricos. Calcula estadísticas de resumen, lleva a cabo pruebas de hipótesis, y crea una variedad de gráficos, los mismos incluyen gráfico de dispersión, histograma, gráfico de caja y bigotes, gráfico de cuantiles, gráfico de probabilidad norma.
Variable Oil Quota
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable Oil Quota no se observa la presencia de datos atípicos. Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos a lo largo de la caja, no se indica presencia de asimetría.
Se puede observar la media, los cuartiles, el número de datos analizados, la media, desviación estándar, prueba sobre la media, los intervalos de confianza y estadísticos de prueba etc.
Variable Oil Quota Change Date
Análisis Descriptivo: No presenta datos la variable
Escala de medida: Nominal
Se puede observar la frecuencia
Variable Oil > Oil Quota
Análisis Descriptivo
Escala de medida: Nominal
Representación grafica: Histograma
Se puede observar la frecuencia, el número de datos analizados, los intervalos de confianza
Variable FluidTotal
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable FluidTotal no se observa la presencia de datos outliers, todos los valores están entre 469 y 1464.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos en la parte central de la caja y la línea dentro de la caja señala la posición de la mediana, como la mediana se encuentra alejada del tercer cuartil entonces se observa presencia de asimetría a la derecha de la caja.
Se puede observar la media, los cuartiles, el número de datos analizados, la media, desviación estándar, prueba sobre la media, los intervalos de confianza y estadísticos de prueba etc.
Variable Oil
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable Oil no se observa la presencia de datos outliers, todos los valores están entre 365 y 1463.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos en la parte central de la caja y la línea dentro de la caja señala la posición de la mediana, como ésta se encuentra casi en la mitad de la caja no se indica presencia de asimetría.
Se puede observar la media, los cuartiles, el número de datos analizados, la media, desviación estándar, prueba sobre la media, los intervalos de confianza y estadísticos de prueba etc.
Variable Gas
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable Gas no se observa la presencia de datos outliers, todos los valores están entre 6 y 218.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos en la parte central de la caja y la línea dentro de la caja señala la posición de la mediana, como la mediana se encuentra alejada del tercer cuartil entonces se observa presencia de asimetría a la derecha de la caja.
Se puede observar la media, los cuartiles, el número de datos analizados, la media, desviación estándar, prueba sobre la media, los intervalos de confianza y estadísticos de prueba etc.
Variable Water
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable Water se observa la presencia de un dato outliers en la parte superior del intervalo, valor que no están entre 1 y 179.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos en la parte central de la caja y la línea dentro de la caja señala la posición de la mediana, como ésta se encuentra casi en la mitad de la caja no se indica presencia de asimetría.
Se puede observar la media, los cuartiles, el número de datos analizados, la media, desviación estándar, prueba sobre la media, los intervalos de confianza y estadísticos de prueba etc.
Variable BS&W Sedimento Básico y Agua
Análisis Descriptivo
Escala de medida: Continuo
Representación grafica: Boxplot
Medidas de Tendencia Central: Mediana
Medidas de Dispersión: Intercuartílico
En la variable BS&W se observa la presencia de un dato outliers en la parte superior del intervalo, valor que no están entre 0,1 y 50.
Los límites superior e inferior de la caja marcan los cuartiles superior e inferior de los datos. Se observa una gran concentración de datos en la parte central de la caja y la línea dentro de la caja señala la posición de la mediana, como esta
...