Manejo de bases de datos y analisis de resultados SPSS y Easy fit
Enviado por josenxp69 • 31 de Octubre de 2019 • Informe • 4.625 Palabras (19 Páginas) • 307 Visitas
PRÁCTICA CON EASY FIT Y SPSS
JOSÉ DANIEL ROJAS CELIS
VALENTINA AVELLA GÓMEZ
TÉCNICAS DE VALIDACIÓN Y SIMULACIÓN
UNIVERSIDAD COOPERATIVA DE COLOMBIA
INGENIERÍA EN TELECOMUNICACIONES
INGENIERÍA INDUSTRIAL
BOGOTÁ, D.C.
SEPTIEMBRE DE 2019
INTRODUCCIÓN
Los programas SPSS y Easy Fit , son programas estadísticos utilizados a nivel mundial , por sus excelentes características para ser usados en los campos de investigación de mercados (mercadotecnia), son de alta relevancia ya que permiten trabajar con grandes bases de datos y manejan una interfaz bastante simple para el análisis de datos, aunque en SPSS , solo permite hacer pruebas de hipótesis con un nivel significancia del 95 % , mientras que Easy Fit , nos permite hacer pruebas de hipótesis con diferentes de niveles de significancia , y nos indica cual es la distribución a la que mejor se ajusta un conjunto de datos sin importar la cantidad de datos, por este motivo el aprender el correcto manejo de estos programas apoyan de forma positiva las temáticas de estudio del curso.
OBJETIVOS
OBJETIVO GENERAL
Analizar de forma correcta las tres bases de datos indicadas para esta practica haciendo uso de los programas SPSS y Easy Fit.
OBJETIVOS ESPECIFICOS
- Reconocer de forma correcta las herramientas ofrecidas por los programas para el análisis de datos.
- Identificar qué tipo de distribución y prueba de bondad logra ajustarse adecuadamente a cada conjunto de datos.
- Comprender cuales son las de distribuciones que mejor se ajustan a los conjuntos de datos de esta practica, con ayuda de los programas ,SPSS y Easy Fit
- Validar la información mediante distribuciones estadísticas y pruebas de ajuste de bondad de los siguientes criterios:
- Incidencia de pobreza en Colombia
- Temperatura
- Elementos químicos: SO2, NO2, CO y O3
CONTENIDO
1.
ANALISÍS ESTADÍSTICO
- INCIDENCIA DE POBREZA EN COLOMBIA
Comenzaremos con el archivo el archivo “incidencia de pobreza en Colombia”
[pic 1]
Figura 1. Conjunto de datos a analizar
Pasamos los datos a SPSS, en orden de año en una sola columna con el fin de evaluar que distribución cumple el total de los datos
[pic 2]
Figura 2.Ingreso de datos en programa SPSS
Datos ingresados: 270
Toma con medida de escala por ser datos numéricos. Realizamos una gráfica con el fin de evidenciar a qué tipo de distribución se pueden ajustar los datos.
[pic 3]
Figura 3. Grafica de total de datos
Evidenciamos posible campana gaussiana característica de una distribución normal.
Se evidencia que podría ser tratarse de una distribución normal por el pico que da la forma de campana carterista de este tipo de distribución normal o una distribución uniforme.
Hipotesis:
H0= El índice de pobreza en Colombia desde el año 2002 hasta el año 2018 al nivel de las ciudades de Colombia se pueden ajustar a una distribución normal.
H1= El índice de pobreza en Colombia desde el año 2002 hasta el año 2018 al nivel de las ciudades de Colombia no se pueden ajustar a una distribución normal.
[pic 4]
Figura 4. Resultados de prueba K-S para distribución normal
Prueba K-S
P (sig. Asintótica) < 0.05
se rechaza HO
Al revisamos que no pasa prueba K-S con Alpha 0,05, procedemos hacer prueba por medio de prueba ji– cuadrado para el programa solo nos permite hacer la prueba de bondad de ajuste tomando los datos como si fuera una distribución uniforme, se realiza prueba con estos parámetros ya establecidos y obtenemos los siguiente.
[pic 5]
Figura 5.Prueba Ji-cuadrado para distribución uniforme
Prueba Ji-cuadrado
muestra que
P (sig. Asintótica) > 0.05,
se acepta que es una distribución uniforme
Evidenciando que, si pasa como distribución uniforme, por Ji-cuadrado con un 95 % de confianza, pero al repetir prueba por K-S, para una distribución uniforme, evidenciamos que se rechaza.
[pic 6]
Figura 6, resultados de prueba K-S para distribución uniforme.
Prueba K-S
muestra que
P (sig. Asintótica) < 0.05
se rechaza que es una distribución uniforme
Procedemos a realizar comparativo con programa easy fit, obteniendo que la distribución que mejor se ajusta a el conjunto de datos es una distribución Gama.
[pic 7]
Figura 7. Análisis por programa easy fit distribución Gama, la distribución más acertada para el conjunto de datos.
Al revisar en el programa si la distribución uniforme y normal se aceptan en el programa vemos que si tanto para prueba K-S como Ji-cuadrado.
[pic 8]
Figura 8. Resultados de prueba k-s, chi cuadrado , Anderson Darling para distribucion Normal , se acepta en todos los niveles.
[pic 9]
Figura 9.Resultados de prueba k-s, Anderson Darling para distribucion uniforme
Se acepta en todos los niveles de la prueba K-S.
INTERPRETACIÓN:
Vemos la tabla titulada incidencia de pobreza en Colombia vemos un conjunto de datos comtinuo. Luego vemos la tabla Estadísticos de contraste donde vemos el valor del estadístico Ji-cuadrado (es el que dice Chi-cuadrado) con el valor de 51,704 con 201 grados de libertad (lo que dice gl 201) y el valor de p (es lo que dice Sig. asintótica) que dio 1,000.
Como el valor de p fue mayor que 0,05 se confirma que el conjunto de datos puede pertenecer a una ditribucion uniforme continua se concluye que hay evidencia suficiente para decir que el conjunto de datos, con un nivel de significación del 5% , pertenece a esta distribucion .
De igual manera al aplicar pruebas K-S con distribucion normal y uniforme , evidenciamos P (sig. Asintótica) es 0.000, evidenciando que es menor a 0.05, lo cual confirmaría que se rechaza la Hipótesis de que los datos pertenecen a una distribución normal, esto se aplica teniendo en cuenta solo los resultados obtenidos por el programa SPSS.
...