Análisis de las variaciones de una variable cuantitativa de interés mediante factores no aleatorios
Enviado por NatyChang • 29 de Junio de 2019 • Documentos de Investigación • 5.507 Palabras (23 Páginas) • 76 Visitas
[pic 1]
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICAS:
Estadística Inferencial
ANÁLISIS DE LAS VARIACIONES DE UNA VARIABLE CUANTITATIVA DE INTERÉS MEDIANTE FACTORES NO ALEATORIOS
Nathalie Chang Silva
Jefferson Vásquez Reyes
Yuly Sánchez Olvera
Simón Macías Moreno
Hugo Wong Pavon
Jennifer Moreira Limon
Wesley Briones Pincay
Tutor
Jennifer Marcillo Chasy
GUAYAQUIL-ECUADOR
2018
Índice
1. Introducción 1
Descripción y tipo del proyecto 1
Objetivo General 1
Objetivo Específico 1
2. Metodología de Obtención de Datos 2
3. MARCO TEÓRICO 2
Intervalos de confianza 3
Diseño de un experimento 4
ANOVA 4
3. Análisis Exploratorio de datos 6
4. Inferencias Estadísticas 22
5. Conclusiones 34
6. Recomendaciones 35
7. Bibliografía 35
Introducción
Descripción y tipo del proyecto
El tema que se desarrollará en el presente proyecto es un análisis estadístico de varianza, también de las variables cuantitativas por medio de una base de datos de la parroquia “El Batán”, el cual consta con más de mil datos sobre el avaluó real, área de terreno, área de construcción, calles, uso general y el tiempo de proceso.
En el análisis estadístico que se realizará, se dará sobre todo un enfoque a los resultados que se obtendrán por medio del cálculo de la tabla de ANOVA. Toda la información adicionalmente será analizada por medio de gráficos tales como diagrama de caja y diagrama de barras. Gracias a este proyecto podremos llevar a cabo un análisis de las variables explicativas, que por lo general son aquellas que los usuarios más presentan reclamos e inconformidad. Debido a que muchas veces estas corporaciones hacen mal uso de los materiales o no son distribuidos debidamente, para tener una mejor clasificación se recurrirá a análisis de variaciones de las variables cuantitativas antes mencionadas como el área del terreno. El proyecto presentara de manera estructurada los objetivos que se quieren alcanzar, la metodología usada, los resultados arrojados por los cálculos y por supuesto se dará una conclusión para poder dar las recomendaciones requeridas al caso.
Objetivo General
- Realizar un modelo estadístico que permita interpretar las variaciones de dos o tres variables cuantitativas de los datos de la parroquia “El Batán”.
Objetivo Específico
- Establecer inferencias de estas variables explicativas por medio de un análisis de varianza (ANOVA).
- Trabajar con prueba Ji-Cuadrado para tablas de contingencia.
- Realizar prueba de normalidad y transformación de datos para conseguir normalidad de las observaciones
Metodología de Obtención de Datos
Se informa de la obtención de datos por medio de una base de datos de la parroquia “El Batán”, la cual se utilizará como fuente de datos que detalla ordenadamente la población a la cual se procederá hacer análisis de varianzas de acuerdo con cada una de sus variables explicativas. Esta base de datos es aceptada por el ilustre consejo cantonal de Cuenca, la cual fue expuesta a muchos tratamientos verificados por la COOTAD, y su matriz de datos será analizada por medio de tablas de comparación con los respectivos análisis de varianza (ANOVA) de una o dos de sus variables.
MARCO TEÓRICO
El análisis exploratorio de datos es la primera fase de todo análisis de datos, esto nos ayuda a ordenar la información que nos brinda los datos, de tal manera que nos permita observar algún tipo de patrón de comportamiento. Son múltiples los motivos por los cuales se examinan los datos, entre ellos tenemos: conocer a detalle la información proporcionada y también conocer sus limitaciones, conocer como está estructurada la información, detectar los probables problemas en los datos, detectar patrones y poder seleccionar un método adecuado para evaluar las hipótesis planteadas.(Orellana & Bianco, n.d.)
Es necesario identificar con tipo de datos estamos trabajando para de esa forma decidir que análisis estadístico es conveniente utilizar. Todos estos datos una vez tabulados se los puede llevar a una representación gráfica como histogramas, grafico de barras, grafico de tortas, entre otros. La información de los datos puede ser resumida mediante medidas de fácil interpretación que pueden mostrar las características más relevantes de los datos analizados. Entre ellas tenemos medidas de posición o localización y medidas de dispersión o escala. Dentro de las medidas de posición tenemos al promedio o media muestral, mediana muestral y poblacional y medias -Podadas. En las medidas de dispersión tenemos al rango muestral, varianza muestral distancia intercuartil y desvío absoluto mediano De la misma forma este tipo de datos pueden ser representados mediante gráficos como Boxplot, QQplot.[pic 2]
[pic 3][pic 4]
Fig.1. Gráfico de Boxplot Fig.2. Gráfico de QQplot
En todo proceso de medición y recopilación de datos existen limitaciones dadas por el observador, los instrumentos utilizados y el método de medición. Estos errores pueden ser de tipo sistemáticos (sesgo) que surgen debido a la falla del equipo o diseño, o también pueden ser errores aleatorios que derivan por efectos de variables no controladas. Se pueden minimizar y realizar medidas independientes al evaluarlos mediante procedimientos estadísticos.
...