Taller Estadística Inferencial Metodología de la Investigación
Enviado por anavelezh • 15 de Agosto de 2016 • Apuntes • 1.733 Palabras (7 Páginas) • 476 Visitas
Taller Estadística Inferencial
Metodología de la Investigación
Octubre 22 de 2015
En Moodle encontrará la información necesaria para desarrollar cada uno de los puntos asignados.
Considere la información de la base de datos del censo en USA para el año 2013. Esta información se encuentra disponible en el siguiente enlace: http://quickfacts.census.gov/qfd/download_data.html.
1. Realice un análisis exploratorio de la base de datos, considerando los siguientes elementos:
1.1. ¿Quién desarrolló esta información?, ¿qué características tiene el formato en el que se encuentran los datos originalmente?, ¿cómo se tuvo que editar esta información para obtener la base de datos que usted tiene en Excel?
→ La información fue desarrollada por United States Census Bureau, que es una agencia principal del Sistema Federal de Estadística responsable de producir datos sobre el pueblo estadounidense y la economía.
→En “Block de Notas”, formato .txt
→
Para agregar encabezados de las columnas descriptivas para los datos en Excel
Columnas en DataSet.txt se identifican por la mnemotecnia 9 caracteres como PST045214. Si bien la definición de cada tecla de acceso se proporciona en DataDict.txt, con frecuencia es preferible combinarlos en el archivo de datos.
Descarga DataSet.txt, DataDict.txt y FIPS_CountyName.txt en una unidad local.
Abra el archivo DataDict.txt. Se le pedirá a través del Asistente para importar texto
Haga clic en Siguiente
Haga clic y arrastre el primer punto de ruptura con el carácter 10
Elimine cada punto de quiebre (doble clic sobre él) que aparece después de 10 caracteres
Confirme o agregar puntos de quiebre (sólo click en caracteres 97, 101, 109, 119, 128, y 138
Haga clic en Siguiente
Haga clic en Finalizar
Transponer la información de cada fila para crear títulos de las columnas
Inserte 3 filas en blanco en la parte superior de la hoja de trabajo Datadict
Seleccione células de partida con A5 (el que lee STATECOU) a la celda en la parte inferior de la columna B (B58)
Copiarla (Edición-Copiar o Ctrl-C)
Seleccione la celda A1
En el menú Edición, haga clic en Pegado especial
Seleccione la casilla de transposición y, a continuación, haga clic en Aceptar
Guardar como libro de Excel (.xlsx) o Excel 97-2003 (.xls)
Abrir DataSet.txt y el trabajo a través del asistente
Asegúrese de que se selecciona el botón de opción Delimitado; haga clic en Siguiente
Ponga una marca de verificación junto a la coma; haga clic en Siguiente
Haga clic en el botón de radio para el texto con la primera columna resaltada; para el resto de las columnas, el formato general por defecto es suficiente; haga clic en Finalizar
Inserte 3 líneas en blanco en la parte superior de la hoja de cálculo
Copie las partidas de Datadict a la parte superior de la hoja de trabajo DataSet
Copie las 2 primeras líneas de la Datadict en las 2 primeras líneas de la hoja de cálculo DataSet
Si la nemotécnica en la línea 1 de acuerdo con la nemotécnica en la línea 4, ya está.
Guardar como libro de Excel (.xlsx) o Excel 97-2003 (.xls)
Para añadir en los nombres de estado y del condado a los datos en Excel
En la hoja de cálculo conjunto de datos, agregar una columna a la izquierda de la columna A para aceptar el nombre del condado
Abra el archivo en Excel FIPS_CountyName.txt
En el asistente de importación
Seleccione anchura fija, y luego Siguiente
Mueva la línea de ruptura con el principio del nombre (carácter 6), y haga clic en Siguiente
Haga clic en el botón situado junto al texto, mientras que la primera columna aparece resaltado.
Haga clic en Finalizar
Copie las celdas B1: B3195, y pegarlos en la hoja de cálculo conjunto de datos, en la celda de la columna A a la izquierda de código 00000 en la columna B.
Guardar como libro de Excel (.xlsx) o Excel 97-2003 (.xls)
1.2. Determine el número total de registros
Filas: Registros: 3195
1.3. Determine el número total de variables:
Columnas: Variables: 57
1.3.1. La base de datos tiene variables nominales, continuas y discretas. Dé un ejemplo de cada una.
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
-Variable discreta: Es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Ejemplo de variable cuantitativa discreta: _ Estimación de la población en 2013.
-Variable continua: Es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
Ejemplo de variable cuantitativa continua: Área de la tierra en millas cuadradas
Variable cualitativa
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:
-Variable cualitativa nominal: Presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Ejemplo de variable cualitativa nominal: Estados
-Variable cualitativa ordinal o variable cuasicuantitativa: Presenta modalidades no númericas, en las que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.
1.3.2. Seleccione una de las variables, elabore un gráfico exploratorio e interprételo en menos de 100 palabras.
Grafico exploratorio escogido: Diagrama de cajas.
Variable escogida: Personas de 65 y más años.
[pic 1]
La mayoría de las medias se encuentran entre el 10 y el 20 por ciento. También se observa algunas cajas con datos dispersos “no concentrados” (cuyos bigotes están muy retirados de la caja) y con una ubicación de la media que no es del todo en la mitad (algunas veces más a la derecha y otras más a la izquierda), generando algo como:
...