Guia Stata
Enviado por darugia • 24 de Enero de 2014 • 6.645 Palabras (27 Páginas) • 489 Visitas
Introducción
Este documento pretende los introducir el uso del programa STATA, mediante la entrega de conceptos y comandos básicos para el inicio en este software. En una primera parte haremos una pequeña introducción al programa, luego veremos brevemente como se carga una base de datos, y en una tercera parte se verá cual es la manera más adecuada de trabajar con ella. Adicionalmente, en una cuarta parte se verán los comandos que comúnmente se utilizan para inspeccionar una base de datos y obtener estadísticas descriptivas de sus variables, específicamente veremos comandos como sum, el cual nos entrega un set de estadísticas básicas de la variable, describe, y varios otros. En una quinta parte se enseñara como se pueden modificar las bases de datos, especialmente, cambiando el nombre de las variables, unir bases de datos, eliminar y agregar variables, cambiar la estructura de ellas y crear nuevas variables a partir de las variables existentes.
En una sexta parte se aplicará lo aprendido y a partir de ese ejercicio se introducirá la utilidad de los archivos log y do. En la séptima parte se mostrará cómo podemos plasmar la información que nos interesa de los datos en diferentes tipos de gráficos. Finalmente en la octava y última parte se enseñará la utilidad del comando help, el cual nos será de gran utilidad para poder avanzar y utilizar stata cuando no tenemos muy claro cual es el comando a utilizar.
Es importante aclarar que gran parte de los comandos de stata se puede hacer mediante la utilización directa del comando, o mediante la utilización de ventanas. Durante este curso veremos ambas formas.
Un concepto importante de entender antes de comenzar a utilizar este software estadístico, es el de Base de Datos, el primer paso para poder trabajar con STATA es cargar la base de datos. Una base de datos en un conjunto (matriz) de información, tenemos filas y columnas, las que en su conjunto forman la base de datos. Generalmente se organiza de forma tal que las variables se representan por columnas y las observaciones por filas. Por ejemplo, si estamos estudiando las variables escolaridad e ingreso para las mujeres. Nuestra base de datos tendrá dos columnas, donde cada una de ellas representa la escolaridad e ingreso, y cada fila representa una mujer.
Escolaridad Ingreso
10 80.000
12 120.000
13 110.000
4 85.000
5 70.000
8 65.000
17 450.000
21 1.200.000
2 60.000
5 75.000
I. Una pequeña introducción al programa
STATA es una aplicación completa e integrada, basada en comandos, que tiene todos los elementos necesarios para realizar análisis estadístico, manejo de datos estadísticos y gráficos. Las versiones mas nuevas de STATA (a partir de la versión 8.0) posee una forma más fácil de utilizar, que consiste simplemente en hacer clic en ventanas con las opciones de análisis y procesamiento de datos, además tiene la opción “antigua” mediante los comandos. El programa posee una ayuda en línea, es un programa fácil y rápido de utilizar.
¿Cómo se ve STATA?
Cuando abrimos el programa, inmediatamente podemos distinguir 4 ventanas:
Review: en esta ventana aparecen los comandos que han sido utilizados durante la sección en turno.
Results: muestra los resultados de la aplicación de los comandos, sólo los resultados más recientes son visibles en esta ventana
Variables: en esta venta se presenta el listado de variables que se encuentran en la base de datos que se este trabajando
Commands: corresponde a la ventana donde introducen los comandos para obtener el resultado deseado. Sirve para utilizar STATA en forma interactiva.
II. Como organizar el trabajo en STATA
Cuando se abre STATA es importante saber donde se esta trabajando, es decir, en que carpeta se están guardando los resultados o desde que carpeta vamos a llamar la base de datos, etc. Si no se sabe la carpeta o directorio donde STATA esta ubicado podemos averiguarlo escribiendo el comando pwd:
Pwd
C:\data => Este resultado nos indica que estamos ubicados en el disco C del computador en la carpeta data
Para cambiar el directorio o carpeta se debe realizar lo siguiente:
cd C:\Nivelacion_Stata
Utilizo el comando cd y entrego la nueva ruta. En este caso le estoy indicando al programa que se ubique en la carpeta “Nivelacion_Stata” que se encuentra en el disco C del computador.
La ventaja de indicar desde un comienzo en que carpeta del computador se esta trabajando, es que evita indicar la ruta completa de los archivos cada vez que queramos abrir o guardar una base de datos, o abrir o guardar un log. Obviamente esto tiene sentido cuando para un trabajo específico tenemos todos los archivos necesarios en la misma carpeta.
Por ejemplo, si estamos trabajando con información de tres bases de datos distintas, y queremos dejar la información relevante para el estudio en una sola base datos (más adelante veremos como hacer esto), lo ideal es trabajar en una sola carpeta, “Nivelacion_Stata”, y no tener las tres bases de datos repartidas en carpetas distintas. Si no están en la misma carpeta no es útil indicarle el directorio al comienzo, ya que igual cuando llamemos a cada una de las bases de datos, al estar en carpetas distintas, tendremos que cambiar la ruta.
Importante: los sistemas operativos más nuevos permiten que las carpetas tengan nombres con espacio en blanco, por ejemplo, “Nivelacion Stata”. Sin embargo, STATA no va a reconocer una carpeta que tenga espacios en blanco en el nombre, a no ser que se indique la ubicación de esta carpeta entre comillas. Por este motivo, se debe evitar llamar a una carpeta con la que van a trabajar en STATA con nombres que contengan espacios en blanco.
Supongamos que la carpeta en que vamos a tratar se llama “Nivelacion Stata”, en la primera línea del siguiente cuadro podemos apreciar que al entregar la ubicación de la carpeta utilizando el comando cd, el programa nos entrega un error “invalid syntax”, esto se debe a que el nombre de la carpeta tiene espacios en blanco. Si agregamos comillas a la ruta no se produce el error.
Nota: si al introducir un comando no aparece un punto blanco después de ejecutado el comando, significa que no se termino o no se ha terminado de ejecutar. Además, siempre que aparezcan letras rojas significa que hay un error, la ayuda para el
...