Trabajo inferencia estadística base de datos (CASEN09)

Enviado por Joo Vicencio • 9 de Diciembre de 2015 • Examen • 1.001 Palabras (5 Páginas) • 241 Visitas

Página 1 de 5

[pic 1]

Integrantes :

Karla Carmona

Carolina Nova

María José Urra

Josefina Vicencio

Marco Teórico :

La Encuesta de Caracterización Socioeconómica Nacional (Casen) del Ministerio de Desarrollo Social es una encuesta a hogares, de carácter multipropósito, es decir, que abarca diversos temas como educación, trabajo, ingresos, salud, entre otros; además es una encuesta transversal, por lo tanto, incluye a todo el espectro de la población del país.

Se realiza una medición del bienestar material de los hogares y a partir de esos datos se desarrollan indicadores de distribución del ingreso, acceso a servicios sociales y pobreza.

Datos :

Se utilizará la base de datos casen2011_ie.dta, esta contiene una sub muestra de la base de datos original de la encuesta CASEN 20011, la cual contempla 4853 observaciones y 7 variables:

comuna: 6 comunas enumeradas de 1 a 6

zona: zona urbana =1 o rural = 2

sexo: hombre=1 y mujer =2

región: en esta muestra solo utilizaremos la R.M (región=13 para todas las observaciones)

edad: años cumplidos

ecivil: estado civil (tiene seguro = 1, no tiene seguro = 0)

ytotaj: ingreso total

Estadística Descriptiva

[pic 2]

De la tabla podemos ver que la base de datos describe datos sólo para la región metropolitana.

[pic 3]

La edad promedio de la muestra son 43 año aprox. Además, tenemos que el promedio de los ingresos totales de los hogares de la 13ava región es de 628.100 pesos.

Pasaremos a analizar por separado las variables cualitativas y categóricas:

La distribución de las observaciones por comuna queda de la siguiente manera, donde el total de observaciones de la zona rural (38 obs) pertenecen a la comuna 4, y la moda se encuentra en la comuna 5 con 1003 observaciones:

[pic 4]

La muestra está compuesta por semejante cantidad de hombres como de mujeres:

[pic 5]

El 38,62% de la muestra se encuentra casada, y el 32,93% soltera:

[pic 6]

Diferencias en las medias

¿Es la diferencia de ingresos entre la comuna 3 y la 6 significativa? ¿De cuánto es?

gen comuna36=.

replace comuna36=3 if comuna==3

replace comuna36=6 if comuna==6

ttest ytotaj, by(comuna36)

Generamos una variable cualquiera a la cual llamaremos “comuna36”, está compuesta por puros missing values, luego le damos los valores para cuando “comuna” sea igual a 3, y para cuando comuna sea igual a 6, de esta forma evaluamos las comunas de interés al aplicar el test estadístico.

[pic 7][pic 8][pic 9][pic 10]

Luego pasamos a ver si existe diferencia entre ambas medias, y si estas son significativas:

Podemos ver que la diferencia entre las medias es de 111972 pesos en el ingreso total de los hogares entre la comuna 3 y 6, además estas son significativas incluso al 1% de significancia (IC 99%) dado el test t de dos colas, por lo que se rechaza la hipótesis nula. Dada la cantidad de observaciones suficientemente grande y representativa para la 13ava región, podemos afirmar que existe una significativa desigualdad en el ingreso de los hogares entre ambas comunas.

¿Existe diferente porcentaje de personas casados entre el grupo menor a la mediana de la edad, y el grupo mayor o igual a la mediana? ¿Es significativa la diferencia?

sum edad,d

gen grupo_edad=.

replace grupo_edad=1 if edad<43

replace grupo_edad=2 if edad>=43

ttest ecivil if ecivil==1, by(grupo_edad)

Primero analizamos los percentiles, donde el valor del percentil 50 (mediana) de la variable edad es 43 años:

[pic 11][pic 12]

Ahora creamos una variable cualquiera que llamaremos “grupo_edad”, a la cual le asignaremos 1 si la edad del individuo es menor a la mediana (43 años), y 2 si es que tienen igual o más que 43 años.

Como la variable a evaluar es una variable categorica (ecivil=casado), debemos trabajar con su porcentaje condicionado en este caso a la variable “grupo_edad”.

...

Descargar como (para miembros actualizados) txt (6 Kb) pdf (337 Kb) docx (345 Kb)

Leer 4 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com

Información sobre ensayo

prev next

Denunciar este ensayo

Ensayos relacionados

Base Datos
Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso

2 Páginas • 3013 Visualizaciones
Herrmaientas De Una Base Datos
HERRAMIENTAS PARA LA ADMINISTRACIÓN DE UNA BASE DE DATOS Herramienta de recuperación de una base de datos La herramienta de administración de recuperación de la

8 Páginas • 1943 Visualizaciones
TC1 Base Datos
Actividad Teórica 1. Conteste las siguientes preguntas: a. ¿Cuáles son las cuatro principales diferencias entre un sistema de procesamiento de archivos y un SGDB? DIFERENCIA

10 Páginas • 1649 Visualizaciones
TRABAJO COLABORATIVO No.1 BASE DE DATOS AVANZADO
INTRODUCCION El presente trabajo colaborativo está orientado en un problema de la droguería larga vida en la cual se estructura el modelo entidad relación, permitiendo

4 Páginas • 911 Visualizaciones
TRABAJO COLABORATIVO 3 ESTRUCTURAS DE DATOS
ACTIVIDAD 1: TEORIA DE ÁRBOLES BINARIOS DE BÚSQUEDA Esta sección discute una de las estructuras de datos más importantes de la informática, el árbol binario

2 Páginas • 885 Visualizaciones
BASE DATOS
JAIR**PRODUCTOS > REGISTRAR > EN DESCRIPCION DEBE PERMITIR INGRESAR CARACTERES NUMERICOS JAIR**PRODUCTOS > REGISTRAR > AL GUARDAR Y EDITAR LOS DATOS ERROR EN BD: La

19 Páginas • 1690 Visualizaciones
Base De Base Datos
Diseño Conceptual de una Base de Datos Es un conjunto de actividades que resultan en un esquema conceptual de alto nivel de una base de

43 Páginas • 1652 Visualizaciones
BASE DATOS
CONTENIDO Un sistema numérico es un modo sistemático de representación de números con caracteres simbólicos que utiliza un valor base para agrupar de una manera

3 Páginas • 1395 Visualizaciones
Base Datos
Estadística y estadísticas Todos hemos oído aplicar la palabra estadísticas para designar cuadros numéricos que contienen datos cuantitativos en las secciones financieras de los periódicos,

5 Páginas • 1370 Visualizaciones
Bases Datos 4
Integridad referencial en MySQL * Claves foráneas e integridad referencial Claves foráneas e integridad referencial Podemos decir de manera simple que integridad referencial significa que

15 Páginas • 1424 Visualizaciones