Actividad 1. Ampliación de la base de datos
Enviado por jant • 28 de Mayo de 2014 • 1.416 Palabras (6 Páginas) • 295 Visitas
Actividad 1. Ampliación de la base de datos: En la base de datos de estudio van a encontrar diferentes variables continuas: salario, gastos, años de escolaridad, horas de deporte a la semana, edad.
Para la variable salario se trabaja con el siguiente criterio:
• Salario Alto Valores superiores a 3400000
• Salario Medio Valores entre 900000 y 3400000
• Salario bajo Valores inferiores a 900000
De acuerdo a estos criterios adicione en la base de datos una columna para el salario que identifique a los clientes de acuerdo a esta clasificación. Similar procedimiento deben realizar para otras variables, es decir si la variable es cuantitativa la puede transformar a variable cualitativa creando categorías de acuerdo a el criterio que el grupo de trabajo defina.
(Para el salario el criterio utilizado fue el de los percentiles 25 y 75. Estos percentiles se calcularon con la función fx en Excel y de acuerdo a sus valores se estableció el criterio de la tabla)
Para todas las variables se ha utilizado el criterio de percentiles 25 y 75, con el fin de establecer un rango bajo, un rango medio y un rango alto.
Actividad 2. Tablas bidimensionales (tablas dinámicas): Construir tablas bidimensionales que muestren las probabilidades (marginales, condicionales y conjuntas) para las siguientes variables:
Tabla 1: Salario (Alto, medio, bajo) y Gasto (Alto, medio, bajo).
Cuenta de RANGO DE SALARIO Etiquetas de columna
Etiquetas de fila Salario alto Salario bajo Salario medio Total general
Gastos altos 111 111
Gastos bajos 69 69
Gastos intermedios 320 320
Total general 111 69 320 500
Probabilidad de que una persona tenga ingreso alto 22,2000%
Probabilidad de que una persona tenga ingreso medio 64,0000%
Probabilidad de que una persona tenga ingreso bajo 13,8000%
Probabilidad de que una persona tenga gasto alto 22,2000%
Probabilidad de que una persona tenga gasto medio 64,0000%
Probabilidad de que una persona tenga gasto bajo 13,8000%
Probabilidad condicional
Cuál es la probabilidad de que una persona tenga ingresos altos y gastos altos
Sabiendo que P (B ˄ A) = 111/500 = 22%
P (A / B) = 22%/22% = 100%
Probabilidad marginal
Cuál es la probabilidad que una persona tenga un salario alto superior a $3400.000
P(A) = 111/500 = 22,20%
Probabilidad conjunta
Cuál es la probabilidad de que una persona tenga un salario mayor de $900.000
P(A) = 111/500 + 320/500 = 22,20% + 64,00% = 86,20%
Tabla 2: Salario (Alto, medio, bajo) y Años de Escolaridad
Cuenta de RANGO DE ESCOLARIDAD Etiquetas de columna
Etiquetas de fila Salario alto Salario bajo Salario medio Total general
E alta 20 10 45 75
E baja 25 7 63 95
E media 66 52 212 330
Total general 111 69 320 500
Probabilidad de que una persona tenga ingreso alto y grado alto de educación 4,000%
Probabilidad de que una persona tenga ingreso alto y grado medio de educación 13,200%
Probabilidad condicional
Cuál es la probabilidad que una persona tenga salario alto y un grado de educación medio hacia arriba
Sabiendo que P (B ˄ A) = 20/500 = 4%
P (A / B) = 4% / 13% = 30%
Probabilidad marginal
Cuál es la probabilidad que una personas tenga salario alto y un grado de educación bajo P(A) = 25/500 = 5%
Probabilidad conjunta
Cuál es la probabilidad que una personas tenga salario medio hacia arriba y una educación media P(A) = 66/500 + 212/500 = 13% + 42% = 55%
Tabla 3: Frecuencia con la que ve televisión y género.
Cuenta de Ve televisión Etiquetas de columna
Etiquetas de fila A veces Nunca Siempre Total general
Femenino 40 25 225 290
Masculino 25 10 175 210
Total general 65 35 400 500
El 8,6% del género femenino nunca ve televisión
El 13,8% del género femenino a veces ve televisión
El 77,6% del género femenino siempre ve televisión
El 4,8% del género masculino nunca ve televisión
El 11,9% del género masculino a veces ve televisión
El 83,3% del género masculino siempre ve televisión
Tabla 4: Salario (Alto, medio, bajo) y número de hijos
Etiquetas de fila Salario alto Salario bajo Salario medio Total general
0 0 0 0 0
1 16 9 40 65
2 44 16 120 180
3 90 66 264 420
4 80 52 148 280
5 80 70 200 350
6 6 114 120
Total general 316 213 886 1415
Probabilidad de que una persona tenga gasto medio 64,000%
Probabilidad de que una persona tenga gasto bajo 13,800%
Probabilidad condicional
Cuál es la probabilidad que una personas tenga salario alto y 3 hijos
Sabiendo que P (B ˄ A) = 111/500 = 22%
P (A / B) = 6% / 22% = 27,27%
Probabilidad marginal
Cuál es la probabilidad que una personas tenga salario medio y cuatro hijos
P(A) = 37/500 = 7,4%
Probabilidad conjunta
Cuál es la probabilidad que una personas tenga salario medio hacia arriba y dos hijos
P(A) = 60/500 + 22/500 = 12% + 4% = 16%
Tabla 5: Género y Años de escolaridad.
Cuenta de Género Etiquetas de columna
Etiquetas de fila Femenino Masculino Total general
8 3 2 5
9 2 3 5
10 7 6 13
11 10 9 19
12 12 7 19
13 27 7 34
14 46 27 73
15 25 21 46
16 35 24 59
17 34 22 56
18 18 14 32
19 31 33 64
20 19 10 29
21 2 3 5
22 4 6 10
23 8 4 12
25 7 12 19
Total general 290 210 500
Probabilidad de que una mujer tenga 12 años de escolaridad 2,4%
Probabilidad de que un hombre tenga 12 años de escolaridad 1,4%
Probabilidad condicional
...