Trabajo práctico. Encuesta de la Comunidad Estadounidense (ACS)
Enviado por Alejandra Yepez • 3 de Junio de 2024 • Tarea • 1.478 Palabras (6 Páginas) • 50 Visitas
República Bolivariana de Venezuela
Universidad Centroccidental “Lisandro Alvarado”
Decanato de Ciencias y Tecnología
Departamento de Sistemas
Barquisimeto Lara
TRABAJO PRÁCTICO
Barquisimeto, Mayo 2024
RESUMEN
Se analizó un conjunto de datos de la Encuesta de la Comunidad Estadounidense (ACS) que contiene información sobre 2.000 individuos seleccionados aleatoriamente. Se realizó un análisis descriptivo e inferencial para determinar si existen diferencias significativas entre diferentes grupos de individuos en términos de variables como raza, edad, sexo, horas de trabajo semanales y otras características relevantes.
Los resultados del análisis mostraron diferencias significativas en la distribución de variables demográficas como la raza, la edad y el sexo. Se observó una brecha salarial racial significativa, donde el ingreso promedio de los blancos es significativamente mayor que el de otros grupos raciales. Las causas de estas desigualdades son complejas y probablemente multifactoriales, incluyendo la discriminación, las diferencias en niveles educativos y oportunidades de empleo.
INTRODUCCIÓN
La Encuesta de la Comunidad Estadounidense (ACS) es una encuesta anual realizada por la Oficina del Censo de los Estados Unidos que recopila información sobre una amplia gama de características demográficas, sociales y económicas de la población estadounidense. La encuesta se basa en una muestra aleatoria de alrededor de 3.5 millones de hogares, lo que representa aproximadamente el 3% de todos los hogares en los Estados Unidos. Esta encuesta proporciona datos valiosos para comprender las tendencias y patrones en la población estadounidense, y se utiliza para informar una variedad de políticas y programas gubernamentales. En este trabajo, se analizará un conjunto de datos de la ACS que contiene información sobre 2.000 individuos seleccionados aleatoriamente. El objetivo del análisis es determinar si existen diferencias significativas entre diferentes grupos de individuos en términos de variables como raza, edad, sexo, horas de trabajo semanales y otras características relevantes.
METODOLOGÍA EMPLEADA Y TÉCNICAS ESTADÍSTICAS UTILIZADAS
- ANÁLISIS DESCRIPTIVO
Primero, establecemos las variables a estudiar y con las cuales se pueden calcular las medidas numéricas pertinentes para cada grupo:[pic 1]
- Race (Raza): Variable categórica que representa la raza de la persona.
- Sex (Sexo): Variable categórica que representa el sexo de la persona.
- Married (Estado civil): Variable categórica que representa el estado civil de la persona.
- USCitizen (Ciudadanía): Variable categórica que representa la ciudadanía de la persona.
- Language (Idioma): Variable categórica que representa el idioma principal hablado por la persona.
- Income (Ingresos): Variable numérica que representa los ingresos de la persona.[pic 2]
[pic 3][pic 4]
Se puede observar que las variables obtenidas de la muestra poseen diversas medias, varianzas y desviaciones estándar. Deseamos saber si las variables estudiadas de la muestra siguen una distribución normal. Para verificar si las distribuciones de los datos se comportan de manera normal, utilizaremos un software estadístico para que evalúe la distribución normal de las variables establecidas usando el test de Shapiro-Wilk a ambas muestras para demostrar la normalidad, obtenemos lo siguiente:
Con las respectivas hipótesis establecidas.
: La variable tiene distribución normal.[pic 5]
: La variable tiene distribución no normal.[pic 7][pic 6]
- ANÁLISIS INFERENCIAL
Para este caso fue elegido comparar los ingresos entre diferentes razas, por lo cual se establecieron las hipótesis nula () y alternativa (). Utilizando el método estadístico de prueba de ANOVA para comparar los ingresos entre diferentes razas, las hipótesis serían:[pic 8][pic 9]
: No hay diferencias significativas en los ingresos entre las diferentes razas.[pic 10]
: Hay diferencias significativas en los ingresos entre las diferentes razas.[pic 11]
También se debe tomar en cuenta que dependiendo del tipo de prueba estadística se estiman los parámetros, para este caso uno de los parámetros a estimar es la media de los ingresos para cada grupo racial. Igualmente, los estimadores son funciones que se utilizan para estimar los parámetros desconocidos de una distribución de probabilidad. En el caso del ANOVA, el estimador de la media para cada grupo racial se basa en los datos observados de los ingresos en cada grupo.[pic 12]
En el método del ANOVA, se asume que las varianzas poblacionales son iguales entre los diferentes grupos raciales. Sin embargo, esta suposición debe ser verificada mediante pruebas estadísticas, como la prueba de igualdad de varianzas (por ejemplo, la prueba de Levene), anexa en la siguiente imagen según los datos ingresados en el software R; la cual, indica que no se tiene evidencia suficiente para determinar la diferencia entre las varianzas, por tanto se toman como iguales.
Es así como, el criterio para decidir cuál hipótesis se elige suele basarse en el valor-p (p-value) y el intervalo de confianza. Si el valor-p es menor que el nivel de significancia (alpha) elegido (por ejemplo, 0.05), se rechaza la hipótesis nula en favor de la hipótesis alternativa. En consecuencia, según los datos obtenidos en R, se tiene que:[pic 13]
El estadístico F es un estadístico de prueba que se utiliza para evaluar la hipótesis nula. El estadístico F se calcula dividiendo la varianza entre grupos por la varianza dentro de los grupos. Si el estadístico F es grande, sugiere que existe una diferencia en el ingreso medio entre los diferentes grupos raciales. El valor p es la probabilidad de obtener un estadístico de prueba tan extremo o más extremo que el observado, asumiendo que la hipótesis nula es verdadera.Si el valor p es pequeño, sugiere que es poco probable que los resultados observados hubieran ocurrido si la hipótesis nula fuera cierta.
...