MUESTREO POR CONGLOMERADOS EN UNA ETAPA
Enviado por mmrrtt • 6 de Julio de 2019 • Apuntes • 4.846 Palabras (20 Páginas) • 227 Visitas
MUESTREO POR CONGLOMERADOS EN UNA ETAPA
1.1.- INTRODUCCIÓN
Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de muestreo es una colección, o conglomerado, de elementos.
Si el costo por obtener un marco que liste todos los elementos poblacionales es muy alto o si el costo por obtener observaciones se incrementa con la distancia que separa los elementos, el muestreo por conglomerados es menos costoso que el muestreo aleatorio simple.
La primera tarea en muestreo por conglomerados es especificar los conglomerados apropiados. Por otro lado, los elementos dentro de un conglomerado están frecuentemente juntos físicamente, por lo que tienden a presentar características similares, la medición en un elemento de un conglomerado puede estar altamente correlacionada con la del otro, por esta razón de proximidad, por ello, la cantidad de información acerca de un parámetro poblacional puede no incrementarse sustancialmente al tomar nuevas mediciones dentro de un conglomerado; en este caso, sería desperdiciar dinero tomar un conglomerado de gran tamaño. Sin embargo, pueden ocurrir situaciones en las cuales los elementos dentro de un conglomerado sean muy diferentes entre sí, en tales casos, una muestra que contenga pocos conglomerados grandes puede producir una estimación muy buena de un parámetro poblacional.
Si en el muestreo estratificado, las unidades en los estratos deben ser lo más homogéneas posibles, pero ser diferentes con las unidades de otros estratos, los conglomerados deben ser tan heterogéneos interiormente como se pueda, a la vez que muy similares entre sí, para poder aprovechar las ventajas económicas del muestreo por conglomerados.
El muestreo por conglomerados se utiliza cuando es fácil obtener un listado de subconjuntos de la población, por ejemplo los hospitales de una región, y no tenemos listados de las personas hospitalizadas, a quienes deseamos encuestar. Además, al tener la muestra de un conglomerado, las unidades muy próximas, los costos de traslados se abaratan considerablemente.
El principal inconveniente de este procedimiento estriba justamente en la proximidad de las unidades, que tienden a tener características parecidas las de un mismo conglomerado, disminuyendo la eficiencia del método. En estas condiciones puede ser más eficaz el muestreo aleatorio simple.
Vamos a presentar la terminología que emplearemos en el muestreo por conglomerados, tanto de la población, como de la muestra:
CONGLOMERADO i:
[pic 1]
Mi = Número de unidades del conglomerado i
i = Contador de conglomerados (desde i=1 hasta n o N)
j = Contador de unidades (desde j=1 hasta Mi)
xij = valor de la unidad j del conglomerado i.
[pic 2] Media poblacional del conglomerado i.
[pic 3] Total poblacional del conglomerado i.
POBLACIÓN:
N = Número de conglomerados de la población
[pic 4] Número de unidades totales (Tamaño de la población)
[pic 5] Tamaño promedio de los conglomerados
[pic 6] Tamaño promedio de los conglomerados estimado
MUESTRA:
n = Número de conglomerados extraídos en la muestra
[pic 7] Número de unidades extraídas de los n conglomerados muestreados
[pic 8] Tamaño promedio de los conglomerados muestreados
1.2.- ESTIMACIÓN DE MEDIAS.
El estimador de la media poblacional μ viene dado por la expresión:
[pic 9]
Es un estimador de indirecto de razón. Para que sea eficaz su empleo se requiere una buena correlación entre la variable de interés, en este caso el total del conglomerado i y la variable auxiliar, el tamaño del conglomerado (Mi). Lo que en general es fácil que suceda, ya que debemos esperar que a mayor tamaño del conglomerado, mayor total se dará en el mismo. Esto es particularmente cierto cuando la variable es una magnitud extensiva, por ejemplo en un edificio de viviendas que puede considerarse un conglomerado los ingresos totales estarán bien correlacionados con el número de familias que lo habitan. Por el contrario la temperatura de esas viviendas, magnitud intensiva, no tiene porque correlacionar con el número de ellas.
Varianza estimada de μ
La varianza del estimador de razón viene dada por la expresión:
[pic 10]
Que puede escribirse como:
[pic 11]= [pic 12]
Si se desconoce M, entonces el tamaño medio del conglomerado, [pic 13] puede ser estimado por [pic 14].
Límite de Error de la media poblacional estimada:
[pic 15]
1.3.- ESTIMACIÓN DEL TOTAL POBLACIONAL (τ).
Es necesario conocer el tamaño de la población M
Estimador del Total Poblacional τ
[pic 16]
Varianza Estimada de τ
[pic 17]
Límite para el error de estimación
[pic 18]
1.4.- CÁLCULO DEL TAMAÑO DE MUESTRA PARA ESTIMAR MEDIAS Y TOTALES.
Teniendo en cuenta que la cuasivarianza entre conglomerados de totales es:
[pic 19]
y que:
[pic 20]
[pic 21]
Si [pic 22] entonces [pic 23]. Para N =100 veces o más, se cumple la aproximación. En este caso la muestra se considera proveniente de una población infinita y escribiremos [pic 24] . Que despejando, quedará:
[pic 25] Tamaño de la muestra en función del error de la media.
En el caso que nos fijen el límite de error del total poblacional [pic 26] = e M, esto es el error del total es M veces el de la media (e), y considerando que M = [pic 27]N, sustituyendo en la expresión de [pic 28] , quedará :
...