Calculo de la muestra Metodos Cuantitativos
Enviado por GusttavoNolasco • 26 de Enero de 2017 • Apuntes • 2.482 Palabras (10 Páginas) • 304 Visitas
CÁLCULO DE LA MUESTRA REPRESENTATIVA
Por lo general, si de lo que se trata es estudiar a poblaciones concretas (cerradas, contables, con registro, enlistadas) las muestras habitualmente no son tan elevadas. Un elemento a destacar (cuando se quiere determinar la muestra “n” de una población) es la precisión con la que se quiere determinar a la muestra. En términos prácticos, para calcular el tamaño de la muestra a partir de una población de tamaño N conocido se aplica la fórmula:
n= Z2Npq___
NE2+Z2pq
En donde N es el tamaño conocido de la población (población total de una colonia, municipio o delegación); E es el grado de error absoluto prefijado o indica la precisión con que se generalizan los resultados; p es la probabilidad favorable, q es la probabilidad desfavorable o pq indica la variabilidad del fenómeno estudiado o simplemente que un evento se dé o no se dé, y; Z es el margen de probabilidad deseado o nivel de confianza requerido para generalizar los resultados hacia toda la población. En esta fórmula el único valor que se desconoce es el de n y es el que se desea determinar.
El nivel de confianza Z se obtiene de las tablas de áreas bajo la curva normal. Comúnmente se emplea el 95% y el 99% de confianza; por consiguiente se acepta un grado de error del 5% o del 1% respectivamente. Que sea 5% o 1%, es decisión del investigador con respecto al nivel de confianza deseado. Con el 95% o con el 99% de confianza (Z) se está señalando la probabilidad de que los datos de la muestra sean (resulten) 95% ó 99% equivalentes (idénticos) a la población total, con una probabilidad del 5% ó del 1% de que sean distintos. Para aplicar la fórmula, como se mencionó, se sustituyen estos porcentajes por valores tipificados en las tablas de áreas bajo la curva normal (el uso de la tabla se los enseñaron en algún curso de estadística; si no, consulten cualquier texto de estadística y ahí se les indica como usarlas). Los porcentajes mencionados se dividen entre dos porque la curva normal se divide en dos partes simétricas. Así se tendría 47.50% y 49.50%; luego, por ser proporciones se divide entre 100 y el resultado es: .4750 y .4950, por lo tanto, 1.96 y 2.57 son los valores correspondientes de Z (1.96 y 2.57 son valores de correspondencia y están determinados en la tabla de la curva normal).
Los valores a sustituir en la fórmula podrían ser los siguientes:
Primer caso,
N = 5000 (← este valor es el que les solicité hace un buen tiempo: tamaño de la población. De no contar con el tamaño de la población, la unidad de análisis podrá ser el número de viviendas de un municipio etc., número de trabajadores de una fábrica y demás. La cifra representa la magnitud de una población “x”).
Z = 0.95% = 1.96 ← este es un valor determinado y es de uso común, ustedes pueden hacer uso de este valor en su cálculo o bien del valor 2.57. Ustedes son los que deciden el nivel de confianza (usar la tabla de áreas bajo la curva normal tipificada).
E = 0.05%
p = 0.5 por lo tanto,
q = 0.5
Segundo caso,
N = 5000
Z = 0.95% = 2.57 (usar la tabla de áreas bajo la curva normal tipificada).
E = 0.05%
p = 0.5 por lo tanto,
q = 0.5
Más de lo mismo (ejemplos):
Para obtener la muestra representativa con una población de tal o menor magnitud, se utiliza la siguiente fórmula:
Z2Npq
n = ------------------- ;
NE2 + Z2pq
En donde,
N = Población total
n = Muestra representativa
Z = Nivel de confianza requerido para generalizar los resultados hacia toda la población.
pq = Se refiera a la variabilidad del fenómeno estudiado (ocurrencia de un evento o la probabilidad de que un elemento de la población sea seleccionado).
E = Indica le precisión con que se generalizan los resultados (es el grado de error aceptado y el recomendado, en términos generales es + 5% ó 0.05%. Cabe señalar que la determinación de este valor recae en el investigador, por ejemplo algunos especialistas trabajan con el 95.5%).
PROCEDIMIENTO
- Para calcular el nivel de confianza (Z) hay que usar la tabla de áreas bajo la curva norma tipificada.
- Usualmente se utiliza, para hacer este cálculo, un rango entre el 95% y el 99%. Cualquiera que sea, el porcentaje se divide entre dos y el resultado se busca en la tabla ABNT (se divide entre 2 el porcentaje porque la curva normal está distribuida en dos partes simétricas):
_95_ = 47.50 ÷ 100 = 0.4750
2
- Esta cifra (.4750) se busca en la TABNT y se obtiene el valor de Z = 1.96.
- Cuando se selecciona 95.5% como nivel de confianza, por convención, Z = 2 “porque la probabilidad dada es del 95.5% y sabemos que en una curva normal, se encuentra a ± 2 veces la desviación típica el 95.5% de todas las posibles muestras”. Con este porcentaje se pueden lograr inferencias adecuadamente apoyadas para elaborar nuevos enunciados -sugerencias (García Ferrando, Manuel, Socioestadística, Madrid, Alianza Ed., 1989, p. 143).
- Para la interpretación de los porcentajes resultantes de acuerdo con las respuestas de los encuestados “debe sumarse y restarse el 4.5% al porcentaje de respuestas afirmativas. Es decir, se espera con un 05.5% de confianza que la respuesta a nivel de toda la población oscile entre 45.5 y 54.5%. (Al aumentar el nivel de confianza aumenta el tamaño muestral y al aumentar la precisión, también, se eleva el tamaño de la muestra).
- Los valores de p y q, se calculan de la siguiente forma: 1) “Si se ha realizado otro estudio similar, la variabilidad especifica para el cálculo de la muestra puede servir para nuestro caso particular; 2) Mediante el estudio piloto en una muestra reducida (no probabilística). Por ejemplo, se hacen preguntas sobre temas básicos de la investigación; de las respuestas posibles serán únicamente dos: sí, no; adecuado, inadecuado. En este caso p significa el porcentaje de respuestas afirmativas o “adecuado” y q representa las respuestas negativas o “inadecuado”. Después de efectuado el conteo de respuestas, la situación es la siguiente: p es igual a 60% y q a 40%, luego entonces p = .6 y q = .4; 3) El caso más desfavorable es cuando los valores de p y q son igual al 50% (0.5) y es cuando se tiene la total incertidumbre sobre las respuestas que darán los encuestados a las preguntas que se les formule y, entonces, se supone que el 50% contestará afirmativamente y negativamente el restante (si aumenta la variabilidad aumenta el tamaño de la muestra).
Finalmente, de todo este formulado estadístico lo que importa, en términos prácticos, es determinar la muestra representativa (n) de una población (N):
DESARROLLO
N = 8065
Z = 2
E = 0.03
p = 0.4
q = 0.6
A (2)2 · 8065 (0.40) (0.60)
n = --------------------------------------------
...