METODOLOGÍA DE MUESTREO
Enviado por yibeca • 29 de Noviembre de 2012 • 2.090 Palabras (9 Páginas) • 303 Visitas
lMETODOLOGÍA DE MUESTREO
Introducción
En este documento trataremos de definir los conceptos básicos necesarios para
calcular una muestra representativa sobre el total de una población,
considerando como tal al conjunto de individuos de los que se quiere obtener una
información. Esto es, si deseamos conocer la opinión general de un total de
clientes, podríamos preguntarles a todos y sacar la media aritmética, pero para
aquellos casos en los que este número de clientes es muy elevado, la estadística
nos permite tomar sólo una muestra de forma aleatoria. De este modo,
preguntando únicamente a los clientes resultantes de la muestra, los porcentajes
medios que obtendremos de sus respuestas serán los mismos que si
preguntásemos al total de la población. El error que se comete debido al hecho de
que se obtienen conclusiones del total de una población a partir del análisis de sólo
una parte de ella, se denomina error de muestreo.
Obtener una muestra adecuada significa lograr una versión
simplificada de la población, que reproduzca de algún modo
sus rasgos básicos.
Cálculo del tamaño muestral.
Cada estudio tiene un tamaño muestral idóneo, que permite comprobar lo que se
pretende con la seguridad y precisión fijadas por el investigador. Esta seguridad y
precisión dependerán del rango de posibles respuestas (necesitaremos una muestra
más pequeña si las opciones son si o no, que si por el contrario la opción es elegir
entre 1 y 10). Así mismo, también influirá si el estudio se realiza sobre una
población finita o infinita.
FÓRMULAS:
Dos opciones de respuestas(Ejem: si o
no)
Varias opciones de respuestas (ejem:
valora entre x e y)
Población
finita
Población
infinita
A CONTINUACIÓN EXPLICAMOS CADA UNO DE LOS PARÁMETROS
QUE INTERVIENEN EN LAS FÓRMULAS.
n=Zα2
i2
S2
n = Zα
2 NS2
i2 (N-1)+Zα
2·S2
IT-01 METODOLOGÍA DE MUESTREO
Página 2 de 7
• n = tamaño de la muestra representativa que deseamos obtener.
• N = tamaño de la población.
• Zα= Valor correspondiente a la distribución de Gauss (siendo α el nivel de
confianza elegido). Habitualmente los valores escogidos son Zα= 1,96 para
α=0,05 y Zα= 2,57 para α =0,01.
¿Qué significa esto?. La distribución de Gauss es la denominada distribución
normal y responde a la forma representada a continuación:
Fig. 1
Bajo esta campana está representada una población concreta. Sea cúal sea
el objeto del estudio o del análisis estadístico, existirá una mayoría de la
población que se encontrará ubicada en la parte central rayada de la fig. 1
(es decir si estamos midiendo la satisfacción de los clientes frente a un
servicio concreto, la mayoría de los clientes tendrán una percepción similar,
parte rayada), aunque siempre existirán opiniones dispersas (situadas en los
extremos), que por su poca representatividad y distancia a la parte más alta
de la campana, podrán ser despreciables. Por tanto, los valores de Zα
dependerán de del nivel de confianza α escogido:
Fig. 2
Por tanto, el valor de z (siendo z una variable normal centrada y reducida),
elimina del intervalo ± zα una proporción a de los individuos.
Consideramos que todas las respuestas son fiables.
Nos sirven el 100%
Consideramos que el 1% de las respuestas son de
clientes muy satisfechos o muy insatisfechos con
respecto a la media, por tanto existirá un 1% de
encuestas que entrarán en el análisis que no nos
aportarán nada.
Consideramos que el 5% de las respuestas son de
clientes muy satisfechos o muy insatisfechos con
respecto a la media, por tanto existirá un 5% de
encuestas que entrarán en el análisis que no nos
aportarán nada.
Consideramos que el 10% de las respuestas son de
clientes muy satisfechos o muy insatisfechos con
respecto a la media, por tanto existirá un 10% de
encuestas que entrarán en el análisis que no nos
aportarán nada.
IT-01 METODOLOGÍA DE MUESTREO
Página 3 de 7
• i = error de la estimación (tambien denominado e). Error que se prevé
cometer. Por ejemplo, para un error del 10%, introduciremos en la fórmula
el valor 0,1. Así, con un error del 10%, si el parámetro estimado resulta del
80%, tendríamos una seguridad del 95% (para α =0,05) de que el
parámetro real se sitúa entre el 70% y el 90%. Vemos, por tanto, que la
amplitud total del intervalo es el doble del error que introducimos en la
fórmula. (Ver fig. 4)
• Nivel de confianza (1-α): habitualmente 95% o 99%. Probabilidad
complementaria al error admitido α
Dos opciones de respuestas(Ejem: si o no)
Varias opciones de respuestas (ejem: valora
entre x e y)
• p = proporción en que la variable
estudiada se da en la población.
Prevalencia esperada del parámetro a
evaluar. En caso de desconocerse,
aplicar la opción más desfavorable
(p=0,5), que hace mayor el tamaño
muestral (ver fig. 3).
• q = 1 - p.
¿Cómo escogemos el nivel de
confianza?
El nivel de confianza (α) es el intervalo en
el cual existe una probabilidad 1 - α de
que esté contenido el parámetro p. Este
intervalo está comprendido entre +zα y -
zα. En la figura 3 podemos ver estas
probabilidades y las puntuaciones zα que
les corresponden.
Fig. 3
El resto de valores serían los mismos, pero en
orden inverso (los valores de p pasarían a
ser los de q y al revés, ya que tal y como
decíamos q=1-p).
En la aplicación de las fórmulas para el
cálculo del tamaño de la muestra suele
presentarse el problema de determinar el
valor de p. Esta dificultad se puede
solventar de una de las siguientes
formas:
S2 o varianza/S o desviación típica: para
estos casos en los que existen un mayor
número de posibles respuestas, la varianza
nos dice cúal es el valor medio de la
dispersión de las mismas respecto a la
media de dichas respuestas. Es decir,
respecto a la parte más alta de la campana
de Gauss,
...