Distribución Hipergeométrica
Enviado por TOLJ94 • 26 de Mayo de 2014 • Tesis • 2.190 Palabras (9 Páginas) • 295 Visitas
2.8 Distribución Hipergeométrica
Características de la Distribución Hipergeométrica
Para efectos de esta distribución, llamemos población al conjunto de elementos disponibles para realizar un experimento y muestra a un subconjunto de dichos elementos seleccionados en forma aleatoria.
La distribución Binomial se generó al estudiar el comportamiento de repetir n veces un experimento de Bernoulli, en el cual hay dos resultados posibles, las repeticiones son independientes y la probabilidad asociada a cada repetición permanece constante. Para cumplir la última característica, es indispensable que cuando hay extracción de elementos se debe realizar con reemplazo, esto es, regresar el elemento extraído antes de realizar la siguiente extracción.
En el caso de la distribución Hipergeométrica, a diferencia de la distribución Binomial, los elementos se extraen simultáneamente, o si es uno a uno, sin devolverlos antes de realizar la siguiente extracción, de forma que un elemento no puede aparecer dos veces en una muestra. A esta manera de obtener la muestra se le llama muestreo sin reemplazo.
De esta forma, la probabilidad del segundo elemento depende o estácondicionada al elemento que se haya sacado en la primera extracción o sea que existe dependencia. Este concepto también se aplica en la extracción del tercero, cuarto y demás elementos, dependiendo del tamaño de la muestra, donde la probabilidad depende de los elementos obtenidos en las extracciones anteriores. Obsérvese que el muestreo sin reemplazo origina la dependencia probabilística, a diferencia del modelo binomial que no la tiene.
Función de Probabilidad
Supongamos que se tiene una población finita de tamaño N, en donde los elementos sólo tienen dos características, digamos éxito y fracaso, hombres y mujeres, aprobados y reprobados, buenos y malos, empleados y desempleados, enfermos y sanos, etc. Esto significa que de acuerdo a las características, la población se puede dividir en dos subconjuntos disjuntos: los que cumplen y los que no cumplen con la característica estudiada. Supongamos también que en esta población existen a elementos de cierta característica que nos interesa analizar, por lo que N – a elementos no la tienen, como se puede apreciar en la figura siguiente.
Poner figura 1 de la distribución hipergeométrica
Por ejemplo:
a) Una población de 30 alumnos contiene 20 aprobados y 10 no aprobados.
b) Una caja contiene 50 focos, de los cuales 45 funcionan y 5 no funcionan.
c) En un grupo de 35 personas hay 25 del partido político A y 10 que no lo son.
Tomemos una muestra aleatoria de tamaño n de la población. Es obvio que en tal muestra pueden haber elementos tanto del tipo a como del tipo N – a. El número mínimo de elementos del tipo a en la muestra es 0 y el máximo es n. Definamos la variable aleatoria X como el número de elementos del tipo a en la muestra de tamaño n.
Cuando la variable aleatoria X tome el valor x, entonces se tendrá que 0 x n, lo cual se observa en la figura siguiente:
Poner figura 2 de la distribución hipergeométrica
También se puede apreciar en la figura que n = x + (n – x), por lo que la muestra puede contener x elementos del tipo a y (n – x) elementos del tipo (N – a).
Ahora deduzcamos la función de probabilidad de dicha variable aleatoria.
El número total de formas de extraer una muestra de n elementos de una población que tiene N elementos igualmente probables es .
Por otro lado, el total de formas de extraer sin reemplazo x elementos del tipo a en la muestra de tamaño n es y de extraer sin reemplazo de la misma muestra (n – x) elementos del tipo (N – a) es y por la regla de multiplicación para conformar la muestra de tamaño n se tiene . Por lo tanto .
Definición. Se dice que el modelo de probabilidad de una variable aleatoria X es Hipergeométrico, si su función de probabilidades es:
donde N es el número de elementos de la población, a es el número de elementos de la población que tienen la característica de interés, n es el tamaño de la muestra y x el número de elementos de la muestra que tienen la característica de interés.
Ejemplo 5. 21. Una tienda de artículos eléctricos tiene 20 planchas, de las cuales 5 son amarillas. Si se extraen aleatoriamente y sin sustitución 10 planchas ¿Cuál es la probabilidad de que dos de ellas sean amarillas?
Solución.
En este caso se tiene una población de 20 planchas (N = 20), de las cuales 5 son amarillas (a = 5) y se extrae una muestra de 10 planchas (n = 10). La variable aleatoria será el número de planchas amarillas que hay en la muestra (entre las extraídas), por lo que x = 2. Sustituyendo en el modelo de la distribuciónHipergeométrica tenemos:
=
Ejemplo 5. 22. Si se extraen 8 canicas sin reemplazo de una urna que contiene 9 azules y 3 negras. Encontrar la probabilidad de haya 6 canicas azules dentro de las 8 que se extrajeron.
Solución.
En total se tienen 12 canicas (N = 12), de las cuales 9 son azules (a = 9). Se extrae una muestra de 8 canicas (n = 8) y se desea obtener la probabilidad de que en la muestra haya 6 canicas azules (x = 6) por lo que:
=
Ejemplo 5. 23. Un vendedor de insecticidas quiere vender a una planta un lote de 50 barriles de cierto producto. El gerente de la planta sospecha que los barriles están caducos, pero el vendedor sostiene que sólo 10 barriles han caducado y está dispuesto a permitir que se analicen 5 barriles sin costo para el comprador, para que éste decida si adquiere el lote. ¿Cuál es la probabilidad de que el gerente encuentre que 4 o más de los 5 barriles examinados han caducado, suponiendo que el vendedor tiene razón en su afirmación?
Solución.
De acuerdo a la información se tiene que N = 50, a = 10 y n = 5. La función de probabilidad de la variable X, definida por el número de barriles defectuosos en la muestra es:
por lo que la probabilidad
...