ESTADISTICA APLICADA
Enviado por simil35 • 26 de Septiembre de 2012 • 1.844 Palabras (8 Páginas) • 1.993 Visitas
1. INTRODUCCION
La distribución normal, que es una distribución de probabilidades continua, es sumamente importante, en especial en su aplicación de la estimación del tamaño de muestras, paso fundamental en la investigación en general y en particular en la investigación de mercados por ejemplo.
El comportamiento de una variable aleatoria queda descrito por su distribución de probabilidad sin importar si esta se representa de forma gráfica, en forma tabular o con una fórmula. A menudo, las observaciones de diferentes experimentos estadísticos tienen el mismo tipo general de comportamiento.
En consecuencia, las variables aleatorias discretas asociadas se pueden describir con la misma distribución de probabilidad y se pueden representar mediante una sola fórmula.
De hecho, se necesita sólo un conjunto de distribuciones de probabilidad importantes para describir muchas de las variables aleatorias discretas que se encuentran en la práctica y que son muy importantes por sus múltiples aplicaciones a los negocios, finanzas, economía, controles de calidad, etc., tales como la distribución binomial, la de Poisson y la hipergeométrica.
En esta oportunidad hablaremos solo de la distribución hipergeometrica, en qué consiste, cual es su ámbito de aplicación y desarrollaremos ejercicios para entender de una forma más apropiada su aplicación.
2. DISTRIBUCION HIPERGEOMETRICA
la distribución hipergeometrica forma parte de las Distribuciones Discretas de Probabilidad. Se interesa en el cálculo de probabilidades para el número de observaciones que caen en una categoría en particular. Pero a diferencia de la binomial, que son pruebas independientes, la hipergeométrica son pruebas dependientes. La manera más simple de ver la diferencia entre la distribución binomial y la distribución hipergeométrica está en la forma en que se realiza el muestreo. Los tipos de aplicaciones de la distribución hipergeométrica son muy similares a los de la binomial.
Esto puede ocurrir por ejemplo cuando en un control de calidad en determinado lote de producción, las pruebas que se hacen en determinada muestra se van seleccionando sin reemplazamiento, es decir se saca el producto del lote, porque allí no se le puede inspeccionar por ejemplo, y ya no se le vuelve a introducir, de modo que de esa manera en forma sucesiva, prueba tras prueba, los casos posibles van disminuyendo y definiendo por lo tanto ensayos no independientes entre sí.
En general, interesa la probabilidad de seleccionar x éxitos de los k artículos considerados como éxito y n – x fracasos de los N – k artículos que se consideran fracasos cuando se selecciona una muestra aleatoria de tamaño n de N artículos.
Esto se conoce como experimento hipergeométrico; es decir, uno que posee las siguientes dos propiedades: Se selecciona sin reemplazo una muestra aleatoria de tamaño n de N artículos. Los k de los N artículos se pueden clasificar como éxitos y N – k se clasifican como fracasos.
El número X de éxitos de un experimento hipergeométrico se denomina variable aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de la variable Hipergeométrica se llama distribución hipergeométrica, y sus valores se denotan como (x;N,n,k), debido a que dependen del número de éxitos k en el conjunto N del que seleccionamos n artículos.
La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos de los que k se denominan éxito y N – k fracaso, es:
La media y la varianza de la distribución hipergeométrica h(x;N,n,k) son:
Hay una relación interesante entre la distribución hipergeométrica y la binomial. Como se podría esperar, si n es pequeño comparado con N, la naturaleza de los N artículos cambia muy poco en cada prueba.
Así la cantidad k/N juega el papel del parámetro binomial p. Como consecuencia, la distribución binomial se puede ver como una versión de población grande de las distribuciones hipergeométricas.
La media y la varianza entonces se obtienen de las fórmulas:
Al comparar estas fórmulas, se puede observar que la media es la misma mientras que la varianza difiere por un factor de corrección (N – n)/(N – 1), que es insignificante cuando n es pequeña en relación con N.
En resumen, el modelo de la hipergeométrica, representa un sistema en el que se encuentran “a” casos con una cierta característica (número de defectuosos en un lote por ejemplo), “b” casos que no poseen dicha característica (artículos buenos en el lote), siendo en total N, el número de artículos en el lote (N=a+b) y lo que se desea es encontrar las probabilidades de que en una muestra de tamaño n se encuentren k artículos con la característica a (defectuosos por ej.), en donde k varía desde cero hasta n, es decir, K:0,1,2,…….n.
La distribución hipergeométrica para calcular las probabilidades de encontrar ningún defectuoso o uno o dos, etc., viene dada por la siguiente expresión, en términos de combinaciones:
P(x=k) = ((aCk)*(bC(n-k)))/(NCn)
Su esperanza matemática es igual que la binomial, es decir, E(x) = np y su varianza es V(x) = n*p*(1-p)*((N-n)/(N-1)). La V(x) también sería igual que en la binomial, salvo por el factor de corrección ((N-n)/(N-1)), el cual tiende a 1, cuando N crece bastante y n permanece fijo o es relativamente más pequeña que N, indicando el análisis estadístico que existe una buena aproximación entre la binomial y la hipergeométrica hasta cuando n=0.05*N, es decir cuando n es a lo más el 5%N.
Esta distribución de probabilidad posee gran utilidad en los sondeos de opinión pública, con lo que podemos realizar una encuesta para intentar conocer si los individuos de una población tienen o no intención de votar en unas elecciones de tal manera que el número de individuos, de una muestra sin reemplazamiento, que tienen intención de votar sigue una distribución hipergeométrica. Asimismo, es aplicable en otros campos como Muestreos de Aceptación, Pruebas electrónicas, Garantía de Calidad, etc.
...