Distribucion Normal

fas12304 de Abril de 2013

2.220 Palabras (9 Páginas)700 Visitas

Página 1 de 9

DISTRIBUCIONES DE PROBABILIDAD

Un modelo probabilístico es un modelo matemático que describe el comportamiento de una variable aleatoria. Es una función que depende de los valores de la variable aleatoria, y de otras cantidades que caracterizan a una población en particular y que se denominan parámetros del modelo.

En el proceso de modelación, es necesario seguir los siguientes pasos:

1. Seleccionar el modelo más apropiado.

2. Ajustar el modelo (calcular el valor de sus parámetros).

3. Verificar el modelo.

4. Decidir su aceptación o volver al paso 1.

Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de probabilidad, desarrollados para representar distintos tipos de variables y diferentes fenómenos aleatorios. Por lo tanto, el problema se reduce a elegir el modelo más apropiado para el caso en estudio.

Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la población en estudio y calcular las cantidades necesarias como para evaluar los parámetros del modelo.

Existe una gran variedad de "patrones" o funciones a las que una distribución de datos se puede ajustar, lo cual depende primero de que el rango de datos pertenezca a una escala métrica o no-métrica. Las variables no métricas pueden ser aproximadas a funciones de tipo discreto, como la distribución binomial. Las variables métricas pueden aproximarse a funciones funciones "continuas" diversas, como la hipergeométrica, la de Poisson, etc. Cada patrón específico de distribución sigue diferentes supuestos y tiene, por tanto, distintas aplicaciones.

Se menciona el concepto de “aproximar” porque es difícil que en la realidad los datos sigan exactamente un cierto patrón o función matemática. Sin embargo, estas aproximaciones nos permiten realizar análisis estadísticos más robustos. Así, una gran cantidad de distribuciones, directa o indirectamente, siguen un patrón: patrón no significa una forma exacta.

Distribuciones de Probabilidad

A. Discretas: i) Binomial

ii) Poisson

B. Continuas: i) Distribución Normal

ii) Distribución Hipergeométrica

iii) t de Student

iv) Ji Cuadrada

v) Distribución F

La selección depende, entre otros, de los siguientes factores:

 Un adecuado análisis del problema considerado: qué tipo de variable se estudia, qué fenómeno se desea modelar, etc.

 Los resultados de la descripción de los datos disponibles: forma de la distribución, propiedades de la variable.

 La disponibilidad y manejo de un buen número de modelos de probabilidad que permitan describir diferentes tipos de situaciones.

La Distribución Normal

La distribución normal es construida a partir de la distribución de frecuencias relativas de clase de un grupo de datos. Esto es, se construye a partir del histograma de proporciones. Una distribución normal es aquella curva que sigue una forma de "campana", como la que se muestra en la siguiente figura.

Para discernir si una distribución se aproxima o no a una curva normal, es obvio que no basta con saber si ésta tiene forma de campana o no: otras distribuciones tienen una forma un tanto parecida, además de que la campana puede tener alturas distintas, según el tipo de distribución del que se trate. En este caso, la distribución normal tiene un grupo de características que la describen de forma única:

• La curva es totalmente simétrica. Esto es, que si dividimos la gráfica en su punto medio, el área a la derecha de la curva será exactamente igual (en área y forma) a la porción de la curva a la izquierda de dicho punto medio.

• Dicho punto medio es precisamente en el que coinciden la media, la mediana y la moda.

• Es unimodal. Esto es, tan sólo tiene 1 moda (al centro de la distribución).

• La unidad base de la curva es la desviación estándar particular para esa distribución, o puntuaciones "z".

• Precisamente utilizando estas unidades "z", o de desviación estándar: aproximadamente un 68.26% de los datos de la dispersión se encuentran  1 desviación estándar de la media; asimismo, el 95.44% de las observaciones están contenidas en el rango 2 desviaciones estándar de la media. Por último, el 97.74% de los datos se encuentran entre la media y tres desviaciones estándar de ésta, sea a su derecha o a su izquierda.

Hay dos razones básicas que otorgan un valor singular a la distribución normal:

1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras. La distribución normal es una distribución útil de muestreo.

2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas (pesos, alturas), resultados de procesos físicos (dimensiones y rendimientos) y muchas otras medidas de interés para los administradores.

3. Para definir una distribución normal de probabilidad necesitamos definir sólo dos parámetros: la media y la desviación estándar.

4. No importa cuáles sean los valores de la media y la desviación estándar para una distribución de probabilidad normal, el área bajo la curva es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades.

Estandarización.

Dentro de las características de la distribución normal, se incluían las unidades "z", como unidad base. Para explicar un poco el concepto de unidad "z", pensemos primero, ¿cómo es posible comparar dos distribuciones, dos medias, si tienen dispersiones muy distintas? O, más complicado aún, ¿cómo se comparan -por ejemplo- la calificación de dos personas en tests de inteligencia distintos, con distinta escala? Para tal fin, existe un procedimiento que se llama estandarización, que precisamente crea una unidad estándar -llamada "z"- que considera estos factores.

La puntuación "z" transforma las distintas observaciones en unidades de desviación estándar y, con ello, estandariza una escala de intervalos. Su fórmula es

donde X es la puntuación a convertir a unidades estándar, la media, y s la desviación estándar. Como se ve en la fórmula, el valor "z" tiene como referencias la media y la desviación estándar de una distribución.

El razonamiento detrás de este proceso:

 Radica en crear una nueva distribución de valores estándar ("z"), en donde la media de esta distribución es cero (punto de referencia de cualquier escala con rango continuo).

 Y donde la unidad de medición de dicha escala es la desviación estándar.

La siguiente figura muestra un gráfico para la distribución que se crea al estandarizar una distribución. Como se puede apreciar, dicha distribución se comporta tal y como la distribución normal indica.

Gracias a que los datos de una distribución normal se distribuyen de acuerdo a las reglas anteriormente vistas, podemos crear una unidad de desviación estándar -llamada unidad "z"- que considera estos factores. A esto se le conoce como estandarización y es un proceso casi tan simple como transformar horas a minutos.

La puntuación "z" convierte las distintas observaciones en unidades de desviación estándar y, con ello, estandariza la escala de intervalos. En el caso de la distribución de policias y tránsitos del AMCM (ver sesión 2), para convertir cualquier valor de una distribución (digamos, la edad 21 años), tan sólo restamos esta cantidad a la media y la dividimos entre la desviación estándar.

Esta observación se encuentra a -1.48 desviaciones estándar de la media que es igual a cero. Los valores estándarizados de cada

...

Descargar como (para miembros actualizados) txt (15 Kb)

Leer 8 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com