Medidas Dispersión

paoljpao19 de Abril de 2013

6.383 Palabras (26 Páginas)2.326 Visitas

Página 1 de 26

MEDIDAS DE DISPERSION:

Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).

Las medidas que hasta ahora conocemos, medias, modas, percentiles, etc., tienen todas ellas las propiedades de ubicarse siempre entre los dos valores extremos de los datos, mínimo y máximo, pues indican posición, bien sea central, o bien sea extrema como por ejemplo el percentil 5, o el percentil 95.

Las medidas de tendencia central son insuficientes para describir el comportamiento de los datos, pues no proporcionan información acerca de cuan cerca o lejos se encuentran estos datos, con relación a este valor central. Así por ejemplo el trió de datos {8, 9, 10} y {1, 10, 16} tienen ambos media 9; pero resulta obvio, que en el primero de ellos existe una menor desviación con respecto a este valor central, que en el segundo.

Medir la variabilidad resulta muy importante en diversas situaciones prácticas, pues a través de su medición se podrán comparar conjuntos de datos, y establecer cuando existe una mayor concentración de ellos en la región central. Así por ejemplo, en estudios sociales las medidas de dispersión proporcionan la información requerida para analizar cómo es la distribución de los ingresos dentro de la sociedad; en los estudios de calidad industrial, estas mismas medidas de dispersión se utilizan para medir la precisión de las maquinas utilizadas en el proceso de producción.

LA DISPERSION ES IMPORTANTE PORQUE:

Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.

Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas:

Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:

1.- Rango

2.- Varianza

3.- Desviación típica o estándar

4.- Coeficiente de varización de Pearson

VARIANZA:

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:

Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:

Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviación, pero este valor se encuentra elevado al cuadrado.

RANGO O RECORRIDO:

Definición: se llama recorrido de una distribución a la diferencia entre el mayor y el menor valor de la variable estadística.

Cálculo del recorrido:

Es muy sencillo aplicando la definición, consiste en ordenar los valores de menor a mayor y restar al último el primero.

Observaciones al recorrido:

1. Cuanto menor es el recorrido mayor es el grado de representatividad de los valores centrales.

2. Cuanto mayor es, la distribución está menos concentrada o más dispersa.

3. Tiene la gran ventaja de su sencillez de cálculo.

4. Tiene gran aplicación en procesos de control de calidad,

5. Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado.

6. Para paliar este inconveniente a veces se utilizan otros dos rangos:

Rango intercuartílico: Q = Q3 – Q1

Rango entre percentiles: P = P90 – P10

Estos rangos son algo más estables, ya que tienden a eliminar aquellos valores extremadamente alejados.

También podemos decir que es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el más bajo (X1 ó Xmin) en un conjunto de datos.

Rango para datos no agrupados:

R = Xmáx.-Xmín = Xn-X1

Ejemplo:

Se tienen las edades de cinco estudiantes universitarios de 1er año, a saber: 18,23, 27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:

R = Xn-X1 ) = 34-18 = 16 años

Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se aproxima el rango tomando el límite superior de la última clase menos el límite inferior de la primera clase.

Rango para datos agrupados:

R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)

Ejemplo:

Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes:

Clases P.M.

Xi fi fr fa↓ fa↑ fra↓ fra↑

7.420 – 21.835 14.628 10 0.33 10 30 0.33 1.00

21.835 – 36.250 29.043 4 0.13 14 20 0.46 0.67

36.250 – 50.665 43.458 5 0.17 19 16 0.63 0.54

50.665 – 65.080 57.873 3 0.10 22 11 0.73 0.37

65.080 – 79.495 72.288 3 0.10 25 8 0.83 0.27

79.495 – 93.910 86.703 5 0.17 30 5 1.00 0.17

Total XXX 30 1.00 XXX XXX XXX XXX

DESVIACIÓN ESTÁNDAR O TÍPICA:

La desviación estándar o desviación típica (denotada con el símbolo σ ó s, dependiendo de la procedencia del conjunto de datos) es una medida de centralización o dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.

Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

La desviación estándar es una medida del grado de dispersión de los datos con respecto al valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto a la media aritmética.

Por ejemplo:

las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar muéstrales son 8.08, 5.77 y 1.15 respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas

...

Descargar como (para miembros actualizados) txt (39 Kb)

Leer 25 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com