Medida de Dispersión en los Conjuntos de Datos
Enviado por thaliacordova • 12 de Mayo de 2012 • 1.228 Palabras (5 Páginas) • 820 Visitas
nhugbkjiud miouijkDonde
w es el numero de cuartil (0 < w < 4), decil (0 < w < 10) o percentil (0 < w <100) que se quiere calcular
el resto de los símbolos tienen el mismo significado que en la formula de la mediana.
Medida de Dispersión en los Conjuntos de Datos
Las medidas de dispersión describen un grupo de valores en función de la variación o dispersión de los ítems incluidos dentro de ese grupo. Existen varias técnicas para medir el grado de dispersión de un grupo de datos en este curso incluiremos El Rango, La Desviación Promedio, La Desviación estándar y El Coeficiente de Variación.
El Rango: Es la diferencia entre el valor mas alto (VM) y el mas bajo (Vm) de los valores de una serie que no se han agrupado en una distribución de frecuencia de esta manera:
R = VM -Vm
Para los datos agrupados en una distribución de frecuencia, el rango se define como la diferencia entre el limite superior de la clase mas alta o ultima clase (VM) y el limite inferior de la clase mas baja o primera clase (Vm).
Desviación Promedio: Se basa en la diferencia entre cada valor del conjunto de datos y la media del grupo. Es la media de estas desviaciones la que se calcula. Se calcula la media de las sumas de los valores absolutos de las diferencias.
Dp = ððxi - X|/N
Para xi = valor de la serie
X = media aritmética de la serie
N = numero de datos.
Para datos agrupados en distribución de frecuencia la desviación promedio se calcula a partir de los puntos medio de clases (xi) y las frecuencias absolutas de clases (fi).
Dp = ð(fiðxi - X|)/N
La Varianza y La desviación Estándar: La varianza es similar a la desviación promedio en cuanto a la base en la diferencia entre cada valor del conjunto de datos y la media del grupo, difiere de ella porque esas diferencias se elevan al cuadrado antes de sumarse. Para la varianza de la población se utiliza la letra griega sigma σ2 la formula es.
σ2= ð(xi - X)2/N
A diferencia de lo que sucede con otras muestras estadísticas que hemos analizado, la varianza para una muestra no es exactamente equivalente a la varianza de una población, en lo que al calculo se refiere. Mas bien, el denominador de la formula de varianza de la muestra es ligeramente diferente. En esencia en esta formula se incluye un factor de corrección, de manera que la varianza de la muestra es un estimador no sesgado (un estimador no sesgado es un estadístico de muestra que tiene un valor esperado igual al parámetro que va a ser estimado) de la varianza de la población y su formula es
s2 = ð(xi - X)2/(n-1)
Para datos agrupados en distribución de frecuencia las expresiones son:
σ2= ðfi(xi - X)2/N
s2 = ðfi(xi - X)2/(n-1)
La desviación estándar es la raíz cuadrada del valor de la varianza.
Coeficiente de Variación: El coeficiente de variación V, indica la magnitud relativa de la desviación estándar comparada con la media de la distribución de mediciones:
V = s/X
El coeficiente de variación es útil cuando tenemos que comparar la variabilidad de dos conjuntos de datos en relación con el nivel general de valores en cada conjunto.
Ejercicios
Una muestra de 20 obreros de producción de una pequeña compañía gana los siguientes salarios durante una semana cualquiera: 140, 165, 240, 140, 140, 155, 140, 155, 140, 165, 140, 180,180, 140, 190, 200, 140, 205, 225, 230.
Determine: La distribución de frecuencia adecuada, la media, la moda, la mediana, la desviación estándar, la desviación promedia, ¿Cuánto gana el 37% de los obreros?
Si comparamos los datos anteriores con los de otro departamento donde elegimos a 30 obreros con los siguientes salarios. 123, 234, 142, 165, 133, 133, 112, 200,
...