Medidas De Dispersion
Enviado por spotify • 10 de Julio de 2015 • 470 Palabras (2 Páginas) • 254 Visitas
Medidas de dispersión
El objetivo del estudio de los parámetros estadísticos es obtener información resumida del conjunto de datos en los que estamos interesados.
Las medidas de dispersión son parámetros estadísticos que nos informan sobre la variabilidad de los datos, es decir, si la distribución de los datos es más o menos homogénea y por tanto nos dan una medida sobre la representatividad de los parámetros de centralización (moda, mediana o media).
Como en los parámetros de centralización y de posición existen varios para medir la dispersión. Los principales son:
RANGO O RECORRIDO
Es la diferencia entre el mayor valor de los datos y el menor.
Re = Max {xi} - Min {xi}
La principal ventaja del rango es su fácil cálculo aunque su valor es poco significativo, ya que sólo tiene en cuenta los dos valores extremos.
RANGO O RECORRIDO INTERCUATÍLICO
Es la diferencia entre el tercer cuartil y el primero, el rango donde se encuentra el 50% central de los datos.
RI = Q3 - Q1
En ocasiones también se suele usar como valor la mitad del rango intercuartílico, hablando en esta caso de recorrido semi-intercuartil.
Estas dos primeras medidas de dispersión se suelen utilizar cuando el cálculo de la media no es posible o ésta no es significativa
DESVIACIÓN MEDIA
La desviación media es la media de la distancia de los valores de los datos (en valor absoluto) a la media.
El uso del valor absoluto es para evitar que se anulen distancias negativas con distancias positivas, lo que daría como resultado que la desviación media sea cero para cualquier distribución de datos.
VARIANZA
Como hemos referido antes para evitar que se anulen diferencias positivas y negativas, en al desviación media se toma valor absoluto. Dado que la función valor absoluto no tiene unas buenas propiedades matemáticas (por ejemplo, no es derivable) otra manera de transformar los valores negativos en positivos es elevando al cuadrado.
Por tanto, la varianza va a ser la media del cuadrado de la distancia de los valores de los datos a la media.
Para el cálculo se suele aplicar la expresión:
DESVIACIÓN TÍPICA
Definimos la desviación típica como la raíz cuadrada de la varianza.
o, usando la otra expresión:
El hecho de realizar la raíz cuadrada tiene por objetivo que la medida de dispersión esté expresada en la misma unidad que la variable.
COEFICIENTE DE VARIACIÓN (DE PEARSON)
Dado que la desviación típica es una medida que está expresada en
...