Bioestadistica
Enviado por tita1317 • 20 de Mayo de 2014 • 626 Palabras (3 Páginas) • 308 Visitas
MEDIDAS DE DISPERSIÓN
Las medidas de posición resumen la distribución de datos, pero resultan insuficientes y simplifican excesivamente la información. Estas medidas adquieren verdadero significado cuando van acompañadas de otras que informen sobre la heterogeneidad de los datos. Estas medidas se conocen como parámetros de dispersión y miden en qué medida los datos se agrupan entorno a un valor central.
Hay medidas de dispersión absolutas, entre las cuales se encuentran la varianza, la desviación típica o el recorrido y medidas de dispersión relativas, como el coeficiente de variación. Las medidas absolutas tienen que ir acompañadas de un parámetro de posición, normalmente la media, y no permiten comparaciones entre distintas muestras. Las medidas relativas suelen ser adimensionales por lo que permiten la comparación entre distintas muestras. Los estadísticos de dispersión más relevantes son:
Recorrido o Rango
Es la medida de dispersión más sencilla de calcular. Es la diferencia entre el mayor y el menor valor que toma la variable. Es una medida poco precisa ya que sólo toma en consideración un par de observaciones y puede verse afectada por valores extremos.
El Rango quedaría 21-2=19.
Intervalo Intercuartílico
Se define como la diferencia entre el tercer y primer cuartil. En ese rango están, por la propia definición de los cuartiles, el 50% de las observaciones. Este tipo de medidas también se usa para determinar valores atípicos.
Por ejemplo: Hallar el Intervalo Intercuartílico de los datos 2, 9, 8, 15, 21, 5, 20.
Para el cálculo de los cuartiles debemos ordenar los datos de menor a mayor: 2, 5, 8, 9, 15, 20, 21. El C1 será igual a 5 y el C3 igual a 20, con lo que el Intervalo Intercuartílico tendrá un valor de 15.
Varianza y Desviación Típica
La varianza se define como:
donde es el valor de la media aritmética y xi el valor de cada dato.
Para evitar el inconveniente de que esté expresado en las mismas unidades que la media pero elevadas al cuadrado, suele utilizarse la desviación típica (S), que no es más que la raíz cuadrada de la varianza:
La varianza cumple tres propiedades básicas:
La varianza y la desviación típica no varían si a cada valor de la variable se le suma una constante. Es decir, si Y=a+X entonces,
Si una variable Z es la suma de dos variables X e Y, la varianza de Z es la suma de las varianzas de X e Y, es decir, si Z=X+Y entonces,
Siguiendo lo anterior, si una variable Y es una transformada lineal de otra variable X, es decir, Y=a+bX, la varianza de Y es también la transformada lineal de la varianza de X, esto es .
Por ejemplo: La varianza y desviación típica de los datos 2, 9, 8, 15, 21, 5, 20, serían respectivamente 49,18 y 6,82.
Coeficiente
...