Medidas de dispersión
Enviado por lxdary • 9 de Noviembre de 2011 • 2.273 Palabras (10 Páginas) • 1.090 Visitas
Medidas de dispersión
La información que arrojan las medidas de tendencia central no siempre proporcionan conclusiones contundentes frente al conjunto de datos. El conjunto de datos, además de tener una tendencia de agruparse hacia el centro, en ocasiones suelen estar bastante alejados de esa tendencia central. Medir esa variación respecto a los promedios es un cálculo importante en el tratamiento estadístico de datos, medidas a las que se les denomina de dispersión o de variación.
Entre las medidas de dispersión más comunes están:
• Rango o recorrido
• Varianza
• Desviación típica o estándar
• Coeficiente de variación
• Desviación media
• Puntaje típico o estandarizado
Varianza
Es una de las medidas más usadas en estadística, ella a su vez da origen a otra mucho más significativa: la desviación típica o estándar. Se define como la
media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se simboliza s2para la varianza muestral y para la varianza poblacional.
Para datos no agrupados:
Para datos agrupados:
La varianza indica la desviación de los datos respecto a la media. Para comparar dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus varianzas de manera que el resultado indique cuál de ellas es más homogénea o cuál es más heterogénea.
Propiedades de la desviación estándar
Es importante tener en cuenta las siguientes propiedades de la desviación estándar:
• La desviación estándar es una medida de variación de todos los valores con respecto a la media.
• El valor de la desviación estándar siempre es positivo y sólo es igual a cero cuando los valores de los datos son iguales.
• Si el valor de la desviación estándar es muy grande, este indica mayor variación en el grupo de datos.
• El valor de la desviación estándar puede incrementarse drásticamente cuando se incluye uno o más datos distantes.
• Las unidades de la desviación estándar son las mismas de los datos originales (pulgadas, centímetros, etc.)
1. Se define como la media aritmética de los cuadrados de las desviaciones respecto al promedio.
Coeficiente de variación
Desviación media
Desviación estándar
Varianza
Coeficiente de variación
Las medidas de dispersión como rango, varianza y desviación estándar medidas absolutas y se expresan en las mismas unidades con las que se mide la variable. Cuando se comparan dos o más conjuntos de datos con unidades de medida de observación diferentes, no es posible compararlas con estas medidas absolutas.
Para efectuar comparaciones entre series de observaciones distintas, en estadística se usa el coeficiente de variación y así se puede determinar cuál serie tiene mayor o menor variabilidad relativa.
Cuando el coeficiente de variación es muy alto se dice que la media aritmética no es lo suficientemente representativa en la distribución.
2. Una de las siguientes medidas NO es medida de dispersión absoluta:
Coeficiente de variación
Varianza
Rango intercuartílico
Rango
Medidas de asimetría
En cualquier distribución el valor de la mediana se localiza entre la media y la moda. En una distribución simétrica se tiene que:
En las distribuciones asimétricas la media se corre en el sentido del alargamiento o sesgo por efecto de las frecuencias y de los valores extremos de la variable; la mediana también se corre pero menos que la media ya que en ella sólo influyen las frecuencias; en tanto que la moda no es influenciada ni por las frecuencias ni por los valores extremos.
Los datos sesgados a la derecha (sesgo positivo) poseen una cola derecha más larga y su mediana y media están a la derecha de la moda. La distribución es asimétrica positiva y:
Los datos sesgados a la izquierda (sesgo negativo) presentan una cola izquierda más larga y su media y mediana se encuentran a la izquierda de la moda. Será asimétrica negativa y:
Figura
Distribuciones sesgadas
(a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simétrica
Las asimetrías positivas son las más frecuentes que las sesgadas hacia la izquierda, porque con frecuencia es más fácil obtener valores excepcionalmente grandes que valores excepcionalmente pequeños. Ejemplo de ello es la distribución de valores en los consumos de servicios públicos, las calificaciones en pruebas, los sueldos, etc.
Medidas de apuntamiento o curtosis
Las curvas de distribución, comparadas con la curva de distribución normal, pueden presentar diferentes grados de apuntamiento o altura de la cima de la curva. Esta agudeza en la cima se observa en la moda.
Si la curva es más plana que la normal se dice que la curva es platicúrtica; si es más aguda que la normal, recibe el nombre de apuntada o leptocúrtica. Si la distribución es normal, la curva se conoce también como mesocúrtica.
La curtosis es la medida de la altura de la curva y esta dada por:
Si Ap = 3 la distribución es normal o mesocúrtica.
Si Ap > 3 la distribución es apuntada o leptocúrtica.
Si Ap < 3 la distribución es achatada o platicúrtica.
3. Cuando en una distribución, la moda es mayor que la mediana y esta mayor que la media, se puede decir que la distribución es:
Asimetrica Positiva
Asimetrica
Simetrica
Asimétrica Negativa
Regresión y correlación
En muchos casos se requiere conocer más que el comportamiento de una sola variable, la relación entre dos o más variables. Muchos de estos comportamientos tienen una tendencia lineal, aunque hay muchos otros que lo hacen de forma curva, en este curso sólo se trabajará sobre variables con correlación lineal.
Una distribución bidimensional o bivariante puede representarse gráficamente en un plano cartesiano, ubicando en el eje horizontal o abscisa los valores de la primera variable denominada X y en el eje vertical u ordenada, los valores de la segunda variable, Y. De manera pues que se grafican tantas parejas ordenadas como observaciones hayan de las variables. A este conjunto de puntos o nube de puntos se le denomina diagrama de dispersión,
...