La Merma
Enviado por relampago01 • 3 de Junio de 2014 • Tesis • 2.096 Palabras (9 Páginas) • 300 Visitas
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la mediana media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
Amplitud o recorrido
La medida de dispersión más simple recibe el nombre de Amplitud o recorrido y es muy poco usada puesto que su única ventaja es la sencillez con que se calcula. Es común que se use también el nombre de Rango para esta medida. La amplitud (A) de un conjunto de datos es la diferencia entre las observaciones que tienen el mayor y el menor valor numérico en el mismo.
Por ejemplo: Supóngase que en un hospital el pulso de cada paciente se mide tres veces al día y que cierto día los registros de dos pacientes muestran:
Paciente 1: 73 77 74
Paciente 2: 64 90 73
¿Cuál es la Amplitud en pulsaciones para cada paciente?
Para calcular la amplitud de los datos necesario identificar el valor más grande y el valor más pequeño del conjunto de datos de cada uno de los pacientes.
Para el Paciente 1:
A = 77 - 73 = 4
Para el Paciente 2:
A = 90 - 64 = 26
La amplitud es una medida de dispersión cuya ventaja es la facilidad con que se calcula. Tiene en cambio las siguientes desventajas:
• En su cálculo sólo intervienen dos elementos del conjunto.
• Al aumentar el número de observaciones, puede esperarse que aumente la variabilidad. Puesto que la amplitud no tiene en cuenta el tamaño del conjunto, no es una medida adecuada para comparar la variabilidad de dos grupos de observaciones, a menos que éstos sean del mismo tamaño.
Medidas de Posición
Son indicadores usados para señalar que porcentaje de datos dentro de una distribución de frecuencias superan estas expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia, por lo que también se les llama " Medidas de Tendencia Central ".
Pero estas medidas de posición de una distribución de frecuencias han de cumplir determinadas condiciones para que lean verdaderamente representativas de la variable a la que resumen. Toda síntesis de una distribución se considerara como operativa si intervienen en su determinación todos y cada uno de los valores de la distribución, siendo única para cada distribución de frecuencias y siendo siempre calculable y de fácil obtención. A continuación se describen las medidas de posición más comunes utilizadas en estadística, como lo son:
• Cuartiles: Hay 3 cuartiles que dividen a una distribución en 4 partes iguales: primero, segundo y tecer cuartil.
• Deciles: Hay 9 deciles que la dividen en 10 partes iguales: (primero al noveno decil).
• Percentiles: Hay 99 percentiles que dividen a una serie en 100 partes iguales: (primero al noventa y nueve percentil).
Cuartiles (Q1, Q2, Q3)
a. Aquel valor de una serie que supera al 25% de los datos y es superado por el 75% restante.
Formula de Q1 para series de Datos Agrupados en Clase.
Donde:
: posición de Q1, la cual se localiza en la primera frecuencia acumulada que la contenga, siendo la clase de Q1, la correspondiente a tal frecuencia acumulada.
Li, faa, fi, Ic : idéntico a los conceptos vistos para Mediana pero referidos a la medida de la posición correspondiente.
b. Primer cuartil (Q1):
c. Segundo cuartil (Q2):
Coincide, es idéntico o similar al valor de la Mediana (Q2 = Md). Es decir, supera y es superado por el 50% de los valores de una Serie.
c) Tercer cuartil (Q3):
Aquel valor, termino o dato que supera al 75% y es superado por el 25% de los datos restantes de la Serie.
Formula de Q3 para series de Datos Agrupados en Clase.
Donde:
: posición de Q3, todo idéntico al calculo de la Mediana.
Deciles (D1, D2, … D9)
Primer Decil (D1), Quinto Decil (D5) y Noveno Decil (D9).
El primer decil es aquel valor de una serie que supera a 1/10 parte de los datos y es superado por las 9/10 partes restantes (respectivamente, hablando en porcentajes, supera al 10% y es superado por el 90% restante),
El D9 (noveno decil) supera al 90% y es superado por el 10% restante.
• Como se observa, son formulas parecidas a la del calculo de la Mediana, cambiando solamente la respectivas posiciones de las medidas.
Percentiles (P1, P2, … P99)
Primer Percentil (P1), Percentil 50 (P50) y Percentil 99 (P99).
El primer percentil supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.
Formulas de P1, P50, P99 para series de Datos Agrupados en Clase.
El P99 (noventa y nueve percentil) supera al 99% de los datos y es superado a su vez por el 1% restante.
• Idénticas formulas al calculo de la Mediana, cambiando obviamente las correspondientes posiciones de cada medida.
Para determinar estas medidas se aplicara el principio de la mediana; así, el primer cuartil cereal valor por debajo del cual se encuentra el 25 por ciento de los datos; bajo el tecer cuartil se encuentra el 75 por ciento; el 80 decil será el valor por encima del cual estará el 20 por ciento de los datos, etc.
Como se observa, todas estas medidas no son sino casos particulares del percentil ya que el primer cuartil no es sino el 25° percentil, el tercer cuartil el 75° percentil, el cuarto decil el 40° percentil, etc.
Datos no agrupados:
Se hace difícil calcular estas medidas, sin embargo, siguiendo los mismos principios mencionados para la Mediana, se pueden localizar en la forma siguiente:
Si tenemos una serie de valores X1, X2, X3 … Xn, se localiza el primer cuartil como el valor cuando n es par, y cuando n es impar. Para el tercer cuartil será (n par); (n impar).
En caso de los textiles será o donde A representa el número del textil.
Para los deciles será
...