DESVIACIÓN CUARTIL
Enviado por robertm • 3 de Agosto de 2014 • 2.376 Palabras (10 Páginas) • 1.395 Visitas
DESVIACIÓN CUARTIL
Es la medida de dispersión mas usada en relación con la mediana: algunos autores le llaman rango semi-intercuartil. Se le simboliza por Q. La desviación cuartil (Q) representa la desviación promedio del primer y tercer cuartil con respecto a la mediana de la distribución, y nos dará cierta idea de cuanto se desvían esos dos puntos (dos casos típicos) de la mediana.
La desviación cuartil es un método estadístico que se emplea para incrementar el grado de confianza de un análisis específico.
Conocidos los cuartiles se puede calcular la desviación cuartil, la cual mide la amplitud ó rango existente entre los términos centrales de la distribución.
Es una medida de variación como el rango referida al 50% de las observaciones contra las demás series.
La desviación cuartil es igual a la mitad del rango comprendido entre el
50% de los términos centrales de la distribución. Numéricamente es la mitad de la distancia entre el primer y tercer cuartil, que eso también se conoce como rango semi-cuartil.
Desviación cuartil =Q3−Q1
DESVIACIÓN INTERCUARTIL
Esta medida de dispersión se construye basándose en la diferencia entre el tercer y primer cuartil. En realidad es la mitad de esa diferencia.
Si se escribe Q1 y Q3 para el primer y tercer cuartil respectivamente, entonces la 'desviación intercuartil' está definida por:
Esta estadística cumple una función similar a la desviación estádar, pero es mucho más resistente al efecto de valores extremos en los datos. De hecho, los cuartiles primero y tercero dejan entre sí la mitad de la muestra, La otra mitad se encuentra fuera y por lo tanto la presencia de un bajo número de datos extremos no cambia el valor de la desviación intercuartil
varianza
es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.
Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente forma:
Siendo:
• : cada dato
• : El número de datos
• : la media aritmética de los datos
Aplicando este concepto a una variable aleatoria con media μ = E[X], se define su varianza, Var(X) (también representada como o, simplemente σ2), como
Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):
Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice k satisface 1 < k ≤ 2.
DESVIACIÓN TÌPICA O ESTANDAR
De todas las medidas de dispersión, la desviación típica es la medida que más se utiliza en la práctica. Empezaremos por indicar cómo se calcula, tanto en el caso de datos agrupados como no agrupados.
Con datos no agrupados, el proceso se inicia de la misma forma que si se tratara de hallar la desviación media. Es decir, en primer lugar, se calcula la media. Luego se hallan las desviaciones de cada puntuación respecto de dicha media. Después se elevan al cuadrado cada una de estas desviaciones y se suman los resultados obtenidos.
Tenga presente que una forma de ir comprobando la bondad de los cálculos consiste en observar que la suma de las desviaciones respecto de la media (suma de las x) es cero.
En nuestro caso en Estadística descriptiva solo interesa conocer cómo se distribuyen, respecto de la media de la muestra, un conjunto de datos o puntuaciones.
Cálculo de la desviación típica en el caso de datos no agrupados : = 12.4
En el ejemplo la desviación típica (s) es 4.5.
Algunos autores la representan por
Otros ejemplos usted encontrará en su texto básico página 90.
Si se dispone de una máquina de calcular, es más cómodo aplicar la fórmula que se llama de las puntuaciones brutas para obtener la suma de los cuadrados de las
desviaciones. En la misma, se han escrito las puntuaciones y la primera columna se encabeza por la letra X. La segunda columna es, sencillamente, el cuadrado de cada
d. (Luego se suman los valores en ambas columnas. Debe observarse que si se emplea una máquina de calcular, no es necesario escribir las puntuaciones originales o sus cuadrados, como aparecen a continuación.
Se registran las puntuaciones en la máquina una a una, y en la misma se acumula la suma.
Al final, ambos valores se leen directamente en la máquina. Con este modo de proceder, la suma de cuadrados (de las desviaciones) viene dada por la siguiente fórmula:
Este valor de la suma de cuadrados es el mismo que se obtiene al sumar los cuadrados de las desviaciones de cada puntuación respecto de la media. Aún sin máquina de calcular, el método anterior puede resultar más cómodo que el primero. Obtenida la suma de cuadrados, se sustituyen los valores en la fórmula dada.
Cálculo directo de la desviación típica a partir de las puntuaciones brutas
Otros ejemplos usted encontrará en su texto básico página 90, a fin de que desarrolle este ejercicio.
A veces, se abrevia la expresión calculando por medio de la fórmula que plantea su texto básico en la unidad 19.
¿Cuál le parece más fácil?
Cómo se podrá cuenta la combinación de este cálculo da lugar a la desviación típica a partir de las puntuaciones brutas:
¿Qué sucede si la serie es de frecuencias o tipo II?
Tendremos que incluir este dato. Así:
s=
Coeficiente de variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del
...