Univeridad
Enviado por lorenixxxx • 25 de Agosto de 2014 • 1.210 Palabras (5 Páginas) • 216 Visitas
Varianza
En teoría de probabilidad, la varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como la esperanza (media aritmética) del cuadrado de la desviación de dicha variable respecto a su media.
Está medida en unidades distintas de las de la variable. Por ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una medida de dispersión alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La varianza tiene como valor mínimo 0.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.
El término varianza fue acuñado por Ronald Fisher en un artículo publicado en enero de 1919 con el título The Correlation Between Relatives on the Supposition of Mendelian Inheritance.1
Definición
Si tenemos un conjunto de datos de una misma variable, la varianza se calcula de la siguiente forma:
Siendo:
• : cada dato
• : El número de datos
• : la media aritmética de los datos
Aplicando este concepto a una variable aleatoria con media μ = E[X], se define su varianza, Var(X) (también representada como o, simplemente σ2), como
Desarrollando la definición anterior, se obtiene la siguiente definición alternativa (y equivalente):
Si una distribución no tiene esperanza, como ocurre con la de Cauchy, tampoco tiene varianza. Existen otras distribuciones que, aun teniendo esperanza, carecen de varianza. Un ejemplo de ellas es la de Pareto cuando su índice k satisface 1 < k ≤ 2.
Caso continuo
Si la variable aleatoria X es continua con función de densidad f(x), entonces
donde
y las integrales están definidas sobre el rango de X.
Caso discreto
Si la variable aleatoria X es discreta con pesos x1 ↦ p1, ..., xn ↦ pn y n es la cantidad total de datos, entonces tenemos:
donde
.
Ejemplos
Distribución exponencial
La distribución exponencial de parámetro λ es una distribución continua con soporte en el intervalo [0,∞) y función de densidad
Tiene media μ = λ−1. Por lo tanto, su varianza es:
Es decir, σ2 = μ2.
Dado perfecto
Un dado de seis caras puede representarse como una variable aleatoria discreta que toma, valores del 1 al 6 con probabilidad igual a 1/6. El valor esperado es (1+2+3+4+5+6)/6 = 3,5. Por lo tanto, su varianza es:
Propiedades de la varianza
Algunas propiedades de la varianza son:
•
• siendo a y b números reales cualesquiera. De esta propiedad se deduce que la varianza de una constante es cero, es decir,
• , donde Cov(X,Y) es la covarianza de X e Y.
• , donde Cov(X,Y) es la covarianza de X e Y.
Desviación estándar
La desviación estándar o desviación típica (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.
Interpretación y aplicación
La desviación típica es una medida del
...