Probabilidad
edgares199522 de Abril de 2014
3.061 Palabras (13 Páginas)341 Visitas
Parte teórica
1) Demostrar que Var(x)=1/n ∑_(i=1)^n▒〖〖x_i〗^2-x ̅^2 〗
Var(x)=1/n ∑_(i=1)^n▒(x_i-x ̅ )^2 =1/n ∑_(i=1)^n▒〖〖x_i〗^2-2x_i x ̅+x ̅^2 〗
=1/n ∑_(i=1)^n▒〖〖x_i〗^2-2x ̅ 1/n ∑_(i=1)^n▒〖x_i+1/n ∑_(i=1)^n▒x ̅^2 〗〗=1/n ∑_(i=1)^n▒〖〖x_i〗^2-2x ̅x ̅+x ̅^2 〗
=1/n ∑_(i=1)^n▒〖〖x_i〗^2-2x ̅^2 〗+x ̅^2=1/n ∑_(i=1)^n▒〖〖x_i〗^2-x ̅^2 〗
2) Demostrar que: Var(ax+b)=a^2 Var(x)
Suponiendo que z_i=ax_i+b tenemos que Var(Z)=1/n ∑_(i=1)^n▒〖(z_i-z ̅)〗^2
Además, sabemos que z ̅=1/n ∑_(i=1)^n▒z_i
z ̅=1/n ∑_(i=1)^n▒〖ax_i+b〗=1/n ∑_(i=1)^n▒〖ax_i+〗 1/n ∑_(i=1)^n▒b
z ̅=a 1/n ∑_(i=1)^n▒〖x_i+〗 1/n ∑_(i=1)^n▒〖b=ax ̅+1/n(nb)〗
z ̅=ax ̅+b
Volviendo a la varianza tenemos que:
Var(z)=1/n ∑_(i=1)^n▒〖(z_i-z ̅)〗^2
Var(z)=1/n ∑_(i=1)^n▒〖(ax_i+b-(ax ̅+b))〗^2
Var(z)=1/n ∑_(i=1)^n▒〖(ax_i-(ax ̅))〗^2
Var(z)=1/n ∑_(i=1)^n▒〖(a(x_i-x ̅))〗^2
Var(z)=1/n ∑_(i=1)^n▒〖a^2 (x_i-x ̅)〗^2
Var(z)=1/n ∑_(i=1)^n▒〖a^2 (x_i-x ̅)〗^2
Var(z)=a^2 1/n ∑_(i=1)^n▒(x_i-x ̅ )^2
Var(z)=a^2 var(x)
3) Demostrar que: Var(ax+by+c)=a^2 Var(x)+b^2 Var(y)+2abCov(x,y)
Suponiendo que z_i=ax_i+by_i+c tenemos que Var(Z)=1/n ∑_(i=1)^n▒〖(z_i-z ̅)〗^2
Además, sabemos que z ̅=1/n ∑_(i=1)^n▒z_i
z ̅=1/n ∑_(i=1)^n▒〖ax_i+by_i+c〗
z ̅=1/n ∑_(i=1)^n▒〖ax_i+〗 1/n ∑_(i=1)^n▒b y_i+1/n ∑_(i=1)^n▒c
z ̅=a 1/n ∑_(i=1)^n▒〖x_i+〗 b 1/n ∑_(i=1)^n▒y_i +1/n ∑_(i=1)^n▒c
z ̅=ax ̅+by ̅+1/n(nc)
z ̅=ax ̅+by ̅+c
Volviendo a la varianza tenemos que:
Var(z)=1/n ∑_(i=1)^n▒〖(z_i-z ̅)〗^2
Var(z)=1/n ∑_(i=1)^n▒〖(ax_i+by_i+c-(ax ̅+by ̅+c))〗^2 =1/n ∑_(i=1)^n▒〖(ax_i+by_i-ax ̅-by ̅)〗^2
Var(z)=1/n ∑_(i=1)^n▒〖〖(a〖(x〗_i-x ̅ )+b(y_i-y ̅))〗^2=1/n ∑_(i=1)^n▒〖(a^2 〖〖(x〗_i-x ̅)〗^2+b^2 (y_i-y ̅)〗^2 +2ab〖(x〗_i-x ̅)(y_i-y ̅))〗
Var(z)=1/n ∑_(i=1)^n▒〖a^2 〖〖(x〗_i-x ̅)〗^2 〗+1/n ∑_(i=1)^n▒〖b^2 〖(y_i-y ̅)〗^2 〗+1/n ∑_(i=1)^n▒〖2ab〖(x〗_i-x ̅)(y_i-y ̅))〗
Var(z)=a^2 1/n ∑_(i=1)^n▒〖〖(x〗_i-x ̅)〗^2 +b^2 1/n ∑_(i=1)^n▒〖(y_i-y ̅)〗^2 +2ab 1/n ∑_(i=1)^n▒〖〖(x〗_i-x ̅)(y_i-y ̅))〗
〖Var(z)=a〗^2 Var(x)+b^2 Var(y)+2abCov(x,y)
4) Demostrar que Cov(x,y)=1/n ∑_(i=1)^n▒〖〖(x〗_i y_i-x ̅y ̅)〗
5) Demostrar que: Cov(ax+b,cy+d)=ac Cov(x,y)
Como sabe z_i=ax_i+b y z ̅=ax ̅+b tenemos ahora análogamente que w_i=cy_i+d y w ̅=cy ̅+d
Cov(z,w)=1/n ∑_(i=1)^n▒〖(w_i-w ̅)(z_i-z ̅)〗
Cov(z,w)=1/n ∑_(i=1)^n▒〖(cy_i+d-(cy ̅+d))(ax_i+b-(ax ̅+b))〗
Cov(z,w)=1/n ∑_(i=1)^n▒〖(cy_i-cy ̅)(ax_i-ax ̅)〗
Cov(z,w)=1/n ∑_(i=1)^n▒〖(c〖(y〗_i-y ̅))(a(x_i-x ̅))〗
Cov(z,w)=1/n ∑_(i=1)^n▒〖ac(〖(y〗_i-y ̅))((x_i-x ̅))〗
Cov(z,w)=ac 1/n ∑_(i=1)^n▒〖(〖(y〗_i-y ̅))((x_i-x ̅))〗
Cov(z,w)=ac Cov(x,y)
Parte práctica
1) Determine el tipo de cada variable (continua, discreta, ordinal o nominal).
Precio discreta Proporción discreta
Vejez discreta Nota ordinal
Categoría ordinal Marca ordinal
2) Comente la composición de mercado en términos de la categoría de las marcas de whisky
En el estudio realizado se tuvieron en cuenta 35 marcas de whisky a las que se clasificó según su contenido de Malta en Bajo, Estándar y PuroMalta, encontrando que de dichas marcas un porcentaje cercano a la mitad fueron clasificadas en la categoría Estándar, es decir que poseen un tipo de malta regular, mientras que tan sólo el 20 % son hechas con la mejor Malta posible.
3) Calcule las estadísticas descriptivas de centro, dispersión, localización y forma que considere de interés para las variables cuantitativas y analice cada caso.
Variable: precio
La media se encuentra a la derecha de la mediana debido a la existencia de un dato atípico y otro extremo a la derecha; sin embargo, la diferencia entre las dos medidas es sólo de 2.71 ya que la mayoría de los datos están concentrados en torno a la media. Ya que el coeficiente de variación es de 22%, se puede afirmar que los valores se encuentran concentrados respecto a la media. El RQ es considerablemente menor que el rango, por la propiedad que tiene el RQ de omitir los datos atípicos y extremos. Los datos presentan una distribución asimétrica positiva, es decir, que existe mayor concentración de estos a la derecha de la media que a su izquierda.
Variable: vejez
Este 26% muestra la existencia de una concentración de datos respecto a la media. Al ser menor que 0 este valor indica que existe una distribución asimétrica negativa, sin embargo, |-0.55| puede ser interpretado como una simetría relativa, ya que tiende a 0.Como anteriormente se habló de una simetría relativa, se puede ahora utilizar la curtosis como medida de forma, puesto que el valor de la curtosis en menor que 0 la distribución de los datos presenta una forma aplanada (platicúrtica).
Variable: Proporción
En esta ocasión la mediana es menor que la media, por la presencia de datos extremos que jalonan el resultado de la media hacia la derecha. La diferencia entre los dos rangos es muy notoria ya que el rango es sensible a datos atípicos, como en este caso existen datos extremos, el cálculo del rango se ve muy influido por estos últimos. A diferencia del RQ que no se ve influido por estos datos. Un 57% de este coeficiente crea confusión en la interpretación ya que no es claro el nivel de dispersión que presentan los valores. El coef. de asimetría es mayor que 0, lo que indica que existe una distribución asimétrica positiva, es decir, que existe mayor concentración de estos a la derecha de la media que a su izquierda.
4) Construya los diagramas de tallo y hojas de las variables numéricas. Este numeral se realizará a lo largo de los siguientes numerales
5) Comente el diagrama de tallo y hojas de la variable Precio. ¿Cuál es el rango de precios más común en el mercado? ¿Cuál es el precio más común en el mercado? ¿Cuáles son los más raros?
- Al observar el diagrama de tallo y hojas de la variable precios, se encuentra fácilmente que el rango de precios en el que se encuentran las 35 marcas de whisky es de 105 francos, dado por x_([35])-x_[1] =160francos-55francos=105 francos.
- El precio más común en el mercado de whisky es de 87 francos franceses
-Se presentan 2 datos remarcables como lo son el dato de 127 (dato atípico) y el de 160 francos franceses(dato extremo), sin embargo se podría afirmar con el diagrama de tallo y hojas que el dato de 55 francos franceses es un dato raro, pese a que no lo es, como lo mostrará posteriormente el diagrama de caja.
6) Comente el diagrama de tallo y hojas de la variable proporción. Explique por qué hay 7 whiskys tan diferentes a los demás. ¿A qué se debe esta diferencia? ¿Ve alguna relación entre las variables Proporción y Precio?
- Encontramos que los 7 whiskys diferentes a los demás, los cuales presentan una propoción de malta del 100% correspondiendo a la categoría de pura malta. Si bien los 7 whiskys pertenecen a la categoría de pura malta, 5 de ellos están en el cuarto cuartil de precios, es decir se encuentran en un rango descrito por x_([35])-x_[27] =160francos-93francos=67 francos, y los otros dos whiskys restantes, pese a que no se encuentran en el último cuartil, sí se encuentran significativamente cerca correspondiendo uno a 90 francos y el otro a 86. Esto, nos permite afirmar que existe una fuerte relación directa entre la proporción de malta en el whisky y el precio del mismo, es decir, a mayor proporción, mayor precio encontraremos.
7) Comente el diagrama de tallo y hojas de la variable Vejez ¿Ve alguna correspondencia entre la vejez y el precio de las marcas de whisky?
- El diagrama de tallo y hojas de la variable vejez, nos permite observar que dicha variable presenta una gran cantidad de datos concentrados en los últimos valores y más específicamente cuando el whisky tiene 12 años, siendo este dato precisamente la moda de la variable.
-Si bien cabe destacar que el mayor precio de los datos (160 francos franceses) se encuentra en un whisky que tiene 12 años, no hay una fuerte relación entre los precios y la vejez de cada whisky, al menos para aquellos que tienen un añejamiento mayor. Caso distinto se puede observar en aquellos whiskys en los que el añejamiento es mucho menor (5años), en los que encontramos que algunos de los menores precios se encuentran en éstas marcas de whisky cuyo añejamiento fue el menor.
8) Construya diagramas de caja de las variables numéricas. Comente la forma de la distribución de las variables Precio y Vejez. Describa la simetría de sus distribuciones
Diagrama de caja de la variable Precio
A partir de la tabla, podemos
...