Estadisticas Inferencial 1
Enviado por victoremmanuelo • 14 de Diciembre de 2012 • 4.087 Palabras (17 Páginas) • 366 Visitas
ESTADÍSTICA INFERENCIAL I
Introducción
Antes de abordar los siguientes temas es necesario que se establezca la definición de ciertos términos que se manejaran en la información aquí contenida.
Por ejemplo el término de población en estadística es un vestigio de la época en que la estadística se aplicaba principalmente a los fenómenos sociológicos y económicos. En nuestros días, se aplica a conjuntos o colecciones de objetos, reales o conceptuales, y principalmente a conjuntos de números, mediciones u observaciones.
Dado que existen poblaciones finitas e infinitas es necesario definir cada una de ellas para poder analizarlas. Como las poblaciones se describen a menudo por las distribuciones de sus valores, al hablar de una población finita nos referimos a la distribución real de sus valores y para una población infinita nos referimos a la distribución de probabilidad o densidad de probabilidad.
Si una población es infinita resulta imposible observar todos sus valores, y aun si es finita puede ser poco práctico o muy caro observarla por completo. De ahí que casi siempre haya que recurrir a una muestra, es decir, a una parte de la población, e inferir de ella resultados relativos a la población entera. Para asegurar que la muestra sea representativa de la población de donde se obtiene y proporcionar una base para aplicar la teoría de la probabilidad a problemas de muestreo, nos basaremos en las muestras aleatorias.
La muestra aleatoria de una población finita se define como:
Un conjunto de observaciones x1, x2,…,xn constituye una muestra aleatoria de tamaño n de una población finita de medida N, si es elegida en forma tal que cada subconjunto de n de los N elementos de la población tenga la misma probabilidad de ser elegido.
La muestra aleatoria de una población infinita se define como:
Un conjunto de observaciones x1, x2,…, xn constituye una muestra aleatoria de tamaño n de una población infinita f(x) si:
1.- Cada Xi es un valor de una variable aleatoria cuya distribución tiene los valores f(x).
2.- Esta n variable aleatoria son independientes.
Por ejemplo, supóngase que estamos investigando la resistencia al rompimiento de botellas de refresco de vidrio de un litro, y que dicha resistencia en la población de las botellas se distribuye normalmente. Esperaríamos entonces que cada una de las observaciones de resistencia al rompimiento X1, X2,..., Xn en una muestra aleatoria de n botellas fuera de una variable aleatoria independiente con exactamente la misma distribución normal.
La mayoría de las investigaciones estadísticas se proponen generalizar a partir de la información contenida en muestras aleatorias acerca de la población de donde fueron obtenidas. En particular, estaremos interesados frecuentemente en el problema de hacer inferencias sobre los parámetros de las poblaciones, como la media µ o la desviación estándar σ. Para efectuar inferencias utilizaremos estadísticos como y s, es decir, cantidades calculadas con base en observaciones de la muestra.
Debido a que se realizaron diversos cálculos en los ejercicios que se presentan, es necesario basarse en datos tomados de tablas, en este caso fueron referenciados por tablas 3,4 y 5 del libro del autor Irwin Miller.
Unidad 1 Distribuciones muéstrales
Distribución Muestral de la media con σ Conocida
Si suponemos que una muestra aleatoria de n se ha extraído de alguna población y que x se ha calculado, digamos para estimar la media de la población. Es claro que, sí tomamos una segunda muestra aleatoria de tamaño n de esta población, sería poco razonable esperar el mismo valor para x, y si tomamos varias muestras es más probable que ninguna de las sería igual a la otra.
Con el fin de dar una explicación a ello nos referiremos al siguiente ejemplo:
Supóngase que 50 muestras aleatorias de tamaño n = 10 se extraen de una población que tiene la distribución uniforme discreta
Estamos haciendo un muestreo de una población infinita. Una forma conveniente de obtener estas muestras es utilizar una tabla de números aleatorios, haciendo que cada muestra conste de 10 dígitos consecutivos de renglones o columnas aleatoriamente escogidas. De esta manera obtenemos 50 muestras cuyas medias son:
Al agruparlas en una distribución con las clases 2.0 a 2.9, 3.0 a 3.9,..., y 6.0 a 6.9, obtenemos:
En la siguiente figura se muestra la distribución de las medias que tiene la forma de campana, a pesar de que la población misma tiene una distribución uniforme.
Aquí surge la pregunta de sí en realidad nuestro resultado es representativo de lo que podríamos esperar; esto es, si obtuviésemos distribuciones similares al repetir el experimento una y otra vez.
Con el propósito de responder a ello tendremos que investigar la distribución muestral teórica de la media a través del siguiente teorema;
Teorema: Si una muestra aleatoria de tamaño n se elige de una población que tiene media µ y variancia , entonces es un valor de una variable aleatoria cuya distribución tiene media µ.
Para muestras tomadas de poblaciones infinitas la variancia de esta distribución es:
Para muestras tomadas de poblaciones finitas de tamaño N la variancia es:
El factor se denomina factor de corrección para población finita, y es cercano a 1 y puede omitirse en la práctica a menos que la muestra constituya una porción sustancial de la población.
La confiabilidad de la media como una estimación de µ a menudo es medida por , también es denominado error estándar de la media. Esta medida de la confiabilidad de la medía decrece en proporción a la raíz cuadrada de n; por ejemplo, es necesario cuadruplicar el tamaño de la muestra a fin de reducir a la mitad la desviación estándar de la distribución muestral de la media. Esto indica también lo que podría ser llamado “ley de retribuciones disminuidas", en cuanto a incrementar el tamaño de la muestra.
Ejercicios.
Los datos sobre la resistencia de la cohesión por tensión de un mortero son las siguientes:
16.85 16.40 17.21 16.35 16.52 17.04 16.96 17.15 16.59 16.57
La resistencia por cohesión se mide en unidades de kgf / . El promedio de la muestra es:
=(16.85+16.40+17.21+16.35+16.52+17.04+16.96+17.15+16.59+16.57)/10
=16.764 kgf /
...