Tecnologia
Enviado por poncho5 • 11 de Septiembre de 2014 • 2.777 Palabras (12 Páginas) • 200 Visitas
Unidad 4. Estadística inferencial
4.1 Inferencia estadística.
El principal objetivo de la Inferencia Estadística consiste en poder decir algo con respecto a un gran conjunto de personas, mediciones u otros entes (población) con base en las observaciones hechas sobre sólo una parte (muestra) de dicho gran conjunto. La capacidad para "decidir algo" sobre poblaciones con base en muestras está basada en supuestos con respecto a algún modelo de probabilidad que permite explicar las características del fenómeno bajo observación.
Al conjunto de procedimientos estadísticos en los que interviene la aplicación de modelos de probabilidad y mediante los cuales se realiza alguna afirmación sobre poblaciones con base en la información producida por muestras se le llama Inferencia Estadística o Estadística Inferencial.
4.2 Muestreo estadístico.
Lenguaje de Muestreo
Definiciones:
Población es el grupo entero de objetos o individuos bajo estudio, de los cuales queremos obtener información.
Censo es una muestra de toda la población.
Muestra es una parte de la población de la cual obtenemos información.
Unidad es un objeto individual o persona en la población.
Variable es una característica de interés medida en cada unidad de la muestra.
El tamaño de la población se denota por la letra mayúscula N.
El tamaño de la muestra se denota por la letra minúscula n.
Parámetro: es una medida numérica que se calcularía usando todas las unidades de la población.
Estadístico: es una medida numérica que se calcula de las unidades de la muestra.
4.3 Estimadores.
Cuando queremos realizar un estudio de una población cualquiera de la que desconocemos sus parámetros, por ejemplo su media poblacional o la probabilidad de éxito si la población sigue una distribución binomial, debemos tomar una muestra aleatoria de dicha población a través de la cual calcular una aproximación a dichos parámetros que desconocemos y queremos estimar. Bien, pues esa aproximación se llama estimación.
Además, junto a esa estimación, y dado que muy probablemente no coincida con el valor real del parámetro, acompañaremos el error aproximado que se comete al realizarla.
4.4 Estimación puntual
Una estimación puntual del valor de un parámetro poblacional desconocido (como puede ser la media μ , o la desviación estándar σ ), es un número que se utiliza para aproximar el verdadero valor de dicho parámetro poblacional. A fin de realizar tal estimación, tomaremos una muestra de la población y calcularemos el parámetro muestral asociado ( x para la media, s para la desviación estándar, etc.). El valor de este parámetro muestral será la estimación puntual del parámetro poblacional.
Por ejemplo, supongamos que la compañía Sonytron desea estimar la edad media de los compradores de equipos de alta fidelidad. Seleccionan una muestra de 100 compradores y calculan la media de esta muestra, este valor será un estimador puntual de la media de la población.
4.5 Estimación por intervalo.
Dada una población X, que sigue una distribución cualquiera con media μ y desviación estándar σ.
1. Sabemos que, para valores grandes de n, la media muestral x ̅ sigue una distribución aproximadamente normal.
2. Por otra parte, en una distribución normal, aproximadamente un 95% de los datos estaban situados a una distancia inferior a dos desviaciones estándar de la media.
De lo anterior se deduce que
P(x ̅-2σ_x ̅ <μ<x ̅+2σ_x ̅ )=0.95
Por tanto, ésta última fórmula nos da un intervalo de valores tal que la probabilidad de que la media de la población μ esté contenida en él es de 0.95.
Este tipo de intervalos se llaman intervalos de confianza de un parámetro poblacional. El nivel de confianza (1 - α) del intervalo es la probabilidad de que éste contenga al parámetro poblacional. En el ejemplo anterior, el nivel de confianza es del 95% y el nivel de significancia es α = 5%.
Intervalo de Confianza para μ
Si se está frente a una población con distribución normal, de media μ desconocida; y se quiere estimar dicha media a partir de datos muestrales se pueden presentar dos posibles situaciones: que la varianza de la población sea Conocida o bien que sea Desconocida.
Situación 1:
Un intervalo de confianza de nivel α−1 para μ, cuando la varianza poblacional es conocida, está dado por la expresión:
P(x ̅ - Z_((1-α/2) )* σ/√n ≤ μ ≤ x ̅ + Z_((1-α/2) )* σ/√n) = 1-α
Siendo Z_((1-α/2) ), el valor de la tabla Normal estándar.
Situación 2:
Un intervalo de confianza de nivel α−1 para μ, cuando la varianza es desconocida, está dado por la expresión:
Para n<30
P(x ̅ - t_((n-1; 1-α/2) )* s/√n ≤ μ ≤ x ̅ + t_((n-1; 1-α/2) )* s/√n) = 1-α
Para n≥30
P(x ̅ - Z_((1-α/2) )* s/√n ≤ μ ≤ x ̅ + Z_((1-α/2) )* s/√n) = 1-α
Donde s2 es la varianza muestral, obtenida a partir de:
S^2=(∑_(i=1)^n▒(x-x ̅ )^2 )/(n-1)
y t_((n-1; 1-α/2) ) es el valor de la tabla de distribución "t de Student.
Ejercicios:
1.- Se encuentra que la concentración promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el río. Suponga que la desviación estándar de la población es 0.3.
2.- Una empresa eléctrica fabrica focos que tienen una duración aproximadamente distribuida de forma normal con una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una duración promedio de 780 horas, encuentre el intervalo de confianza de 96% para la media de la población de todos los focos que produce esta empresa.
3.- El administrador de una planta industrial generadora de energía desea estimar, por intervalo, la cantidad de carbón que se consumió por término medio semanalmente durante año pasado. Para ello toma una muestra de 10 semanas. El consumo medio fue de 11.400 toneladas, la desviación estándar muestral 700 toneladas. ¿Cuál será el intervalo de confianza del 95% para el consumo
...