Intervalo De Confianza
Enviado por • 3 de Agosto de 2014 • 3.159 Palabras (13 Páginas) • 773 Visitas
Intervalo de confianza
En estadística, se llama a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ 2 . Es habitual que el parámetro presente una distribución normal.
En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.
Intervalo de confianza para la media
De una población de media y desviación típica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muéstrales coincide con la media poblacional:
Pero además, si el tamaño de las muestras es lo suficientemente grande, la distribución de medias muéstrales es prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión:
. Esto se representa como sigue . Si estandarizamos, se sigue que:
En una distribución Z ~ N (0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2tales que P [z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)•100 es el porcentaje deseado.
Se desea obtener una expresión tal que
En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto).
Para ello se necesita calcular el punto —o, mejor dicho, su versión estandarizada o valor critico junto con su “opuesto en la distribución” . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen
Dicho punto es el número tal que:
Y en la versión estandarizada se cumple que:
Así:
Haciendo operaciones es posible despejar para obtener el intervalo:
De lo cual se obtendrá el intervalo de confianza:
Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto del valor crítico por el error estándar . Si no se conoce y n es grande (habitualmente se toma n ≥ 30):5 , donde s es la desviación típica de una muestra.
Aproximaciones para el valor para los niveles de confianza estándar son 1,96 para y 2,576 para .
I
Intervalos de confianza para la proporción
Vamos a establecer, al igual que para la media, intervalos estimadores para la proporción poblacional P.
Si tenemos el estadístico proporción muestral p.
El intervalo de confianza seria: p ± Zcσp
Siendo:
P: Proporción muestral en la muestra de tamaño n.
Zc: Coeficiente de confianza.
σp: Desviación típica de la distribución muestral de proporciones.
Para el caso de poblaciones infinitas:
Como σp= √(PQ/n)
El intervalo viene dado por:
p ± Zc√(PQ/n)
Para poblaciones finitas, o muestreos sin reemplazamiento: el intervalo seria:
p ± Zc√(PQ/n) √((N-n)/(N-1))
Para los casos en que se desconoce P se puede estimar de acuerdo a lo visto para la estimación puntual de parámetros, utilizando siempre el mejor estimador, de acuerdo con las propiedades correspondientes.
De igual manera tendríamos los intervalos de confianza para la diferencia de medias y proporciones, considerando muestras independientes y los dos tipos de poblaciones que hemos tratado:
Poblaciones finitas:
Para la diferencia demedias, se tiene:
X̅1-X̅2 Zc√(〖σ_1〗^2/n_1 )+√(〖σ_2〗^2/n_2 )
Para la diferencia de Proporciones, seria:
P1 –P2 ±Zc√((P_1 Q_1)/n_1 )+√((P_2 Q_2)/n_2 )
Poblaciones finitas:
Para Diferencia de Proporciones:
P1 –P2 ±Zc√((P_1 Q_1)/n_1 )+√((P_2 Q_2)/n_2 ) √((N-n)/(N-1))
Para Diferencia de medias
X̅1-X̅2 Zc√(〖σ_1〗^2/n_1 )+√(〖σ_2〗^2/n_2 ) √((N-n)/(N-1))
Muestreo
En la práctica nos interesa determinar el tamaño de la muestra mas adecuada para nuestro estudio puesto que el costo entiempo y dinero de nuestra investigación va depender de la buena selección de la misma.
Recordamos que no siempre la muestra mayor arroja los mejores resultados sino que el diseño de la muestra más apropiado es el que conduce a resultados óptimos.
A partir de una muestra aleatoria de tamaño n, se desconoce qué tan cerca (por defecto o exceso) está del parámetro a estimar θ. Por eso se utiliza frecuentemente otro tipo de estimación, la estimación por intervalos, la cual nos permite de acuerdo a un nivel de confianza especificado obtener una información más precisa sobre el parámetro a estimar.
1. Intervalo de confianza para medias con n › 30 (grandes muestras):
µ∈(X ̅-Z_(a/2) σ/√n,X ̅+Z_(a/2) σ/√n)Es una estimación por intervalo de la media de la población para un nivel de confianza del (1-α)%; por ejemplo, si se define un nivel de confianza del 95 %, esto significa que por cada 100 muestras de tamaño n › 30 en 95 de ellas la media de la población cae dentro de este intervalo.
2. Intervalo de confianza para medias con n < 30 (pequeñas muestras):
Se utiliza la t de Student para estos casos y cuando se desconoce la desviación de la población, utilizando la siguiente expresión:µ∈(X ̅-t_(a/2) s/√n,X ̅+t_(a/2)
...