Intervalo De Confianza

3 de Agosto de 2014

3.159 Palabras (13 Páginas)860 Visitas

Página 1 de 13

Intervalo de confianza

En estadística, se llama a un par o varios pares de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ 2 . Es habitual que el parámetro presente una distribución normal.

En definitiva, un intervalo de confianza al 1 - α por ciento para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

Intervalo de confianza para la media

De una población de media y desviación típica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media ( ). Se puede demostrar que la media de todas las medias muéstrales coincide con la media poblacional:

Pero además, si el tamaño de las muestras es lo suficientemente grande, la distribución de medias muéstrales es prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión:

. Esto se representa como sigue . Si estandarizamos, se sigue que:

En una distribución Z ~ N (0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2tales que P [z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)•100 es el porcentaje deseado.

Se desea obtener una expresión tal que

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto —o, mejor dicho, su versión estandarizada o valor critico junto con su “opuesto en la distribución” . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen

Dicho punto es el número tal que:

Y en la versión estandarizada se cumple que:

Así:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendrá el intervalo de confianza:

Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto del valor crítico por el error estándar . Si no se conoce y n es grande (habitualmente se toma n ≥ 30):5 , donde s es la desviación típica de una muestra.

Aproximaciones para el valor para los niveles de confianza estándar son 1,96 para y 2,576 para .

Intervalos de confianza para la proporción

Vamos a establecer, al igual que para la media, intervalos estimadores para la proporción poblacional P.

Si tenemos el estadístico proporción muestral p.

El intervalo de confianza seria: p ± Zcσp

Siendo:

P: Proporción muestral en la muestra de tamaño n.

Zc: Coeficiente de confianza.

σp: Desviación típica de la distribución muestral de proporciones.

Para el caso de poblaciones infinitas:

Como σp= √(PQ/n)

El intervalo viene dado por:

p ± Zc√(PQ/n)

Para poblaciones finitas, o muestreos sin reemplazamiento: el intervalo seria:

p ± Zc√(PQ/n) √((N-n)/(N-1))

Para los casos en que se desconoce P se puede estimar de acuerdo a lo visto para la estimación puntual de parámetros, utilizando siempre el mejor estimador, de acuerdo con las propiedades correspondientes.

De igual manera tendríamos los intervalos de confianza para la diferencia de medias y proporciones, considerando muestras independientes y los dos tipos de poblaciones que hemos tratado:

Poblaciones finitas:

Para la diferencia demedias, se tiene:

X̅1-X̅2 Zc√(〖σ_1〗^2/n_1 )+√(〖σ_2〗^2/n_2 )

Para la diferencia de Proporciones, seria:

P1 –P2 ±Zc√((P_1 Q_1)/n_1 )+√((P_2 Q_2)/n_2 )

Poblaciones finitas:

Para Diferencia de Proporciones:

P1 –P2 ±Zc√((P_1 Q_1)/n_1 )+√((P_2 Q_2)/n_2 ) √((N-n)/(N-1))

Para Diferencia de medias

X̅1-X̅2 Zc√(〖σ_1〗^2/n_1 )+√(〖σ_2〗^2/n_2 ) √((N-n)/(N-1))

Muestreo

En la práctica nos interesa determinar el tamaño de la muestra mas adecuada para nuestro estudio puesto que el costo entiempo y dinero de nuestra investigación va depender de la buena selección de la misma.

Recordamos que no siempre la muestra mayor arroja los mejores resultados sino que el diseño de la muestra más apropiado es el que conduce a resultados óptimos.

A partir de una muestra aleatoria de tamaño n, se desconoce qué tan cerca (por defecto o exceso) está del parámetro a estimar θ. Por eso se utiliza frecuentemente otro tipo de estimación, la estimación por intervalos, la cual nos permite de acuerdo a un nivel de confianza especificado obtener una información más precisa sobre el parámetro a estimar.

1. Intervalo de confianza para medias con n › 30 (grandes muestras):

µ∈(X ̅-Z_(a/2) σ/√n,X ̅+Z_(a/2) σ/√n)Es una estimación por intervalo de la media de la población para un nivel de confianza del (1-α)%; por ejemplo, si se define un nivel de confianza del 95 %, esto significa que por cada 100 muestras de tamaño n › 30 en 95 de ellas la media de la población cae dentro de este intervalo.

2. Intervalo de confianza para medias con n < 30 (pequeñas muestras):

Se utiliza la t de Student para estos casos y cuando se desconoce la desviación de la población, utilizando la siguiente expresión:µ∈(X ̅-t_(a/2) s/√n,X ̅+t_(a/2) s/√n)Es una estimación por intervalo de la media de la población para un nivel de confianza del (1-α)%.

Distribución t de Student

En probabilidad y estadística, la distribución t (de Student) es una distribución que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muéstrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.

La Caracterización

Tiene características similares a la distribución normal, su diferencia principal radica en las áreas de los extremos las cuales son más amplias, como consecuencia de que usualmente se trabaja con muestras pequeñas. La sintaxis en Excel es: DISTR.T(x; grados de libertad, colas).

X es el valor numérico al que se ha de evaluar la distribución. Grados de libertad es un entero que indica el número de grados de libertad. Colas especifica el número de colas de la distribución que se ha de devolver. Toma los valores de 1 o 2.

La distribución t de Student es la distribución de probabilidad del cociente

Donde

Z tiene una distribución normal de media nula y varianza 1

V tiene una distribución ji-cuadrado con grados de libertad

Z y V son independientes

Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad .

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media μ y varianza σ2. Sea la media muestral. Entonces: Sigue una distribución normal de media 0 y varianza 1.

Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado, Donde Es la varianza muestral y demostró que la función de densidad de T es Donde es igual a n − 1.

La distribución de T se llama ahora la distribución-t de Student.

El parámetro representa el número de grados de libertad. La distribución depende de , pero no de o , lo cual es muy importante en la práctica.

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media , siendo entonces el intervalo de confianza para la media .

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de

...

Descargar como (para miembros actualizados) txt (21 Kb)

Leer 12 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com