Leer Ensayo Completo Prueba De Hipótesis Para Varianzas

Prueba De Hipótesis Para Varianzas

Imprimir Documento!
Suscríbase a ClubEnsayos - busque más de 2.129.000+ documentos

Categoría: Temas Variados

Enviado por: Antonio 02 mayo 2011

Palabras: 2779 | Páginas: 12

...

da estadística (promedio, varianza, etc.) calculada con todos los elementos de la población. Generalmente se simbolizan con letras del alfabeto griego o con letras mayúsculas.

2.2. Estimador

Es una medida estadística (promedio, varianza, etc.) calculada con la información suministrada por una muestra. Generalmente se simbolizan con la letra que identifica al parámetro y un ^ encima que se lee estimado, o con letras minúsculas de nuestro alfabeto.

2.3. Estimación

Es el valor numérico del estimador.

2.4. Inferencia

Generalmente, en estadística no es posible tomar toda la información, por lo que se debe tomar una muestra para analizarla y con base en la información suministrada por la muestra generalizar el comportamiento de la población entera. A esta generalización se le llama inferencia estadística.

En la estadística es fundamental el proceso de inferencia, ya que se afirma algo acerca del comportamiento de la población a partir de una muestra.

Dentro del proceso de inferencia hay dos tipos de estimación: estimación puntual y estimación por intervalo.

2.4.1. Estimación puntual

Si se toma una muestra aleatoria y con la información suministrada por ella se obtiene un indicador cualquiera (promedio, desviación estándar o proporción) es un estimador puntual del valor del parámetro. Es decir, un estimador puntual es un solo valor que, se supone, representa adecuadamente el comportamiento de una variable.

Un estimador puntual debe cumplir algunas condiciones mínimas para que sea considerado un buen estimador. Estas condiciones: insesgado, consistente, eficiente o de varianza mínima y suficiente.

Insesgado: Un estimador es insesgado si el valor promedio del estimador es igual al valor del parámetro.

Consistente: Un estimador es consistente, si a medida que aumenta el tamaño de la muestra, el valor del estimador se acerca al valor del parámetro.

Eficiente o de varianza mínima: Si se toman dos muestras aleatorias del mismo tamaño provenientes de la misma población y si con cada una de estas muestras se obtiene un estimador insesgado, es eficiente el que tenga menor varianza.

Suficiente: Un estimador es suficiente si para calcularlo se utiliza toda la información suministrada por la muestra.

2.4.2. Estimación por intervalos

En la estimación puntual se halla un solo valor o indicador del comportamiento de una variable, pero no se sabe qué tan cerca está el valor estimado del parámetro. Generalmente, no se necesita un valor exacto, si no un rango dentro del cual esperamos que esté el valor del parámetro; por esta razón, es de gran utilidad la estimación por intervalo en donde se tiene en cuenta la dispersión de los datos y de antemano se conoce la confiabilidad de la estimación.

2.5. Teorema central del límite

El teorema central del límite indica que, en condiciones muy generales, la distribución de la suma de variables aleatorias tiende a una distribución normal (también llamada distribución gaussiana o curva de Gauss o campana de Gauss) cuando la cantidad de variables es muy grande.

Teorema: Sea X1, X2, ..., Xn una muestra aleatoria de una distribución con media μ y varianza σ2. Entonces, si n es suficientemente grande, la variable aleatoria

[pic]

tiene aproximadamente una distribución normal con [pic]y [pic].

También se cumple que si [pic]

tiene aproximadamente una distribución normal con [pic]y [pic], cuanto más grande sea el valor de n, mejor será la aproximación.

El teorema del límite central garantiza una distribución normal cuando n es suficientemente grande. Existen diferentes versiones del teorema, en función de las condiciones utilizadas para asegurar la convergencia. Una de las más simples establece que es suficiente que las variables que se suman sean independientes, idénticamente distribuidas, con valor esperado y varianza finitas. La aproximación entre las dos distribuciones es, en general, mayor en el centro de las mismas que en sus extremos o colas, motivo por el cual se prefiere el nombre "teorema del límite central" ("central" califica al límite, más que al teorema).

2.6. Distribuciones en el muestreo

De una población de tamaño N, se pueden sacar N combinado n muestras diferentes de tamaño n. Con cada una de estas muestras es posible obtener un estimador, ya sea la media, proporción, varianza, etc... La distribución de estos estimadores se conoce como distribución en el muestreo.

El conocer la distribución en el muestreo de algunos de estos estimadores es útil en el desarrollo teórico de los temas correspondientes a estimación por intervalo y pruebas de hipótesis. Las distribuciones en el muestreo más utilizadas serían:

1. Distribución en el muestreo de la varianza

2. Distribución en el muestreo de la media

3. Distribución de la diferencia de medias

4. Distribución de la proporción

5. Distribución de la diferencia de proporciones

6. Distribución del cociente de varianzas

UNIDAD III

PRUEBA DE HIPOTESIS

Dentro del proceso de inferencia, además de la estimación puntual y la estimación por intervalos, en muchas ocasiones es necesario hacer pruebas de hipótesis, las cuales se hacen con base en la información obtenida de la muestra.

Los tipos de pruebas de hipótesis existentes son:

Tipos de Pruebas de Hipótesis:

1. Prueba de hipótesis para la media

2. Prueba de hipótesis para la proporción

3. Prueba de hipótesis para la varianza

4. Prueba de hipótesis para el cociente de varianzas

5. Prueba de hipótesis para la diferencia de medias

6. Prueba de hipótesis para la diferencia de proporciones

7. Prueba Chi-Cuadrado o bondad de ajuste

8. Prueba de independencia

En este capítulo se verá la definición de hipótesis y la prueba de hipótesis para la media varianza.

3.1 HIPOTESIS

Una hipótesis estadística es un supuesto acerca del valor de un parámetro de una población determinada. Este supuesto debe comprobarse con la información suministrada por una muestra aleatoria obtenida de dicha población.

Cuando se realiza una prueba de hipótesis, se plantean dos hipótesis que deben ser mutuamente excluyentes; una es la hipótesis nula que se nota como H0 y la otra es la hipótesis alternativa que se nota como H1 .

Se debe establecer un criterio o regla de decisión según la cual no se rechace la hipótesis nula o se rechace. Si se rechaza la hipótesis nula (H0 ) se acepta hipótesis alternativa (H1 ). Para establecer esta regla de decisión la distribución de probabilidad se divide en dos categorías mutuamente excluyentes: la que lleva al rechazo de H0 , es decir está en la zona de rechazo y la que lleva al no rechazo de H0 , es decir, está en la zona de no rechazo.

Debido a que se está trabajando con una muestra aleatoria, cuando se realiza una prueba de hipótesis se pueden cometer dos tipos de errores. La hipótesis nula (H0 ) es en realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de significancia ( [pic]). Puesto que cuando se comete un error tipo I, seguiríamos una acción errónea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H1 dado que H0 es verdadera.

Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama ERROR TIPO II.

3.1.1 FORMULACION DE HIPOTESIS

El primer paso en la prueba de hipótesis es el planteamiento de las hipótesis, lo que en algunos casos no es una tarea fácil.

Hay tres tipos de hipótesis, a saber:

3.1.1.1 Prueba de hipótesis a dos colas

H0: [pic]= k

H1: [pic][pic]k

3.1.1.2 Prueba de hipótesis a una cola superior

H0 : [pic]= k ó H0: [pic][pic]k

H1 : [pic]> k ó H1 : [pic]> k

3.1.1.3 Prueba de hipótesis a una cola inferior

H0 : [pic]= k ó H0 : [pic][pic]k

H1 : [pic]< k ó H1 : [pic]< k

Nótese que las hipótesis siempre se plantean para un parámetro [pic].

Una vez establecidas las hipótesis, se selecciona el nivel de significancia o margen de error ([pic]) el que generalmente se fija entre el uno y el diez por ciento.

El tercer paso es la estadística a probar o estadística de trabajo, la cual depende de la distribución en el muestreo del estimador con el que se esté trabajando y de los supuestos correspondientes a la población y al tamaño de la muestra. Cuando se realizan los cálculos siempre se supone que la hipótesis nula (H0) es cierta.

El cuarto paso es establecer la regla de decisión, la cual depende de la distribución de probabilidad de la estadística a probar, del nivel de significancia ([pic]) y de la hipótesis alternativa (H1).

Finalmente se toma la decisión de no rechazar la hipótesis nula o rechazarla.

3.2. PRUEBA DE HIPOTESIS PARA VARIANZAS

Es frecuente que se desee comprobar si la variación o dispersión de una variable ha tenido alguna modificación, lo cual se hace con la prueba de hipótesis para la varianza.

3.2.1 Hipótesis

Se puede plantear uno de los siguientes tres tipos de hipótesis:

- Prueba de hipótesis a dos colas

H0 : [pic]= k

H1 : [pic][pic]k

- Prueba de hipótesis a una cola superior

H0 : [pic]= k ó H0 : [pic][pic]k

H1 : [pic]> k ó H1 : [pic]> k

- Prueba de hipótesis a una cola inferior

H0 : [pic]= k ó H1 : [pic][pic]k

H1 : [pic]< k ó H1 : [pic]< k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin corregir o corregida.

• Si se utiliza la varianza sin corregir ([pic] ) la estadística de trabajo es la expresión:

[pic](varianza sin corregir)

• Si se utiliza la varianza corregida, la estadística de trabajo es la expresión:

[pic](varianza corregida)

3.2.2 Regla de Decisión

3.2.2.1 Si se ha planteado la hipótesis alternativa como:

H1 : [pic][pic]k se tiene una prueba de hipótesis a dos colas, por lo tanto, el nivel de significancia ( [pic]) se divide en dos partes iguales, quedando estos valores en los extremos de la distribución como se aprecia en la figura siguiente:

[pic]

Regla de decisión para una prueba de hipótesis a dos colas

[pic]y [pic]pertenecen a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) está entre [pic]y [pic]no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si [pic]< T < [pic]no se rechaza H0.

3.2.2.2 Si se ha planteado la hipótesis alternativa como:

H1 : [pic]> k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de significancia ( [pic]) en la parte superior de la distribución, véase la siguiente figura

[pic]

Regla de decisión para una prueba de hipótesis a una cola superior

Z1-[pic] pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es menor que [pic]no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T < [pic]no se rechaza H0 .

3.2.2.3 Si se ha planteado la hipótesis alternativa como:

H1 : [pic]< k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de significancia ( [pic]) en la parte inferior de la distribución, véase esta figura

[pic]

Regla de decisión para una prueba de hipótesis a una cola inferior

Z[pic] pertenece a una distribución X2 con (n-1) grado de libertad. Si el valor de la estadística de trabajo (T) es mayor que Z[pic] no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si T >Z[pic] no se rechaza H0.

3.2.3 Aplicación práctica

3.2.3.1 Ejercicio 1

Un fabricante de varillas esta produciendo varillas de 8 mm de diámetro, y que los diámetros de estas piezas se distribuyen normalmente. Con propósitos de control de calidad, se obtuvo una muestra de 25 varillas de una línea de producción para estimar la varianza de todos los diámetros, la cual resultó ser S2 = 0.009 mm2. Con un nivel de significancia de 0.05. ¿Se puede concluir que la varianza poblacional es igual o menor 0.01 mm2?

Solución

Si:

n =25

S2 = 0.009 mm2

( = .05

Entonces:

Ho: [pic] .01

Ha: [pic]

[pic]

[pic] como la [pic] esta bajo la hipótesis nula entonces tenemos

[pic] = 21.6

Como 21.6 es menor que 36.415 no se rechaza la hipótesis nula con un nivel de significancia de 0.05.

Existe evidencia estadística para decir que la varianza poblacional es igual o menor 0.01 mm2.

[pic] g.l =24

36.415

Nivel de significancia = 0.05

Zona de Rechazo = { [pic]> 36.415)

3.2.3.2 Ejercicio 2

Se supone que los diámetros de cierta marca de válvulas están distribuidos normalmente con una varianza poblacional de 0,2 pulgadas, pero se cree que últimamente ha aumentado. Se toma una muestra aleatoria de válvulas a las que se les mide su diámetro, obteniéndose los siguientes resultados en pulgadas:

5,5 5,4 5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7

Con ésta información pruebe si lo que se cree es cierto.

Solución

Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:

H0 : [pic]= 0,2

H1 : [pic]> 0,2

Para realizar esta prueba de hipótesis se utiliza la expresión “varianza sin corregir”

[pic]

Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribución chi-cuadrado con 9 grados de libertad, se obtiene un valor para Z de 16,919. Como puede observarse en la figura siguiente, el valor de la estadística de trabajo se ubica en la zona de no rechazo de la hipótesis nula, por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que la varianza poblacional no ha aumentado.

[pic]

Regla de decisión para una prueba de hipótesis a una cola superior

Unidad IV

Bibliografía

Análisis de la Varianza. Enviado por Hereas (11:54 a.m, 25 nov 2009). Disponible en: http://apuntes.rincondelvago.com/analisis-de-la-varianza_1.html

Estadística Descriptiva, Análisis de la Varianza. (09:50 a.m, 22 nov 2009). Disponible en: http://www.elosiodelosantos.com/sergiman/andeva.htm

Estadística II. Hermelinda Ordóñez Pinzón. Facultad de Ciencias Exactas y Naturales, Departamento de Matemáticas y Estadística. Sede Manizales, Universidad Nacional de Colombia. Disponible en: http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/index.html

Ing. Lagarde, Alfredo Rojas. Dr. Canzian, Adrián. Fundamentos de la Probabilidad y Estadística. Ciudad Autónoma de Buenos Aires, Argentina: edUTecNe [Editorial Universitaria de la U.T.N.].

Prueba Hipótesis Para Media Con Varianza Conocida Y Desconocida (13 de noviembre, 2009). Disponible en: http://www.mitecnologico.com/Main/PruebaHipotesisParaMediaConVarianzaConocidaYDesconocida

Romero, R. Zúnica, L. Métodos Estadísticos en Ingeniería. Valencia: Editorial de la Universidad Politécnica de Valencia.

Spiegel, Murray, R. ESTADISTICA. Editorial: McGraw-Hill. ISBN 970104231X.

Teorema del Límite Central. Wikipedia, la enciclopedia libre (05:48, 5 nov 2009). Disponible en: http://es.wikipedia.org/wiki/Teorema_del_l%C3%ADmite_central

V. Abraira, A. Pérez de Vargas, Métodos Multivariantes en Bioestadística. Ed. Centro de Estudios Ramón Areces. 1996.