PRUEBA DE HIPOTESIS PARAMETRICAS
eidan66312 de Agosto de 2011
3.680 Palabras (15 Páginas)1.593 Visitas
UNIDADES TECNOLOGICAS DE SANTANDER
APUNTES DEL DOCENTE No. 6
PRUEBAS DE HIPOTESIS
Fecha:Nov. 2010
PRUEBA DE HIPOTESIS PARAMETRICAS
Objetivo: comprobar un supuesto que se hace sobre un parámetro poblacional. Las pruebas de hipotesis paramétricas: suponen una serie de aspectos acerca de la naturaleza de la población de la que se extrajo la muestra de estudio.
Una hipótesis es el enunciado acerca de una población elaborada con el propósito de ponerse a prueba.
Ej. El 45.5 % de los estudiantes de comunicación, fuma.
Prueba de hipótesis: procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es razonable y no debe rechazarse o si no es razonable y debe ser rechazada.
Una prueba de hipótesis estadística es una conjetura de una o más poblaciones. Nunca se sabe con absoluta certeza la verdad o falsedad de una hipótesis estadística, a no ser que se examine la población entera. En la mayoría de las situaciones, se toma una muestra aleatoria de la población de interés y se utilizan sus datos para proporcionar evidencia que confirme o no la hipótesis.
Hacia fines de la década de los 20 y principios de la de los 30 Egon Pearson (1895-1980), hijo de Karl, y Jerzy Neyman (1894-1980) afirmaron que las pruebas de hipótesis no tendrían sentido si no hubiera, al menos, dos hipótesis posibles que llamaron: hipótesis nula (la de Fisher) y la hipótesis alternativa. Esto es la conocida teoría de pruebas de hipótesis (hypothesis testing) de Neyman- Pearson, quienes llamaron hipótesis nula a la hipótesis a contrastar.
Supuestos para las pruebas Paramétricas
1. Las población origen de la v.a. se distribuye como una normal. La distribución de Ho nula puede ser una distribución paramétrica conocida exactamente, una distribución que es aproximada por una distribución paramétrica conocida, o una distribución empírica obtenida por remuestreo de los datos.
Se puede probar este tipo de distribución haciendo una gráfica o haciendo una prueba estadística
– Prueba estadística
- One sample Kolmogorov – Smirnov Test
- Gráfica de frecuencia de datos
- Verificar si hay un solo pico y si la curva es Simétrica.
Puede suponerse que la distribución de muestreo es normal ya sea porque la población es normal o porque la muestra es suficientemente grande para apelar al teorema central del límite.
Hipótesis nula H0: afirmación acerca del valor de un parámetro poblacional. Dice que no hay una causa específica de lo que se observa. Son eventos al azar.
Hipótesis alterna (H1 Ha): afirmación que se aceptará si los datos muestrales proporcionan evidencia de que la hipótesis nula es falsa. Es la hipótesis de investigación.
Métodos para pruebas de hipótesis paramétricas
1. clásico
Se basa en el nivel de significancia (α )
Nivel de significancia: probabilidad de cometer error I, rechazar la hipótesis nula cuando es verdadera. Area de la Región que contiene todos los valores posibles donde la hipótesis nula es rechazada.
Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva delimitada por el valor Zα o de la curva tα,v donde se rechaza Ho.
Tipos de regiones de rechazo en las pruebas paramétricas
La región puede ser de una cola o de dos dependiendo del sentido de la hipótesis alterna.
Bilaterales Ha: µ≠ µ 0
Unilaterales:
Cola derecha Ha : µ> µ 0
Cola izquierda Ha: µ < µ 0
Error Tipo I: rechazar la hipótesis nula cuando en realidad es verdadera.
Error Tipo II: aceptar la hipótesis nula cuando en realidad es falsa. β = P( No rechazar Ho | Ho es falsa).
La prueba rechaza la hipótesis nula La prueba acepta la hipótesis nula
La hipótesis nula realmente es cierta Error tipo I
(FALSO POSITIVO) No hay error
La hipótesis nula realmente es falsa No hay error Error tipo II
(FALSO NEGATIVO)
Estadístico de prueba: valor obtenido a partir de la información muestral, se utiliza para determinar si se rechaza o no la hipótesis. La distribución probabilística de la prueba estadística se realiza sobre la base que la hipótesis nula es cierta.
Valor crítico: el punto que divide la región de aceptación y la región de rechazo de la hipótesis nula.
La prueba de hipótesis guarda analogía con un juicio penal. En éste, se parte del supuesto de que el acusado es inocente. La hipótesis nula es de inocencia. Lo contrario de la hipótesis nula es la hipótesis alternativa la cual expresa una creencia de culpabilidad, Por consiguiente, las hipótesis en un juicio criminal se escribirían:
Ho: El acusado es inocente
Ha: El acusado es culpable
Supongamos que determinado modelo de automóvil actualmente tiene un rendimiento promedio de 12 kilómetros por litro. Un grupo de investigación de producto ha inventado un nuevo carburador, diseñado para aumentar el rendimiento. Para evaluar el nuevo carburador se fabricarán varios de ellos y se someterán a pruebas de manejo controladas. Observe que el grupo de investigación de producto busca pruebas para decir que el nuevo carburador aumenta el rendimiento de los kilómetros por litro. En este caso, la hipótesis de investigación es que el nuevo carburador proporcionará una media del rendimiento mayor a los 12 kilómetros por litro, es decir que µ>12.
Como lineamiento general, una hipótesis de investigación como ésta debe formularse y proponerse como hipótesis alternativa. Por consiguiente:
Ho: µ ≤ 12 sigue igual
Ha: µ >12 aumenta rendimiento
En resumen las características de la hipótesis nula Ho:
1. Se va a considerar como cierta hasta que se tenga suficiente evidencia de lo contrario.
2. SIEMPRE incluye el signo de igualdad.
3. Es la base para el análisis estadístico de la prueba.
Características de la hipótesis alternativa:
1. Es lo contrario a la hipótesis nula ( , <, >).
2. En general esta hipótesis se establece en términos de lo que se investiga o desea saber buscando evidencia.
3. Es la que define la dirección de la zona de rechazo para Ho.
2. Método del P value
Es el nivel más pequeño de significancia con en el que se puede rechazar Ho cuando es verdadera” (cometer error tipo I) (LEVINE, KREHBIEL, & BERENSON, 2006).
Es la probabilidad que permite declarar la significancia de una prueba. Según Salsburg “El término significancia (significant) en los primeros desarrollos de esta idea se usaba para indicar que la probabilidad es suficientemente pequeña como para rechazar la hipótesis planteada
El valor p es la probabilidad de obtener un estadístico de prueba igual o más extremo que el resultado obtenido a partir de los datos muestrales, dado que la hipótesis Ho SEA VERDADERA”
Se puede definir tambien como el menor nivel de significancia al que se puede rechazar una hipótesis nula”.
Partiendo de la premisa que Ho es cierta, el investigador puede tomar la decisión de rechazar o no la hipótesis nula Ho examinando si valores tan extremos de como el observado, ocurren con una probabilidad muy pequeña. Si la hipótesis nula se presume cierta, mientras más pequeña sea esa probabilidad, más raro debe ser el obtener valores de como el obtenido y más sólida será la evidencia para rechazar la hipótesis nula.
Cálculo p value:
1) Ha: m>mk P value = P(Z>Zc)
2) Ha:m<mk p value = P(Z<Zc)
3) Ha:m≠mk p value = 2P(Z>│Zc│)
Procedimiento general en Pruebas de hipótesis
PRUEBA DE HIPOTESIS PARA LA MEDIA µ
Procedimiento general:
REGION DE RECHAZO de Ho
Está delimitada por el valor de Zα; ó ± Zα/2 ; t α dependiendo si la prueba es bilateral ó unilateral y la región se toma a partir de este límite según el sentido de la prueba dado por Ha.
Ejemplo 1 Suponga que se está interesado en determinar si hay evidencia que el aumento del peso promedio de unos animales a los dos meses de aplicar una determinada dieta es de 20Kg. Se conoce que el aumento de peso sigue una distribución normal con varianza σ2 =4 kg.
Paso 1. Plantear. Ho: µ = 20 Ha: µ ≠ 20
Paso 2. Seleccionar el nivel de significancia o probabilidad de cometer un error Tipo I en esta prueba sería α =0.05 Se tomará una muestra de n=10 animales. Los datos son:
16.5 16.4 18.5 19.5 20.2 21.0 18.5 19.3 19.8 20.3
= 19
Paso 3 Seleccionar estadístico de prueba. Puesto que se conoce la varianza poblacional, la prueba estadística a utilizar es la prueba Z:
Paso 4.
Los valores críticos se busca en la tabla de distribución normal estándar, el valor de Z para un área de 0.025, el valor obtenido es Z1= -1.96, , luego la regla de decisión para la hipótesis será aceptar Ho si Zcalculado está dentro de la región (-1.96< Zc< 1.96)
el valor de la estadística de prueba Zc está dado por:
...