PRUEBA CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA
Enviado por manuel234 • 10 de Junio de 2015 • Tesina • 3.416 Palabras (14 Páginas) • 381 Visitas
PRUEBA CHI-CUADRADA Y ESTADISTICA NO PARAMETRICA
Ensayo de hipóstesis.
Prueba chi-cuadrada para la bondad de ajuste.
Tablas de contingencia.
Tablas de contingencia para probar homogeneidad.
Estadística no paramétrica.
Prueba del signo.
Prueba del signo para muestras pareadas.
Prueba del rango con signa de Wilcoxon.
Dos muestras con observaciones pareadas.
Aproximación normal para muestras grandes.
Ejercicios propuestos.
Unidad III
TEORIA DE PEQUEÑAS MUESTRAS O TEORIA EXACTA DEL MUESTREO
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía
utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales
a 30 ó en muestras más pequeñas si la distribución o las distribuciones de
donde proviene la muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la
distribución de donde proviene la muestra tenga un comportamiento normal.
Esta es una condición para utilizar las tres distribuciones que se manejarán en
esta unidad; t de student, X2
ji-cuadrada y Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del
muestreo, ya que también la podemos utilizar con muestras aleatorias de
tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las
tres distribuciones mencionadas. Este concepto es “grados de libertad”.
Para definir grados de libertad se hará referencia a la varianza muestral:
( )
1
1
2
2
-
-
=
å=
n
x x
s
n
i
i
Esta fórmula está basada en n-1 grados de libertad (degrees of freedom). Esta
terminología resulta del hecho de que si bien s2
está basada en n cantidades
,
1
x - x ,
2
x - x . . . , x x,
n - éstas suman cero, así que especificar los valores de
cualquier n-1 de las cantidades determina el valor restante. Por ejemplo, si n=4 y
x1 - x = 8; x2 - x = -6 y x4 - x = -4 , entonces automáticamente tenemos
x3 - x = 2 , así que sólo tres de los cuatro valores de x x i - están libremente
determinamos 3 grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n-1 y su
simbología n = nu.
DISTRIBUCION “t DE STUDENT”
Supóngase que se toma una muestra de una población normal con media m y
varianza s
2
. Si x es el promedio de las n observaciones que contiene la muestra
aleatoria, entonces la distribución
n
x
z
s
- m
= es una distribución normal estándar.
Supóngase que la varianza de la población s
2
es desconocida. ¿Qué sucede con
la distribución de esta estadística si se reemplaza s por s? La distribución t
proporciona la respuesta a esta pregunta.
La media y la varianza de la distribución t son m = 0 y ( 2)
2 s = u u - para n>2,
respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia
general de la distribución t es similar a la de la distribución normal estándar:
ambas son simétricas y unimodales, y el valor máximo de la ordenada se
alcanza en la media m = 0. Sin embargo, la distribución t tiene colas más amplias
que la normal; esto es, la probabilidad de las colas es mayor que en la
distribución normal. A medida que el número de grados de libertad tiende a
infinito, la forma límite de la distribución t es la distribución normal estándar.
Propiedades de las distribuciones t
1. Cada curva t tiene forma de campana con centro en 0.
2. Cada curva t, está más dispersa que la curva normal estándar z.
3. A medida que n aumenta, la dispersión de la curva t correspondiente
disminuye.
4. A medida que n® ¥, la secuencia de curvas t se aproxima a la curva normal
estándar, por lo que la curva z recibe a veces el nombre de curva t con gl = ¥
La distribución de la variable aleatoria t está dada por:
[( ) ]
( )
( )
1 , .
/ 2
1 / 2
( )
1 / 2
2
-¥ < < ¥ ÷
÷
ø
ö
ç
ç
è
æ
+
G
G +
=
- +
t
t
h t
n
n pu n
n
Esta se conoce como la distribución t con n grados de libertad.
Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas normales
con media m y desviación estándar s. Entonces la variable aleatoria
n
s
x
t
- m
=
tiene una distribución t con n = n-1 grados de libertad.
0
n = ¥ Curva z
n = 10
n = 1
La distribución de probabilidad de t se publicó por primera vez en 1908 en un
artículo de W. S. Gosset. En esa época, Gosset era empleado de una cervecería
irlandesa que desaprobaba la publicación de investigaciones de sus empleados.
Para evadir esta prohibición, publicó su trabajo en secreto bajo el nombre de
“Student”. En consecuencia, la distribución t normalmente se llama distribución t
de Student, o simplemente distribución t. Para derivar la ecuación de esta
distribución, Gosset supone que las muestras se seleccionan de una población
normal. Aunque esto parecería una suposición muy restrictiva, se puede mostrar
que las poblaciones no normales que poseen distribuciones en forma casi de
campana aún proporcionan valores de t que se aproximan muy de cerca a la
distribución t.
La distribución t difiere de la de Z en que la varianza de t depende del tamaño de
la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la
muestra tiende a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con ta el valor t por arriba del cual se encuentra un
área igual a a. Como la distribución t es simétrica alrededor de una media de
cero, tenemos t1-a = -ta; es decir, el valor t que deja un área de 1-a a la derecha
y por tanto un área de a a la izquierda, es igual al valor t negativo que deja un
área de a en la cola derecha de la distribución. Esto es, t0.95
...