Estadistica Parametrica
Enviado por • 7 de Septiembre de 2012 • 2.680 Palabras (11 Páginas) • 760 Visitas
ESTADÍSTICA NO PARAMÉTRICA
Una característica común de las técnicas que se han visto hasta el momento es que en todas ellas se ha supuesto una función de probabilidades para las variables aleatorias que integran la muestra. Más aún, es muy común que el modelo probabilístico que se adopta sea el Normal. En muchos casos este supuesto se justifica, mientras que en otros casos es absurdo. Las técnicas de la Estadística no Paramétrica se caracterizan porque su aplicación no depende de un modelo probabilístico específico, sino que son válidas bajo condiciones distribucionales muy amplias. La estadística en donde las técnicas dependen de un modelo probabilístico específico se llama Estadística Paramétrica.
Otro aspecto de las técnicas de la Estadística Paramétrica es que invariablemente hacen uso de la media y de la varianza muestrales. Esto puede ser una limitación muy severa ya que el cálculo de la media y de la varianza requiere realizar operaciones aritméticas tales como la suma y el producto con elementos de la muestra. Sin embargo, en muchas ocasiones los datos que se obtienen no admiten la operación de suma ni mucho menos la de multiplicación.
Ejemplo 1. En una encuesta para estudiar el grado de religiosidad de una población se tomaron dos muestras, una de campesinos y otra de empleados. Las muestras son de tamaño 10 y 8 respectivamente. Medir la religiosidad de una persona es más complicado que medir su estatura, por lo que el investigador hace una serie de preguntas a cada entrevistado y de acuerdo con sus respuestas le asigna uno de los siguientes cinco grados de religiosidad en orden ascendente:
Fanático antireligioso J
Moderadamente opuesto a la religión O
Indiferente I
Moderadamente religioso R
Fanático religioso F
Las muestras obtenidas son: 1) Campesinos: R I,R,O,R,F,R,R,F,F y 2) Empleados: I,I,O,J,R,R,I,I.
Si se quieren analizar estos datos muestrales con las técnicas de la estadística paramétrica, se requiere calcular la media y la varianza muestrales y es claro que no tiene sentido la operación J+O, porque J y O no son números y además el supuesto de normalidad es absurdo, porque la normal es una variable aleatoria numérica contínua.
La prueba de Mann y Whitney
Esta técnica es muy útil para comparar dos poblaciones usando muestras independientes cuando la escala es ordinal. Es decir, se tienen muestras aleatorias de dos poblaciones cuyos elementos denotamos por:
Muestra población 1:
Muestra población 2:
Los supuestos necesarios para usar correctamente la prueba son los siguientes
1. Las muestras aleatorias y son independientes
2. La escala de medición es ordinal
Puesto que la escala es ordinal, se puede calcular la mediana de cada muestra, por lo tanto la hipótesis que puede plantearse involucra la mediana de las poblaciones que se desean comparar. Si X y Y son las variables aleatorias y y las medianas respectivas. De esta manera se tienen tres posibles juegos de hipótesis:
1. en oposición a
2. en oposición a
3. en oposición a
Para construir una estadística de prueba recordemos que la mediana es un parámetro de localización y que la única relación que puede establecerse entre observaciones de escala ordinal, es el ordenamiento por su magnitud. Si se ordenan las n+m observaciones de las dos muestras de acuerdo con su magnitud se pueden obtener muy diversos ordenamientos. Si entonces se espera que las observaciones de las dos muestras se encuentren más o menos uniformemente mezcladas. Si al colocar las n+m observaciones en orden ascendente se encuentra que los elementos de una muestra ocupan las posiciones superiores, es lógico pensar que la población de la que se extrajo esa muestra tiene su distribución de frecuencias concentrada en valores mayores que la otra población, o en términos de hipótesis que tiene una mayor mediana.
La figura 1 proporciona evidencia de que la población de campesinos está desplazada a la derecha de la de empleados en cuanto a su religiosidad.
La lógica de la prueba de Mann y Whitney está basada en el ordenamiento ejemplificado en la figura 1, resumiendo la información del ordenamiento gráfico en una estadística de prueba que pueda usarse para obtener reglas de decisión con niveles de significancia preestablecidos.
De acuerdo con lo anterior, se define el rango de una observación, como el lugar que le corresponde en el ordenamiento de todas las observaciones, por lo que una observación tiene más rango si es mayor que otra. Toda la información de la muestra se sintetiza en la suma de los rangos de los datos. Es decir, para la muestra se tienen los rangos y además la estadística . Es claro que un valor grande de apoya la hipótesis de que es mayor que y además, dada la naturaleza ordinal de las mediciones, toda la información pertinente sobre la mediana de X se encuentra en .
Ejemplo 2. Supóngase que se tienen muestras aleatorias de dos poblaciones cuyos modelos probabilísticos se identifican mediante los nombres de las variables X y Y. Las observaciones son:
X: 9, 8, 12, 7, 10, 15, 11, 19, 2, 23 ; n=10
Y: 0, 14, 6, 1, 20, 5, 3 ; m=7
La asignación de rangos se puede hacer con base en la siguiente tabla.
2
7
8
9
10
11
12
15
19
23 0
1
3
5
6
14
20
3
7
8
9
10
11
12
14
15
17 1
2
4
5
6
13
16
Obsérvese que y son variables aleatorias ya que dependen de valores aleatorios y contienen la información necesaria para probar hipótesis con respecto a las medianas de dos muestras independientes. De acuerdo con lo anterior Mann y Whitney en sus trabajos de investigación construyeron la siguiente
...