Estadistica No Parametrica
Enviado por fury • 7 de Marzo de 2012 • 4.170 Palabras (17 Páginas) • 932 Visitas
Estadística no paramétrica
Matemáticas. Probabilísticas. Población. Muestra. Hipótesis de contraste. Nula. Varianza. Descriptiva. Inferencial. Campana de Gaus. Covarianza
¿Porqué los administradores deben tener conocimientos sobre estadística no paramétrica?
La respuesta a esta pregunta es muy sencilla; las pruebas de ji cuadrada son pruebas no paramétricas. Tanto la prueba de la tabla de contingencia como la de bondad de ajuste analizan datos nominales u ordinales. Estas pruebas, se usan ampliamente en las aplicaciones de negocios, lo que demuestra la importancia de la habilidad para manejar datos categóricos o jerarquizados además de los cuantitativos.
Existen otras muchas pruebas estadísticas diseñadas para situaciones en las que no se cumplen las suposiciones críticas o que involucran datos cuantitativos o categóricos. Los analistas que manejan estos datos deben familiarizarse con libros que abordan tales pruebas, conocidas comúnmente como pruebas estadísticas no paramétricas. Se presentarán aquí unas cuantas de las pruebas no paramétricas que mas se usan.
¿Qué ocurre con las pruebas no paramétricas frente a las que si lo son?
Las pruebas no paramétricas nonecesitan suposiciones respecto a la composición de los datos poblacionales. Las pruebas no paramétricas son de uso común:
1.- Cuando no se cumplen las suposiciones requeridas por otras técnicas usadas, por lo general llamadas pruebas paramétricas.
2.- Cuando es necesario usar un tamaño de muestra pequeño y no es posible verificar que se cumplan ciertas suposiciones clave.
3.- Cuando se necesita convertir datos cualitativos a información útil para la toma de decisiones.
Existen muchos casos en los que se recogen datos medidos en una escala nominal u ordinal. Muchas aplicaciones de negocios involucran opiniones o sentimientos y esos datos se usan de manera cualitativa.
Las pruebas no paramétricas tienen varias ventajas sobre las pruebas paramétricas:
1.- Por lo general, son fáciles de usar y entender.
2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas paramétricas.
3.- Se pueden usar con muestras pequeñas.
4.- Se pueden usar con datos cualitativos.
También las pruebas no paramétricas tienen desventajas:
1.- A veces, ignoran, desperdician o pierden información.
2.- No son tan eficientes como las paramétricas.
3.- Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa (incurriendo en un error de tipo II).
Las pruebas no paramétricas son pruebas estadísticas que no hacen suposiciones sobre la constitución de los datos de la población.
Por lo general, las pruebas paramétricas son mas poderosas que las pruebas no paramétricas y deben usarse siempre que sea posible. Es importante observar, que aunque las pruebas no paramétricas no hacen suposiciones sobre la distribución de la población que se muestrea, muchas veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada.
EL CONTRASTE DE SIGNOS
La prueba de los signos es quizá la prueba no paramétrica mas antigua. En ella está, basadas muchas otras. Se utiliza para contrastar hipótesis sobre el parámetro de centralización y es usado fundamentalmente en el análisis de comparación de datos pareados. Consideremos una muestra aleatoria de tamaño n tal que sus observaciones estén o puedan estar clasificadas en dos categorías: 0 y 1, + y -, ... etc.
Podemos establecer hipótesis acerca de la mediana, los centiles, cuartiles, etc. Sabemos que la mediana deja por encima de sí tantos valores como por debajo; Considerando que Xi - Mdn > 0 , darán signos positivos (+) y Xi - Mdn < 0 signos negativos (-) , en la población original tendremos tantos (+) como (-). Se tratara de ver hasta que punto el numero de signos (+) esta dentro de lo que cabe esperar que ocurra por azar si el valor propuesto como mediana es verdadero. Lo mismo se puede decir respecto a los cuartiles, centiles, o deciles.
Teniendo en cuenta que se trabaja con dos clases de valores, los que están por encima y los que están por debajo, es decir, los (+) y los (-) , los estadísiticos de contraste seguirán la distribución binomial, si se supone independencia y constancia de probabilidad en el muestreo.
La mejor forma de entender este apartado es mediante un ejemplo practico; De modo que en la tabla que pondremos a continuación se pueden ver los resultados de un experimento sobre comparación de sabores. Un fabricante de alubias esta considerando una nueva receta para la salsa utilizada en su producto. Eligio una muestra aleatoria de ocho individuos y a cada uno de ellos le pedio que valorara en una escala de 1 a 10 el sabor del producto original y el nuevo producto. Los resultados se muestran en la tabla, donde también aparecen las diferencias en las valoraciones para cada sabor y los signos de estas diferencias. Es decir, tendremos un signo + cuando el producto preferido sea el original, un signo - cuando el preferido sea el nuevo producto y un 0 si los dos productos son valorados por igual. En particular en este experimento, dos individuos han preferido el producto original y cinco el nuevo; Uno los valoro con la misma puntuación.
La hipótesis nula es que ninguno de los dos productos es preferido sobre el otro. Comparamos las valoraciones que indican la preferencia por cada producto, descartando aquellos casos en los que los dos productos fueron valorados con la misma puntuación. Así el tamaño muestral efectivo se reduce a siete, y la única información muestral en que se basara nuestro contraste será la de los dos individuos de los siete que prefirieron el producto original.
La hipótesis nula puede ser vista como aquella en la que la media poblacional de las diferencias sea 0. Si esta hipótesis fuese cierta, nuestra sucesión de diferencias + y - podría ser considerada como una muestra aleatoria de una población en la que las probabilidades de + y - fueran cada una 0,5. En este caso, las observaciones constituirían una muestra aleatoria de una población con una distribución binomial, con probabilidad de + 0,5. Es decir, si p representa la verdadera proporción en la población de +,la hipótesis nula será:
H0: p = 0,5
Podemos querer contrastar esta hipótesis bien frente alternativas unilaterales, bien frente a alternativas bilaterales. Supongamos que en el ejemplo de preferencias por los sabores la hipótesis alternativa es que en la población, la mayoría de las preferencias son por el nuevo producto. Esta alternativa se expresa como:
H1: p < 0,5
Tabla:
INDIVIDUO VALORACION DIFERENCIA SIGNO DE LA DIFERENCIA
PRODUCTO ORIGINAL PRODUCTO NUEVO
A 6 8 -2 -
...