ANALISIS PARAMETRICO
Enviado por fallorf • 28 de Junio de 2013 • 1.714 Palabras (7 Páginas) • 423 Visitas
Regresión
La teoría clásica de la regresión se basa, en gran parte, en el supuesto que las observaciones son independientes y se encuentran idéntica y normalmente distribuidas. Si bien existen muchos fenómenos del mundo real que pueden modelarse de esta manera, para el tratamiento de ciertos problemas, la normalidad de los datos es insostenible. En el intento de eliminar esa restricción se diseñaron métodos que hacen un número mínimo de supuestos sobre los modelos que describen las observaciones.
La teoría de los métodos no paramétricos trata, esencialmente, el desarrollo de procedimientos de inferencia estadística, que no realizan una suposición explícita con respecto a la forma funcional de la distribución de probabilidad de las observaciones de la muestra. Si bien en la Estadística no paramétrica también aparecen modelos y parámetros, ellos están definidos de una manera más general que en su contrapartida paramétrica.
La regresión no paramétrica es una colección de técnicas para el ajuste de funciones de regresión cuando existe poco conocimiento a priori acerca de su forma. Proporciona funciones suavizadas de la relación y el procedimiento se denomina suavizado.
Los fundamentos de los métodos de suavizado son antiguos pero sólo lograron el estado actual de desarrollo gracias a los avances de la computación y los estudios por simulación han permitido evaluar sus comportamientos.
La técnica más simple de suavizado, los promedios móviles, fue la primera en usarse, sin embargo han surgido nuevas técnicas como la estimación mediante núcleos (“kernel”) o la regresión local ponderada. Estos estimadores de regresión no paramétrica son herramientas poderosas para el análisis de datos, tanto como una técnica de estimación para resumir una relación compleja que no puede ser aprehendida por un modelo paramétrico, como para suplementar (o complementar) un análisis de regresión paramétrico.
Regresión Lineal
El estudio consiste en tratar de encontrar con la mayor aproximación la ecuación de la recta a la que más se acercan todos los puntos para, a partir de ella, intentar deducir o inferir el comportamiento de los que no aparecen en la tabla.
Ejemplo 1:
La relación entre el número de años (x) laborando para la empresa y el número de ventas logradas (y) por cada vendedor es la mostrada en la siguiente tabla. a) ¿Cuántas ventas pueden esperarse en un trabajador con 16 años de servicio?; b) ¿Cuántos años, aproximadamente, se requieren para lograr 14 ventas?
Solución: Lo primero que debe encontrarse es la ecuación de regresión, es decir,la ecuación de la recta que con mayor fidelidad une a todos los puntos de la tabla anterior. Para darse una idea visual del trabajo que se va a realizar conviene graficar los puntos de esta tabla el diagrama de dispersión correspondiente
La 1ª columna encabezada con x; la 2ª columna encabezada con y; la 3ª columna encabezada con xy; y la 4ª columna encabezada con x2 de la siguiente manera:
De manera que utilizando la fórmula:
Obsérvese que como el denominador es el mismo para m como para b, no se hizo ya ninguna sustitución y solamente se copió el valor de m obtenido antes para ponerlo en este denominador.
La ecuación de la recta buscada es y= 0.698x+ 0.430
Esta ecuación sirve para poder contestar las dos preguntas formuladas en el enunciado del problema: ¿Cuántas ventas pueden esperarse en un trabajador con 16 años de servicio? ¿Cuántos años, aproximadamente, se requieren para lograr 14 ventas?
Como en la ecuación anterior x representa los años laborando e y las ventas, para la primera pregunta se tiene como dato que x = 16, de manera que sustituyéndolo en la ecuación de la recta, se obtiene:
y=mx+b
y=0.698(16)+0.430
y= 11.59
Es decir, se pueden esperar aproximadamente entre once y doce ventas de un trabajador con 16 años laborando.
Para la segunda pregunta, se tiene como dato que y = 14, o sea 14 ventas, de manera que sustituyendo en la ecuación de la recta, se obtiene:
y=mx+b
14 = 0.698x+ 0.430
14 − 0.430 = 0.698x
X = 13.57/0.698
x = 19.44
Significa que se requieren aproximadamente de diescinueve a veinte años de servicio para alcanzar 14 ventas. La figura muestra los resultados obtenidos.
Prueba T
La prueba "t" de Student es un tipo de estadística deductiva.
Se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos.
Con toda la estadística deductiva, asumimos que las variables dependientes tienen una distribución normal.
Especificamos el nivel de la probabilidad (nivel de la alfa, nivel de la significación, p) que estamos dispuestos a aceptar antes de que cerco datos (p < .05 es un valor común que se utiliza).
Notas sobre la prueba t de Student:
Cuando la diferencia entre dos promedios de la población se está investigando, se utiliza una prueba t. Es decir que se utiliza cuando deseamos comparar dos medias (las cuentas se deben medir en una escala de intervalo o de cociente).
Utilizaríamos una prueba t si deseamos comparar el logro de la lectura de hombres y de mujeres.
Con una prueba t, tenemos una variable independiente y una dependiente.
La variable independiente (género en este caso) puede solamente tener dos niveles (varón y hembra).
Si la independiente tuviera más de dos niveles, después utilizaríamos un análisis de la variación unidireccional (ANOVA).
La prueba estadística para t de Student es el valor t. Conceptualmente,
...