ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

IMPUTACIÓN POR REGRESIÓN


Enviado por   •  20 de Diciembre de 2014  •  Síntesis  •  598 Palabras (3 Páginas)  •  241 Visitas

Página 1 de 3

Ventajas y desventajas:

Las ventajas de imputar son que logramos obtener un conjunto de datos completo sin datos faltantes, se puede reducir el sesgo debido a la no respuesta y la imputación opera sobre los datos, de forma que los resultados obtenidos por los diferentes análisis son mutuamente consistentes.

Por otra parte, la imputación también tiene desventajas ya que hay que tener en cuenta que el futuro análisis no distingue entre las imputaciones y los datos reales. Además los valores imputados pueden ser buenas estimaciones pero no son datos reales y no podemos asegurar una mejora en el sesgo respecto del sistema de datos incompletos. Al fin y al cabo la imputación es un procedimiento de generar datos. Si el método de imputación no es el adecuado, posiblemente aumente el sesgo y sobreestime la varianza, obteniendo datos imputados inconsistentes produciendo una base de datos no confiables, llevando a la interpretación errónea de los resultados por parte de los usuarios.

IMPUTACIÓN POR REGRESIÓN

Es un método propuesto por primera vez por Buck (1960), la idea básica de esta metodología es utilizar la información de las variables con información completa para reemplazar las faltantes, empleando modelos de regresión para imputar la información.

Los valores faltantes se sustituyen por valores predictivos obtenidos a partir de una regresión entre un conjunto de variables predicto

ras X y un conjunto de variables explicativas Y.

Si bien es cierto que esta metodología resultó ser mejor que la imputación por medias, ocasiona resultados inversos a ésta, mientras que el anterior método atenúa las correlaciones entre variables; el método de imputación por regresión obtiene correlaciones altas casi perfecta en el caso de correlacionar los valores predictivos y el subconjunto imputado pronosticado, es decir sobrestima las correlaciones aun cuando la data es considerada MCAR.

Otra de las desventajas que posee este método es que los valores imputados se ajustarán directamente en la recta de regresión produciendo con esto poca variabilidad y por tanto atenuando la varianza o covarianza.

DIFERENTES TIPOS DE TÉCNICAS DE IMPUTACIÓN

Varios estudios (Goicoechea, 2002; Platek 1986; y Government Statistical Service 1996), indican que las técnicas de imputación se pueden clasificar de la siguiente manera:

Técnicas determinísticas: cuando al repetir la imputación en varias unidades bajo las mismas condiciones, producirá las mismas respuestas.

a) Imputación de la media o modo: se llena el vacío del dato faltante de cada variable con la media de los registros no faltantes en caso de variables cuantitativas, o con la moda en caso de variables cualitativas. Tiene como desventaja la modificación de la distribución de la variable haciéndose más estrecha ya que

...

Descargar como (para miembros actualizados) txt (4 Kb)
Leer 2 páginas más »
Disponible sólo en Clubensayos.com