Búsquedas De Información
Enviado por carmelalmo • 26 de Septiembre de 2011 • 2.298 Palabras (10 Páginas) • 763 Visitas
BÚSQUEDA Y RECUPERACIÓN DE INFORMACIÓN
La recuperación de información es el siguiente paso a la determinación de las necesidades de información. Se puede recuperar a través de diferentes herramientas: bases de datos, Internet, tesauros, ontologías, mapas... Conocer y manejar estas herramientas contribuye a una recuperación de calidad.
Recuperación de información
• Concepto de sistema de recuperación de información
• Componentes esenciales
Herramientas
• Bases de datos
• Internet
• Lenguajes de indización y control terminológico
o Índices
o Palabras clave
o Tesauros
• Lenguajes de interrogación y ecuaciones de búsqueda
• Ecuaciones simples
• Ecuaciones compuestas
• Operadores
Navegación versus Recuperación de Información
• Concepto
• Diferencias
• Directorios versus Motores de búsqueda
• Metadatos
Técnicas de recuperación de información
Calidad de la recuperación
Habilidades y Competencias
Dossier electrónico
Recuperación de información
El proceso de recuperación se lleva a cabo mediante consultas a la base de datos donde se almacena la información estructurada, mediante un lenguaje de interrogación adecuado. Es necesario tener en cuenta los elementos clave que permiten hacer la búsqueda, determinando un mayor grado de pertinencia y precisión, como son: los índices, palabras clave, tesauros y los fenómenos que se pueden dar en el proceso como son el ruido y silencio documental. Uno de los problemas que surgen en la búsqueda de información es si lo que recuperamos es "mucho o poco" es decir, dependiendo del tipo de búsqueda se pueden recuperar multitud de documentos o simplemente un número muy reducido. A este fenómeno se denomina Silencio o Ruido documental.
o Silencio documental: Son aquellos documentos almacenados en la base de datos pero que no han sido recuperados, debido a que la estrategia de búsqueda ha sido demasiado específica o que las palabras clave utilizadas no son las adecuadas para definir la búsqueda.
o Ruido documental: Son aquellos documentos recuperados por el sistema pero que no son relevantes. Esto suele ocurrir cuando la estrategia de búsqueda se ha definido demasiado genérica.
• Concepto de sistema de recuperación de información
Proceso donde se accede a una información previamente almacenada, mediante herramientas informáticas que permiten establecer ecuaciones de búsqueda específicas. Dicha información ha debido de ser estructura previamente a su almacenamiento.
• Componentes esenciales
Documentos estructurados. Es necesario establecer un proceso donde se establezcan herramientas de indización y control terminológico.
Bases de datos donde estén almacenados los documentos. Definir lenguajes de interrogación y operadores que soportará la base de datos y, establecer que tipo de ecuaciones serán permitidas.
Herramientas
• Bases de datos
• Internet
o Revistas electrónicas
o Buscadores. Los buscadores son herramientas que permiten localizar y recuperar la información almacenada en internet. El funcionamiento es parecido a las bases de datos, almacenan las páginas con determinadas características (metadatos) y que posteriormente tras utilizar unas palabras clave emiten un listado de las más relevantes.
Buscadores generales
o Directorios. Los directorios son listas organizadas que nos permite acceder a la información de forma estructurada y jerárquica. Se clasifican en categorías y el usuario enlaza de lo más general a lo más específico
Recomendados para las búsquedas en las que el usuario no sabe mucho sobre el tema en concreto
Directorio y motores especializados
o Metabuscadores.
Son buscadores, con la cualidad de que no sólo buscan en una única base de datos, sino que al introducir los conceptos de búsqueda hace el barrido en distintas bases de datos, de esta forma la amplitud de resultados es mayor.
o Buscadores selectivos.
Utilizan una base de datos especializada en una materia.
o Programa para buscar
o Agentes inteligentes
Los agentes inteligentes son herramientas que permiten localizar información de forma automática, sólo necesita que se le definan un perfil de búsqueda y donde debe lanzarla (bases de datos, sitios web, etc.) y, automáticamente va presentando un informe sobre la nueva información que va surgiendo.
• Lenguajes de indización y control terminológico
o Índices.
Listado de términos normalizados que representan el contenido de un recurso. Algunos tipos son:
Índice de materias: términos ordenados según las materias que trata la base de datos, el buscador, etc.
Índice alfabético: listado de términos alfabéticamente
Índice KWIC: Tipo de índice permutado en el que el contenido temático de una obra se representa mediante palabras clave de su título o de otra fuente de información del documento.
Índice KWOC: Tipo de índice permutado que varía en su presentación respecto al índice KWIC, en que las palabras clave aparecen como un encabezamiento en línea separada. Bajo cada encabezamiento aparece la totalidad de los títulos, completos o truncados, que contienen la palabra clave de que se trata.
o Palabras clave (Keywords).
Término significativo en lenguaje natural que representa el contenido del documento.
En la búsqueda de información esta opción es esencial ya que nos permite acotar y precisar información. El problema recae en definir la palabra exacta que representa el contenido, por ello es conveniente utilizar especificadores. Por ejemplo si utilizamos la palabra flor en cualquier buscador podemos estar buscando, la floristería más cercana, una imagen de flores o un estudio sobre las flores en las distintas estaciones del año.
Meta Keywords. La mayoría de los buscadores utilizan para localizar los recursos, las palabras clave de cada pagina web. Por esta razón es esencial que cada pagina tenga una etiqueta donde se incluyan las palabras clave que la definen, también es importante la definición exacta de cada una de ella pues es a partir de estas los buscadores localizan o no un recurso.
o Tesauros
Es un listado terminológico controlado sobre un área o ámbito de conocimiento que mantiene entre sí relaciones semánticas
...