Ciencia Y Tecnologia
Enviado por danichida • 27 de Mayo de 2013 • 1.425 Palabras (6 Páginas) • 251 Visitas
4.1. BUSCADORES DE INFORMACIÓN.
Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido. Su uso facilita enormemente la obtención de un listado de páginas web que contienen información sobre el tema que nos interesa.
Los buscadores de información son procesos que le permiten al usuario tener la información adecuada que este solicita en el momento y es de manera muy rápida, su uso se basa en un sistema denominado araña que rastrea y localiza páginas web en los servidores de todo el mundo y con ellas forman su base de datos.
Con frecuencia se afirma que los usuarios podemos "navegar" por Internet para buscar información. En realidad deberíamos decir que la mayoría de las veces los usuarios solemos "naufragar" por Internet cuando buscamos información. Todos sabemos que en muchas ocasiones encontramos la información por casualidad, o debido al boca a boca. La búsqueda de información en la web, no es hoy algo resuelto y unificado. La propia web es un gigantesco volumen de información repartida por cientos de millones de páginas en la que no existen unos criterios unificados y coherentes para organizar tal volumen de información.
FUNCIONAMIENTO
Un buscador es una página web que ofrece algún sistema para encontrar las direcciones de otras páginas relativas a algún tema concreto. Los buscadores se componen básicamente de los siguientes elementos:
• 1. Una gran base de datos con direcciones de páginas web.
• 2. Un programa (agente, motor o araña) para encontrar las direcciones.
• 3. Un programa que gestiona la base de datos.
• 4. Una interface (la que utilizamos los usuarios) para buscar las páginas.
La base de datos está compuesta por millones de direcciones de páginas web. Cuando el usuario escribe una o varias palabras, el buscador consulta su base de datos y muestra las direcciones de las páginas que se relacionan con la palabra. Es evidente, que si una página no está indexada en la base de datos del buscador, jamás la podremos encontrar mediante ese buscador. Sólo accederan a esa página quien conozca la dirección. Esa página estará perdida en el anonimato, sin embargo tener una página indexada en la base de datos de un buscador no es garantía de que será encontrada por muchos usuarios. Recordemos que cuando realizamos una búsqueda por una o varias palabras recibimos como respuesta un listado de incluso decenas de millones de páginas que tienen alguna relación con el témino buscado (pruebe el usuario el término "música" en Google y vea la respuesta). Aparecer en las primeras direcciones de una búsqueda depende varios factores como la política interna del buscador o la "relevancia" o "Page Rank" (google) e incluso indexación mediante pago. Queda fuera de estos apuntes el "posicionamineto en buscadores", aunque el lector podrá encontrar en Internet información al respecto e incluso empresas dedicadas a posicionar en los buscadores...
La interface es lo que ve el usuario cuando accede a un buscador. La mayoría de los buscadores ofrecen dos metodos de búsqueda en su base de datos:
• 1. Palabra/s claves de búsqueda.
• 2. Indices o directorios temático.
El lector reconocerá fácilmente al buscador Google en la imagen de abajo. Es el método más eficaz y más utilizado: escribimos una o varias palabras clave y el buscador responderá con una lista de direcciones. Tiene el inconveniente de repuestas demasiado amplias y a veces poco relacionadas. Por ejemplo, si pretendo buscar el horario de visita a la Alhambra de Granada y sólo escribo la palabra "alhambra" obtendre la direcciones de "Cervezas Alhambra", "Autoescuela Alhambra", "Hotel Alhambra", etc. Existe una búsqueda avanzada que permite realizar búsquedas mas exatas y concisas...
BÚSQUEDA POR PALABRAS CLAVES (ROBOT DE BÚSQUEDA)
________________________________________
También podemos buscar páginas organizadas por temas en categorías (indices o directorios temáticos). Tiene el inconveniente de que hay que pulsar numerosas veces hasta llegar a la página buscada.
BÚSQUEDA POR TEMAS (DIRECTORIOS O ÍNDICES)
________________________________________
Una araña (robot de búsqueda o agente) es un programa que rastrea las páginas web para encontrar contenidos de cualquier tipo: direcciones de correo, enlaces a otras páginas, referencias a un producto, etc. Estos programas estan diseñados para recorrer la web siguiendo los enlaces que encuentran en la páginas. Los principales buscadores actuales siguen este sistema para encontrar las páginas que forman parte de sus bases de datos. Cuando una araña encuentra una página lee su contenido y lleva la información recopilada a un servidor central donde otro programa procesa la información y crea un índice con las palabras encontradas. Se tiene en cuenta las veces que aparece cada palabra en una página, así como el número total de palabras que contiene esa página, para crear un orden de relevancia. Algunas de las principales arañas que funcionan actualmente por Internet son:
• Google Bot (Google)
• Slurp (Yahoo)
• MSNBot (Microsoft)
• Scooter (Altavista)
• Fast (webs privadas)
• Teoma (Ask Jeeves)
• ....
CLASIFICACION:
Actualmente existen varios miles de buscadores lo que deja al usuario desconcertado y perplejo sobre las razones de tal cantidad y sobre todo cual o cuales usar. Algunos no pueden ni siquiera considerarse buscadores, puesto que son simples colecciones de enlaces a otras páginas...
Vamos a exponer algunos criterios de clasificación sobre los tipos de buscadores, aunque la mayoría de ellos encajan en distintos apartados. Las clasificaciones no son exaustivas ni exactas, pero sirven como orientación y experimentación.
1. SEGUN EL AMBITO DE BUSQUEDA PODEMOS HABLAR
...