La naturaleza de internet
Enviado por quien_sabe • 26 de Mayo de 2013 • Trabajo • 908 Palabras (4 Páginas) • 563 Visitas
El Web es una entidad compleja que contiene información de diferentes tipo. Es mucho más que las páginas estáticas, la parte del web no fija, la que está soportada en server, es decir lo que se suele denominar web dinámico es en realidad la parte más grande del web. Algunos llaman a esta parte Web invisible, web oculto, o deep web.
Esta definición es una definición centrada en los buscadores, o mejor dicho en lo que los buscadores no pueden hacer ya que entran en esta categoría materiales que no se acceden directamente y que los buscadores no pueden atrapar con los métodos usuales, porque no son páquinas editadas en HTML.
Comprende:
a. El contenido de bases de datos accesibles a través de web: se trata de información estructurada en tablas de datos creados y manejadas con programas como: Access, Oracle, SQL Server, MySql. Esta información sólo puede ser presentada si se la requiere por medio de una consulta, un query. Para poder realizarlo se debe realizar un ingreso, login, a un área especial del sitio, a veces gratuito, a veces pago. Se ha estimado que el contenido del web de databases es 500 veces mayor que el del web estático. Se trata de bases de datos de empresas, organismos, instituciones, y pueden tener la forma de bases de datos de apoyo a la gestión, de catálogos para clientes e incluso de bases de datos bibliográficas especializadas en temáticas particulares: médicas, negocios, espaciales, y incluso bibliotecas virtuales de universidades y centros de estudios. Se dice que esta es información invisible, oculta o profunda porque los buscadores no pueden entrar en ellas para extraer los datos
b. Forma parte también del web profundo el conjunto de los archivos llamados No textuales, es decir archivos multimedia, gráficos, software, y documentos en Portable Document Format (PDF). Algunos de estos sí son accesibles a través de los buscadores, siempre y cuando tengan la metadata que permite localizarlos.
Algunas cifras para comprender las dimensiones:
Fuente
Dimensiones del archivo
National Climatic Data Cnter
366.000 Gb
NASA
219.000 Gb
National Oceanographic Data Center
32.940 Gb
MP3.com
4.300 Gb
Amazon
461 Gb
Library Of Congress Online Catalog
116 Gb
¿Qué hay en el web profundo?
El web profundo es una realidad que no podemos ignorar.
Lo más importante es tener presente que información incluye, de manera que cuando buscamos algo de esto deberemos plantearnos otra estrategia de acceso:
· Guías y listas de teléfonos, e-mail, y todo tipo de directorios
· "people finders" es decir listas de profesionales de todas la disciplinas
· Leyes, decretos, en general información legal, aunque alguna se puede encontrar
...