Se considera “invisible”, o sea, de
calidad de Internet Profunda lo siguiente:
Las paginas excluidas. No siempre se
puede llegar a todas las partes de un Website. El Webmaster puede tener varias
razones para hacer que los WebBots no indicen ni consigan ciertas secciones de
un Website, lo que hace que esa información aunque esté en la Internet los
buscadores no la vean.
Las páginas que no son compatibles con
HTML. Recordemos que la Internet es esencialmente de formato HTML, pero en las
computadoras se bregan cientos de formatos de archivos.
Las páginas con gráficas sin texto. Los buscadores
no pueden ver nada que no sea texto. Las imágenes que se puedan conseguir es
porque están acompañadas de una breve descripción, pero si no la tienen, los
buscadores no las ve y es como no si no existieran.
Las páginas con música o vídeo pero sin texto.
Volvemos a repetir: lo que los indizadores de Internet (los Webots) no pueden
leer es como sin existiera. Al igual que con las gráficas, la música no se
puede leer, las películas no se pueden leer, etc. Así que Google y los otros
buscadores dependen de la descripción adjunta que le haya puesto el Webmaster a
sus recursos.
Las páginas que son básicamente PDF,
Word, WordPerfect, PostScript, PowerPoint, etc. (Google y AltaVista comienzan
manejarlas. Esos son parte de los formatos que hablamos anteriormente. En el
artículo: Encontrar lo que se busca, sumergiéndose en las profundidades
(http://www.redcom.org) se dice: “Técnicamente la mayoría de estos formatos
pueden ser indexados, pero los motores eligen no hacerlo por razones de
negocio. En primer lugar, hay mucha menos demanda de este tipo de formatos que
de textos HTML, y además estos formatos son más difíciles de archivar y
organizar, por lo que requieren mayores recursos del servidor”.
Las páginas con URL con signos de
pregunta (?) imbuidos. (esto se hace a propósito). Los URL son las direcciones
para que los buscadores consigan una página, pero eso es si el URL está
correctamente escrito. El signo de pregunta se usa para que el usuario sepa que
esa página va a estar disponible, pero que por ahora no. Otras veces, el signo
de pregunta se refiere a que la página corresponde a una búsqueda -usualmente
dentro de un banco de datos. Cuando se trata de una búsqueda así, la página no
se clasifica como "invisible".
Las páginas con contraseñas (Passwords).
Se requiere una contraseña para llegar a las bases de datos, para llegar a una
membresía, para llegar a una cuenta bancaria, etc. Obviamente, las páginas con
contraseña de entrada son el mejor ejemplo de Internet invisible. A veces la
contraseña se pide para calificar el usuario como miembro, cliente,
participante, o simplemente para establecer una jerarquía de usuario.
http://internetprofunda.blogspot.mx/2009/06/la-internet-profunda.html