Buscar información en la Web invisible

Noviembre 2016


¿Cómo buscar información importante en la Web cuando se trabaja en un dominio muy especializado? Aunque Google o Bing son a menudo suficientes para responder a las búsquedas comunes, estos buscadores sólo dejan ver la "parte emergente" de la Web. Sólo visualizan un tercio de los contenidos disponibles online, el resto escapa de los robots de indexación, y forma parte de la "Web invisible" o la "Web oculta". De hecho, son muchos sitios web que escapan de la visibilidad del usuario cuando realiza una búsqueda de alguna información especializada. Lo que se llama "Web oculta o invisible" oculta numerosos recursos para los investigadores, los científicos, los documentalistas, internautas y los especialistas de la vigilancia online en numerosos sectores. ¿Cómo ver los sitios web que no aparecen en los buscadores? A continuación le daremos consejos sobre cómo buscar y que buscadores utilizar para encontrar los sitios web que no aparecen en los motores de búsqueda.


¿Qué es la Web invisible o la Web oculta?


La "Web oculta" o la "Web invisible" designan la parte de la Web parcialmente o no indexada por los motores de búsqueda. Ésta es accesible en línea, pero necesita de herramientas de búsqueda específica capaces de hacer visible los contenidos "invisibles": páginas web, bases de datos, artículos de revistas científicas, documentos PDF, imágenes, vídeos, etc.

Se estima que la Web invisible u oculta representa aproximadamente ¾ de los recursos accesibles en Internet. De hecho, varios tipos de contenidos de calidad escapan de los robots de indexación.

Las principales razones que impiden su indexación son:

- Ciertos documentos son demasiado grandes. Ciertas bases de datos son demasiado complejas para que sus contenidos sean indexados.

- Ciertas páginas son protegidas por el autor del contenido, otras son solamente generadas mediante una búsqueda dinámica, algunas necesitan una autentificación o contraseña y finalmente una cantidad muy grande de páginas web son huérfanas (ausencia de un enlace que dirija hacia su URL).

Buscar información en la Web invisible: ¿por qué y para cuales usos?


La Web invisible o Web oculta ofrece recursos útiles para diferentes tipos de profesionales que buscan documentar su trabajo. En diferentes sectores de actividad y para diferentes aplicaciones:
  • Búsqueda académica (Matemáticas, Medicina, Ciencias Humanas, etc.): para encontrar documentos técnicos, artículos de revistas especializadas, tesis, informaciones de bases de datos especializadas, publicaciones científicas, etc.
  • Vigilancia tecnológica, sectorial o de la competencia: Ciertos motores de búsqueda permiten consultar grandes bases de conocimientos en dominios muy técnicos, para hacer público los últimos artículos publicados en estos dominios (por ejemplo: búsqueda por palabra clave, fuente del contenido, autor, etc.).
  • Documentación de empresas: Buscando en la Web invisible u oculta, los ciberdocumentalistas tienen acceso a informaciones más precisas y documentadas para enriquecer la base de conocimientos puesta a disposición de los colaboradores de la empresa. Existen ciertos motores de búsqueda que permiten tener acceso a las antiguas versiones de sitios web, lo que permite seguir la evolución por ejemplo.
  • Indexación de los contenidos: especialmente para internautas que buscan contenidos pertinentes para enriquecer la base de los motores de búsqueda o directorios web.

Buscadores gratuitos


- Biznar.com: recursos para profesionales
Estudios sectoriales, artículos de revistas especializadas, webinars: este sitio inventaría los recursos (mayoritariamente en inglés) publicados en diferentes sitios web o bibliotecas y permite crear alertas por email correspondientes a palabras clave.

- Mednar: contenido médico o de salud (recursos académicos).
Este motor de búsqueda busca en tiempo real en los recursos de 60 bases de datos que reagrupan contenidos vinculados a la Salud Pública (revistas médicas, informes redactados por autoridades de salud), en base a palabras clave determinadas. También sugiere resultados temáticamente cercanos a la demanda inicial para ampliar la búsqueda. Éstos también pueden ser clasificados según varios criterios: autor, editor, fecha de publicación, etc.

- WorldWideScience.org
Este sitio web genera resultados de varias bases de datos científicas y ofrece cerca de 50 millones de artículos, libros, informes y video conferencias en diferentes dominios técnicos y científicos: nuevas tecnologías, Medicina, ciencias humanas, etc.

- Otro motor de búsqueda especializado en ciencias: Scienceresearch.com, que reúne los resultados de más de 300 fuentes diferentes.

- BASE (Bielefeld Academic Search Engine): búsqueda académica o bibliográfica
Este motor de búsqueda especializado en la búsqueda académica efectúa la indexación automática de las bibliotecas digitales que utilizan el protocolo Open Archives Initiative Protocol (protocolo de intercambio de metadatos). Permite visualizar los resultados publicados en las bases de datos socios, que no son indexados por los motores de búsqueda clásicos. Este motor de búsqueda permite enriquecer una búsqueda bibliográfica.



Consulta también :
El documento «Buscar información en la Web invisible» de CCM (es.ccm.net) se encuentra disponible bajo una licencia Creative Commons. Puedes copiarlo o modificarlo siempre y cuando respetes las condiciones de dicha licencia y des crédito a CCM.