Busca de informações na Web invisível

Fevereiro 2017




Como buscar a informação pertinente no web quando se trabalha em um domínio muito específico ? Se « Google » ou « Bing » são suficientes para responder as consultas comuns, estas ferramentas permitem somente ver a « parte emergida » da Web. Elas afixam somente um terço dos conteúdos disponíveis online, o resto escapa dos robôs de indexação, e faz parte da « Web invisível » ou Web profunda. De fato, é todo um mundo do Web que escapa ao usuário em busca de informação especializada. O que se chama o "Web profunda" esconde numerosas recursos e fontes para os pesquisadores, cientistas, documentalistas, os navegadores web de alerta em diversos setores. Mas qual ferramenta utilizar, e para quais aplicações ?


O que é o Web invisível ou o web profunda ?


O « web profunda» e por extensão o web invisível designa a parte da web parcialmente ou não indexada pelos motores de busca. Este é acessível online, mas necessita das ferramentas de busca específica (veja aqui abaixo) capazes de fazer emergir os conteúdos "visíveis": páginas web, bancos de dados, artigos de revistas científicas, documentos PDF, imagens/vídeo.
Estima-se que a Web profunda representa mais ou menos os s ¾ dos recursos acessíveis na internet.
Diversos tipos de conteúdos de qualidade escapam dos robôs de indexação :
As principais razões que impedem sua indexação ::

- Certos documentos são muito volumosos. Certos bancos muito complexos para que os conteúdos correspondentes sejam indexados.

- Certas páginas são protegidas pelo autor do conteúdo, outros são gerados somente baseados em uma busca dinâmica, certos necessitam uma autenticação, senha, enfim uma grande quantidade das páginas são órfãs (ausência de link que aponte para os eu URL).

Buscar a informação na web invisível: para quem e para quais usos?


A Web profunda propõe recursos úteis para diferentes categorias profissionais que buscam seu trabalho. Nos diferentes domínios de atividade e para diferentes aplicações:
  • Busca acadêmica (matemática, medicina, ciências humanas, etc.) : para encontrar documentos, artigos de revistas especializadas, teses, informações tiradas de bancos de dados especializados, publicações científicas, etc.
  • Alerta tecnológico/setorial/concorrência : certos motores (vela aqui abaixo) que permitem interrogar largos bancos de conhecimentos no domínios muito técnicos, para fazer emergir os últimos artigos publicados nestes domínios (ex : busca por palavra chave, fonte, autor, etc.)
  • Documentação de empresas : ao buscar a web profunda, os ciberdocumentalistas tem acesso a informações mais precisas/documentadas para enriquecer o banco de conhecimentos disponibilizada para os colaboradores da empresa. Note que algumas ferramentas de busca permitem ter, por exemplo,acesso as antigas versões de web sites, o que permite de seguir sua evolução.
  • <gras>Indexa/portais ou anuários web.

As ferramentas de busca para os negócios


Estudos setoriais, artigos especializados, web sites, webinários: este site recenseia os recursos (na maioria em inglês) saídos de diferentes sites/bibliotecas e permite criar alertas e-mail correspondentes a palavras chaves no âmbito de uma vigília de informações.
  • Mednar : alerta medicinal/saúde (busca acadêmica)

Este meta-motor de busca se alimenta, em tempo real, nos recursos de bancos de dados que agrupam os conteúdos ligados à saúde pública (revistas medicinais, relatórios redigidos por autoridades da saúde), na base de palavras chaves determinadas. Ele sugere igualmente resultados tematicamente próximos da consulta inicial para afinar a busca. Estes motores podem igualmente serem afinados de acordo com diversos critérios: autor, editor, data de publicação, etc.
Este site/portal gera resultados saídos de diversos bancos de dados científicos em rede e propõe mais de 50 milhões de artigos, livros, relatórios, e minutas de conferência nos diferentes domínios técnicos e científicos : novas tecnologias, medicina, ciências humanas, etc.
Outra ferramenta de busca tendo ligação com as ciências : Scienceresearch.com, que reúne os resultados originados de mais de 300 fontes diferentes.
  • BASE : busca acadêmica/bibliográfica

Este motor de busca especializado em pesquisa acadêmica realiza indexação automática de bibliotecas digitais que usam o Open Archives Initiative Protocol (protocolo de troca de metadados). Ele ajuda a trazer os resultados de parceiros do banco de dados, que não são indexadas pelos motores de busca tradicionais. É particularmente relevante para enriquecer uma pesquisa bibliográfica.


Tradução feita por Ana Spadari

Veja também

Artigo original publicado por . Tradução feita por ninha25. Última modificação: 30 de março de 2011 às 07:23 por ninha25.
Este documento, intitulado 'Busca de informações na Web invisível ', está disponível sob a licença Creative Commons. Você pode copiar e/ou modificar o conteúdo desta página com base nas condições estipuladas pela licença. Não se esqueça de creditar o CCM (br.ccm.net) ao utilizar este artigo.