Há uma enorme quantidade de informações na Internet (vários milhões ou mil milhões de documentos), e estas informações são na sua maior parte renovadas diariamente. O motor de busca é um elemento indispensável para se orientar!
Um motor de busca (Searchbot em inglês) é uma máquina específica (material e software) encarregada de indexar páginas web para permitir uma busca com a ajuda de palavras-chave num formulário de busca.
Robots (software), chamados spiders (aranhas) devem percorrer a tela seguindo recursivamente as ligações dos milhões de páginas Web e indexam o conteúdo em gigantescas bases de dados para permitir a sua interrogação.
Nenhum motor de busca pode percorrer a totalidade das páginas num dia (este processo demora geralmente várias semanas), cada motor adopta por conseguinte a sua própria estratégia, alguns calculam mesmo a frequência de actualização dos sites.
Quando o utilizador de um motor de busca preenche o formulário, especifica as palavras que procura (e eventualmente aquelas que não deseja) graças aos operadores binários “e”, “ou”, “não”… (simbolizados por +, -,…), o pedido é enviado ao motor de busca que consulta as suas bases de dados para cada uma das palavras e seguidamente afina a busca retirando as páginas que não convêm.
Dá seguidamente uma lista de ligações para páginas, ou com o início do texto da página, ou o texto especificado pelo inventor da página graças a balizas específicas, chamadas méta-tags, ou ainda o extracto da página que contém as palavras procuradas.
Estas respostas são classificadas numa ordem de pertinência, correspondendo a critérios próprios ao motor de busca, como a percentagem de palavras que correspondem à busca, o seu índice de densidade (o número de vezes que cada uma das palavras-chave aparece na página), etc.
Chama-se “metamotor” a um instrumento de busca cujo funcionamento se baseia na exploração dos resultados de outros motores de busca.