Buscadores: a idéia e a trajetória
 
Em um levantamento rápido sobre “ferramentas de busca” na internet através do wikipedia é possível ter um panorama sobre o que está por traz de toda a agilidade que temos nos dias de hoje para obtermos informação na Web. A começar pelo entendimento idéia que motivou a criação e a trajetória de tal recurso.
 
Surgem na onda da evolução da internet, da necessidade de prover a busca de qualquer informação na web de acordo com uma palavra ou frase (texto de busca) apresentando os resultados de uma forma organizada, rápida e eficiente.  Um motor de busca é um programa feito algoritimamente para auxiliar a procura de informações armazenadas na rede mundial (WWW), dentro de uma rede corporativa ou um computador pessoal.
 
As primeiras tentativas foram duas:
 
Archie 1990 - baixava as listas de diretório de todos arquivos localizados em sites públicos de FTP (File Transfer Protocol) anônimos, criando uma base de dados que permitia busca por nome de arquivo - Alan Emtage, estudante da McGill University -  Montreal
 
Gopher 1991 - indexava documentos de texto e a maior parte dos sites Gopher tornaram-se sites Web sites após a criação da World Wide Web - Mark McCahill da University of Minnesota
 
A primeira máquina de busca surge de fato em 1993 desenvolvida por Matthew Gray no MIT. Foi chamado de Wandex - atualmente extinto. O primeiro sistema "full text" baseado em crawler, (web crawler ) programa automatizado que acessa e percorre os sites seguindo os links presentes nas páginas. Se aproximou mais da idéia de buscar por qualquer palavra em qualquer página de um documento ou website. Foi o primeiro buscador popularizado.  A partir daí outros surgiram: Lycos (hoje provedor de acesso fundido ao Terra), Excite, Infoseek, Inktomi, Northern Light, o Cadê, AltaVista , Yahoo (inicialmente um diretório de websites, agregou um buscador ao seu serviço) e finalmente o Google.
 
Os mecanismos de busca funcionam coletando sistematicamente informações sobre páginas da web (web crawling – spider), estabelecendo classes de armazenamento a partir de palavras extraídas de títulos, cabeçalhos ou meta tags (indexação), combinando estes atributos (indices – classes) quando da necessidade de se recuperar informações  (busca) atravéz de “expressões de busca” - termos buscados relacionados com a a juda de termos booleanos AND, OR e NOT ou de caracteres complementares peculiares a cada sistema de busca.
Muitas vezes as próprias expressões utilizadas em uma busca são armazenadas no banco de dados do serviço provedor de busca e relacionadas com os sites visitados a partir daquela busca (armazenamento em cache) para que em próximas pesquisas os resultados ganhem em agilidade e precisão.  
Ainda quanto a indexação, cada sistema adota critérios distintos para estabelecer um ranking de ordenamento dos “melhores resultados” a serem retornados em uma pesquisa.
Por exemplo, boa parte dos serviços de busca sustentam-se de proventos de publicidade, por isso  permitem aos anunciantes pagar para ter sua listagem mais alta no ranking nos resultados da busca (são os Guias locais como Listão, GuiaMais, AcheCerto e buscadores locais como Donavera.com).  Outros usam como parâmetro a quantidade de acessos de uma página e a frequência com a qual isso ocorre (são os buscadores globais como Google, Yahoo, MSN).  As ferramentas de busca em bases de dados especializadas levam em conta a relevância segundo um sistema de linguagem documentária convencionada ou peculiar a dado serviço (são os chamados buscadores verticais como BizRate, AchaNoticias, Oodle, Catho, SAPO, BuscaPé e Become.com)
Outras classes de buscadores que começam a aparecer são os ontobuscadores (baseados em ontologias como o Ontoweb) e os buscadores geoespaciais - combinam a busca de documentos, serviços, endereços, com referências geográficas em latidude e longitude apresentando mapas, fotos de satélite e até mesmo projeções em 3D como resultado – Maplink. googlemaps, googleearth são exemplos.  
 
São observadas também novidades em relação a buscadores são quanto ao método de indexação (utilizando XML ou RSS feed indexado pelo sistema de busca, sem a necessidade de um crawler complexo) e aos recursos desenvolvidos para outras áreas complementares a pesquisa na web onde a mesma tecnologia de busca para a web é usada como ferramenta de organização em universos menores (organização de documentos pessoais (googledocs, google desktop search)
 
Comparativamente, entre os três maiores buscadores (Google, Yahoo, MSN), ambos parecem convergir para a tendência de personalizar cada vez mais seus serviços oferecendo sua tecnologia e seu método de busca e organização aplicada a outros módulos de organização das informações do dia-a-dia. Podemos observar isso percebendo que um usuário de qualquer um dos sistemas tem ferramentas de busca aplicada ao universo de seus e-mails, grupos, redes virtuais (orkut), albuns de foto, agenda, oferecendo um espaço virtual onde estas coisas estejam juntas e dispostas conforme conveniente ao usuário (MSNSpaces, igoogle) muitas vezes em seus ambientes corporativos (google interprise). 
 
Apesar deste ponto em comum um detalhe da observação prática de resultados envolvendo uma comparação de resultados de uma mesma "expressão de busca" entre Google e MNS Live Search denota a diferênça de filosofia entre os provedores de busca. Conforme o esquema a seguir vemos:
 
Expressão de busca: "documentos digitais"
Condição: Apenas páginas do Brasil
  
Resultados Google - Resultados 1 - 5 de aproximadamente 12.900 páginas em português sobre "documentos digitais". (0,04 segundos) Resultados MSN Live search - 1-5 de 11.500 resultados

Esta biblioteca utiliza o sistema Nou-Rau para armazenamento e indexação de documentos digitais. Este sistema foi planejado originalmente para possibilitar ...
www.dicas-l.com.br/dicas-l/20060123.php - 27k - Em cache - Páginas Semelhantes 

 

Nesse sentido, se considerarmos, por exemplo, a área de educação, pode-se explorar formas de publicação de documentos digitais com conteúdos pertinentes ao ...
www.espacoacademico.com.br/041/41amsf.htm - 29k - Em cache - Páginas Semelhantes 

[PDF]  
 

Formato do arquivo: PDF/Adobe Acrobat - Ver em HTML
sistemas de informações, documentos digitais são perdidos com a mesma facilidade ... mídias de CD-ROM, tendo em vista a preservação dos documentos digitais, ...
www.unicamp.br/siarq/destaques/innarelli_solero_resumo.pdf - Páginas Semelhantes 

 

Será que não produzimos um bilhão de documentos digitais por ano, aqui no Brasil? Vejamos como cheguei a este número: são cerca de cinco milhões de empresas ...
adadigital.net/index.php?Itemid=2&id=395&option=com_content&task=view - 32k - Em cache - Páginas Semelhantes 

[PDF]  
 

Formato do arquivo: PDF/Adobe Acrobat - Ver em HTML
preservação para documentos digitais é uma prioridade,. pois sem elas não existiria nenhuma .... de preservação no fluxo dos documentos digitais dentro ...
www.scielo.br/pdf/ci/v33n2/a02v33n2.pdf - Páginas Semelhantes 

                      Sites patrocinados 
 
 
·                                  
 
·                                  
 
·                                 PDF Brasil: Digitalização de documentos e consultoria 
            Começe com o pé direito a digitalização de sua empresa. Veja como a PDF Brasil pode ajudar sua empresa a ser mais eficiente na utilização de documentos digitais
o                                  www.pdfbrasil.com.br/?pag=27  
o                                                        · Página em cache 
 Consultoria e transferência de know-how. A PDF Brasil ajuda você e sua empresa a ser mais eficiente com o uso de documentos digitais. Através de consultoria e treinamentos ...  
o                                            www.pdfbrasil.com.br/?pag=104  
 
 
Mesmo sem conseguir concluir o motivo da diferença numérica no resultado de pesquisa que os dois buscadores atribuem ao mesmo assunto, evidencia-se que o segundo tem uma preocupação mais comercial em relação ao primeiro. O MSN Live search dá destaque aos "sites patrocinados" (critério comercial) antes mesmo de apresentar algum resultado pelo critério de  "frequência e ocorrência" (critério que parece prevalecer no google)  lembrando a características comerciais de buscadores locais e guias buscadores.  
 
Outra diferença é a quantidade de soluções agregadas oferecidas por um e por outro. Elas podem ser conferidas nos sites < http://www.google.com/intl/pt-BR/options/ > e < http://home.live.com/?mkt=pt-br>. Conforme já dito antes, são soluções que convergem para uma personalização do ambiente de pesquisa e conteúdo na internet, mas que quantitativamente parecem estar distantes.
 
 
Referências Bibliográficas
 
Motores de busca. Disponível em: < http://pt.wikipedia.org/wiki/Motor_de_busca>. Acesso em 17 ago 2008 às 22:12.  
 
HOESCHL,Hugo Cesar . A nova era das ferramentas de busca. Consultor Jurídico, OESP, 01.02.2006. Disponivel em: <http://conjur.estadao.com.br/static/text/41493,1>. Acesso em 17 ago 2008 às 22:28. 
 
 
Portal MSN. Disponível em <http://br.msn.com/> . Acesso em 17 ago 2008 às 23:12. 
 
Tudo sobre o Google. Disponível em <http://www.google.com.br/intl/pt-BR/about.html> . Acesso em 17 ago 2008 às 23:31. 
 
Portal Yahoo. Disponível em <http://br.yahoo.com/ > . Acesso em 17 ago 2008 às 23:41. 
 
Mais produtos Google. Disponível em <http://www.google.com/intl/pt-BR/options/ > . Acesso em 17 ago 2008 às 23:46. 
 
Windows live. Disponível em < http://home.live.com/?mkt=pt-br > . Acesso em 18 ago 2008 às 00:12. 

© 2017 - 2026 by NeoCyber.