Postagem realizada em: 25/03/2007 às 14:52:50 - Última atualização em: 30/11/-0001 às 00:00:00
Autor: Sandra Cardoso
Recursos de Busca
CONTEXTO:
“Localizar informações na Internet, entretanto, pode parecer uma tarefa impossível. Isto, não só pelo grande volume de páginas disponíveis como, também, pelo seu caráter anárquico. Os documentos não estão organizados segundo um padrão determinado como, por exemplo, as bibliotecas e encontrar a informação desejada depende, principalmente, da utilização eficiente das ferramentas de busca disponíveis.”
“...Diferentemente dos humanos, os mecanismos de busca são incapazes de formular perguntas adicionais que definam melhor o objeto ou de se valer de suas experiências anteriores para escolher, entre os documentos encontrados, os mais relevantes. Assim, para uma maior eficiência utilizam critérios que envolvem localização e freqüência da expressão procurada.
Verificam a existência dos termos buscados no título, nas primeiras linhas e o número de ocorrências. A partir deste levantamento definem a localização de cada documento na relação apresentada como resposta.”
BRANSKI, R. M. Localização de informações na Internet: características e formas de funcionamento dos mecanismos de busca. Texto preparado para o Curso de Extensão Desenvolvimento de Negócios com o auxilio da Internet do Instituto de Economia da Universidade Estadual de Campinas. Disponível em: http://www.eco.unicamp.br/cefi/localizacao.doc
DIRETÓRIOS
“ Os diretórios foram a primeira solução proposta para organizar e localizar os recursos da Web, tendo precedido os motores de busca por palavras-chave. Foram introduzidos quando o conteúdo da Web ainda era pequeno o suficiente para permitir que fosse coletado de forma não automática. Organizam os sites que compõem sua base de dados em categorias, as quais podem conter subcategorias, ou seja, os sites recebem uma organização hierárquica de assunto e permitem aos usuários localizar informações, navegando, progressivamente, para as subcategorias. Como são ferramentas genéricas, destinadas a um público variado, procuram incluir, em suas árvores hierárquicas de assunto, tópicos que são de interesse amplo. É comum que incluam, por exemplo, itens relacionados com educação, esporte, entretenimento, viagens, compras ou informática. Cabeçalhos de assunto são atribuídos de forma consistente, de modo que os usuários podem contar com a ajuda de um vocabulário controlado.”
História
“O primeiro diretório da Web foi o The World Wide Web Virtual Library (http://www.vlib.org/), lançado em novembro de 1992 e sediado no CERN, que também foi o local de nascimento da Web. Atualmente, o exemplo mais conhecido é o Yahoo!, que iniciou em 1994, a partir de um hobby de estudantes de doutorado na Stanford University, e hoje é uma bem-sucedida empresa comercial. Outros exemplos de diretórios são Snap (http://www.snap.com), LookSmart (http://www.looksmart.com), Open Directory (http://dmoz.org/), Yahoo Brazil (http://www.br.yahoo.com), Cadê (http://www.cade.com.br), Surf (http://www.surf.com.br) e Vai & Vem (http://www.vaievem.com.br), sendo estes três últimos brasileiros. “
Motores de Busca: Ao contrário dos diretórios, os motores de busca não organizam hierarquicamente as páginas que colecionam. Preocupam-se menos com a seletividade que com a abrangência de suas bases de dados, procurando colecionar o maior número possível de recursos através do uso de softwares chamados robôs. Como suas bases de dados são extremamente grandes, podendo alcançar centenas de milhões de itens, permitem aos usuários localizar os itens desejados mediante buscas por palavras-chave, ou, às vezes, em linguagem natural.
Os motores de busca começaram a surgir quando o número de recursos na Web adquiriu proporções tais que impediam a sua coleta por meios manuais e a busca apenas através da navegação. A maioria deles derivou do trabalho de estudantes de pós-graduação, professores, funcionários do departamento de sistemas de empresas ou outras pessoas interessadas na Web. Muitos não obtiveram continuidade, à medida que a tarefa a ser executada passou a exigir maiores recursos humanos e técnicos. Os que sobreviveram foram adquiridos por empresas ou financiados por propagandas, investidores e recursos de pesquisa.
“O primeiro diretório da Web foi o The World Wide Web Virtual Library (http://www.vlib.org/), lançado em novembro de 1992 e sediado no CERN, que também foi o local de nascimento da Web. Atualmente, o exemplo mais conhecido é o Yahoo!, que iniciou em 1994, a partir de um hobby de estudantes de doutorado na Stanford University, e hoje é uma bem-sucedida empresa comercial. Outros exemplos de diretórios são Snap (http://www.snap.com), LookSmart (http://www.looksmart.com), Open Directory (http://dmoz.org/), Yahoo Brazil (http://www.br.yahoo.com), Cadê (http://www.cade.com.br), Surf (http://www.surf.com.br) e Vai & Vem (http://www.vaievem.com.br), sendo estes três últimos brasileiros. “
“ALIWEB (Archie-Like Indexing on the Web) e Harvest são exemplos das primeiras tentativas de criar motores de busca por palavras-chave, e utilizavam tecnologias diferentes das atuais. O primeiro dos motores baseados em robôs foi o WebCrawler, lançado em abril de 1994. Todos os motores atuais utilizam o método de robôs sendo formados por quatro componentes: um robô, que localiza e busca documentos na Web; um indexador, que extrai a informação dos documentos e constrói a base de dados; o motor de busca propriamente dito; a interface, que é utilizada pelos usuários. “
CENDÓN, B. V. . Ferramentas de busca na Web. Ciência da Informação, Brasília, v. 30, n. 1, p. 39-49, 2001. Disponível em : http://www.scielo.br/
Comentários: Esse artigo é bastante completo, exemplifica os diferentes tipos de diretórios e motores de busca. Além disso, detalha como é o processo de indexação feito por um “robô”. Interessante ainda, é dar uma olhadinha no currículo da autora, professora do curso de Ciências da Informação de Minas Gerais, sua formação inicial é da Engenharia Civil, com Mestrado e Doutorado na área da Ciência da Informação.