segunda-feira, 15 de fevereiro de 2010

Search engines

Recentemente foram analisados alguns produtos existentes no mercado, que permitem a indexação das várias páginas de uma aplicação Web. Isto permite uma pesquisa muito rápida e eficaz. Em seguida explico os produtos analisados, e o porquê da nossa preferência pelo da IBM em parceria com a Yahoo!:


Microsoft Search Server 2008 Express Edition:

  • Uma das grandes vantagens deste produto é o facto se ser grátis, porém a sua instalação pode causar alguns problemas em máquinas que já se encontrem a correr sites com o Windows Sharepoint Service, visto que para que este produto funcione é instalada a versão 3.0 do WSS. Este produto foi instalado numa máquina nossa e o grande problema com que nos deparámos após a instalação, foi o facto de este consumir muitos recursos e de, devido a este facto, afectar muito a performance do servidor.

Google – vários:

  • Foram analisados vários produtos disponibilizados pela Google, porém nenhum deles tem uma distribuição grátis, sendo que alguns chegam a atingir mesmo preços muito elevados. Outra desvantagem é que o produto mais barato precisa ainda que seja instalado um componente de hardware no servidor.


IBM OmniFind Yahoo! Edition, por fim foi descoberto este produto, que nos parece o mais apropriado. Este tem várias vantagens, entre as quais:

  • Tem uma distribuição gratuita que se encontra limitada à indexação de 50.000 documentos (nos testes locais que fiz só foi preciso indexar 797 documentos, que ocuparam 60MB em disco), logo isto não levanta problemas para o nosso caso);
  • Processo de instalação muito simples e intuitivo, não tem nenhum requisito a não ser o facto de correr sobre a JVM (Java Virtual Machine);
  • Corre tanto em sistemas Linux como Windows;
  • Pode indexar tanto páginas Web como ficheiros da máquina;
  • É possível adicionar sinónimos às pesquisas, para assim tentar evitar as pesquisas que não retornam resultados. Por exemplo adicionar “foto, fotografia” ou “computador, pc, personal computer” como sinónimos, como se pode ver na imagem abaixo:
  • É possível consultar quais as pesquisas mais populares, quais as possíveis mais populares que não retornaram resultados, qual o link mais clicado dos retornados por uma determinada pesquisa, quais as pesquisas das quais resultaram mais clicks em links, etc;


  • É possível indicar links de destaques para certas pesquisas. Por exemplo se tivermos um conjunto de produtos que consiste num computador capacete e uma bicicleta, é possível especificar que se um cliente pesquisar por “capacete” ou por “bicicleta” o link para este conjunto será o primeiro a ser apresentado e é apresentado de forma a destacar-se dos outros (através de um tipo de letra com uma fonte maior, e estando dentro de um rectângulo a tracejado);

  • A página de busca e de resultados pode ser customizada, adicionando logótipos, imagem ou cores de fundo, e ainda definindo os estilos de letra.

Para além de tudo o que foi descrito acima, é ainda possível utilizar a API do OmniFind para efectuar as pesquisas através de pedidos http, e recebendo a resposta em formato Atom 1.0 (http://atompub.org/rfc4287.html) ou em html, sendo depois esse html integrado numa página Web já existente.

Sem comentários: