Calendário Concursos

a - Abertura
f - Fecho

E se houvesse um motor de busca mais eficaz do que aqueles que usamos hoje em dia?

30.10.2012
  • Incentivos às Empresas
  • I&DT

É este o âmbito do projeto World Search, onde um grupo de investigadores portugueses está a desenvolver um programa, em parceria com a Microsoft.

Pesquisa na web
Pesquisa na web

 

Projeto World Search

1. Contexto

Numa altura de interesse claro no desenvolvimento de tecnologia inovadora nacional com potencial de exportação, este projeto surge para contribuir para a garantia da sustentabilidade de uma fileira industrial na área das tecnologias de pesquisa, no mercado nacional.

Imagine um motor de busca de viagens que lhe dá exatamente o que procura quando preenche um formulário. Agora imagine-se a preencher um formulário semelhante e a obter resultados parecidos, mas para qualquer tipo de assunto.

É este o objetivo do projeto: desenvolver um motor de busca mais eficaz do que aqueles que usamos hoje em dia, capaz de responder aos pedidos, relacionando a informação dada com um raciocínio lógico.

2. Enquadramento no COMPETE

O projeto World Search é um projeto nacional de colaboração de Investigação e Desenvolvimento (I&D) cofinanciado pelo FEDER (Funfo Europeu de Desenvolvimento Regional) através do QREN, no âmbito do COMPETE - Programa Operacional Factores de Competitividade.

Apoiado pelo COMPETE no âmbito do Sistema de Incentivos à Investigação e Desenvolvimento Tecnológico, na tipologia de Projeto em Co-Promoção, é gerido pela Agência de Inovação.

O Projeto envolve um investimento elegível de 1.205 mil euros correspondendo a um incentivo FEDER de 821 mil euros.


3. Ficha Resumo

 Título    WS - World Search 
Áreas  Tecnológicas         TIC (Tecnologias da Informação e Telecomunicações)
Objetivos

- Criação de Tecnologia Inovadora em Portugal;

- Aumento dos Indicadores de I&D dos co-promotores e parceiros em Portugal;

- Geração de Conhecimento e de Riqueza.

Co-promotores

- IZone, Knowledge Systems, SA

- Ponto C - Desenvolvimento de Sistemas de Informação, Lda.
Maisis - Sistemas de Informação, Lda.

- PT Comunicações, SA

- Universidade de Aveiro

- Faculdade de Ciências da Universidade de Lisboa

- Instituto Superior de Engenharia do Porto

 

4. Descrição

O Projeto estabeleceu uma parceria entre a Microsoft, a Universidade de Aveiro, o Instituto Superior de Engenharia do Porto, a Faculdade de Ciências da Universidade de Lisboa, a Portugal Telecom, a MAISIS, a Ponto.C e a I-Zone.

  Logótipo 

O World Search visa a investigação e o desenvolvimento, em Portugal, das tecnologias de pesquisa do futuro, de informação estruturada e não estruturada, geral e empresarial com relevância semântica e com o devido conhecimento da língua, cultura e mercado nacionais, aplicáveis à web portuguesa. 

Visa ainda a sua integração numa plataforma modular e a consequente demonstração em 3 pilotos de domínios estratégicos bem definidos: a Web portuguesa, a Administração Pública Local e a Saúde, em particular.

O projeto visa também a elevação do domínio das tecnologias de pesquisa, geral e empresarial (search), como uma componente importante de uma estratégia nacional para as TICE (Tecnologias de Informação, Comunicação e Eletrónica).

Do ponto do desenvolvimento das tecnologias de pesquisa, o projeto toma como base as tecnologias disponíveis no promotor, nomeadamente a tecnologia Bing (de pesquisa geral) e a tecnologia FAST (de pesquisa empresarial).

O projeto tem o objetivo de criação, pré-competitiva e competitiva, de produtos de tecnologia de pesquisa inovadores e com real valor no mercado, que possam ser explorados no curto e no médio prazos.

Numa primeira fase, visamos o mercado nacional; numa segunda fase, a exploração no mercado dos PALOP e das línguas ibéricas; posteriormente, na sequência de mais iniciativas de I&D, nos países de línguas românicas.  

   

Neste projeto, a aposta na criação de tecnologia inovadora é fundamental para que as empresas e os institutos académicos adquiram mais-valias competitivas ao nível do reforço das experiências dos seus recursos humanos, ao nível da integração de novas funcionalidades nos seus sistemas e produtos e também no sentido de aumentarem a sua visibilidade junto de grandes atores do mercado internacional, como é o caso do promotor (Microsoft).

O consórcio acredita que as soluções que serão encontradas e os resultados que se esperam obter com os pilotos irão beneficiar, em muito, os requisitos de negócio atuais e futuros do promotor (Microsoft), copromotores e parceiros empresariais.

5. Resultados

No âmbito deste projeto, o MLDC (Microsoft Language Development Center) iniciou, em Março de 2011, uma parceria com o Search Technology Center de Munique e Londres, a equipa internacional de I&D do motor de pesquisa Bing.

Através desta colaboração foi desenvolvido um novo módulo de expansão da pergunta para todas as variantes faladas na comunidade dos Países de Língua Portuguesa.

Além da melhoria do corretor ortográfico, de acordo com a nova ortografia, foi criado um módulo que concretiza um conjunto de alterações à pergunta da pesquisa cujo objetivo é transformar o texto inicial da consulta de forma a retornar resultados mais relevantes. Exemplos de alterações surgem no acrescento de formas flexionadas, na identificação de entidades nomeadas ou na eliminação de termos, entre outras alterações, ampliando, assim, a probabilidade de correspondência com os documentos mais relevantes.

Na figura seguinte podem observar-se os ganhos conseguidos com a métrica NDCG (Normalized Discounted Cumulative Gain), usada frequentemente em Information Retrieval de forma a medir a relevância ou a eficácia de um algoritmo de busca. Retorna um valor entre 0 e 100, correspondente à relevância dos elementos numa lista ordenada, em que 100 representa uma ordenação perfeita.
 

Grafico

 

Grafico 2


O desenvolvimento deste módulo assinalou uma melhoria significativa no desempenho e na ordenação dos resultados das pesquisas, desde a altura em que foi lançado em produção, a 12 Novembro de 2011. Esta tecnologia permite compreender melhor a intenção dos utilizadores que pesquisem em qualquer variante da língua portuguesa, produzindo resultados que vão de encontro às suas necessidades e expectativas.

É relevante salientar a que esta parametrização do Bing para português constitui:

  • um importante passo para colocar Portugal entre os países de referência da União Europeia no domínio das tecnologias de pesquisa;
  • e um claro contributo para uma estratégia nacional que fomente uma maior competitividade no setor das Tecnologias de Informação e Comunicação em Portugal.

No seguimento desta colaboração e no contexto do projeto World Search, o MLDC e a Microsoft estão ainda a desenvolver um protótipo para o windows phone que permite efetuar pesquisas no Bing utilizando a fala. Através deste sistema, será simples pesquisar por um vídeo, um endereço, ou qualquer outro tipo de informação em ambientes móveis, pronunciando o pedido em português europeu.

Os pilotos na Administração Pública Local e na Saúde (neste caso, no contexto da divulgação e ensino em Saúde e Medicina) estão a decorrer e tirarão partido da plataforma FAST, a qual ainda é pouco utilizada em Portugal e ainda é pouco acessível a PME. Pelo trabalho que o consórcio se propõe desenvolver será possível entrar no domínio do conhecimento das plataformas FAST e Bing.

Deste modo, os participantes no consórcio, nomeadamente as empresas, poderão assim facilitar a introdução desta tecnologia inovadora em Portugal e ainda, poderão criar valor acrescentado, desenvolvendo novos módulos e plugins de acordo com os requisitos do projeto e dos seus pilotos.
Associado ao estudo, conhecimento e Investigação e Desenvolvimento (I&D) sobre as plataformas FAST e Bing, a I&D aplicada a aspetos fundamentais para o projeto, como as ontologias, as normas de segurança e a interação pessoa/computador, garantirá a inovação daquelas plataformas de pesquisa.

Estão também planeados o desenvolvimento de testes objetivos e subjetivos padrão e ainda, estudos da usabilidade nos domínios estratégicos de aplicação definidos, que demonstrem a melhoria da relevância dos resultados de pesquisa, obtidos com as tecnologias de desenvolvidas.

Por: Cátia Silva Pinto