Pesquisa da UFSCar utiliza inteligência artificial e revoluciona a busca na internet

São Carlos
Estudos realizados no Departamento de Computação (DC) da UFSCar e na Carnegie Mellon University, dos Estados Unidos, desenvolvem e aplicam teorias e modelos de inteligência artificial para dinamizar os serviços de busca na internet e permitem que um sistema computacional aprenda autonomamente o conteúdo da internet e o armazene em uma base de conhecimento que cresce a cada dia. O Never-Ending Language Learner (NELL) é capaz de adquirir conhecimento continuamente e ter autonomia para revisar e ampliar seu  banco de informações e conhecimentos a partir de novas descobertas, além de associar conceitos que aumentam sua capacidade de lidar com novas informações e melhoram (autonomamente) sua capacidade de aprender.

O projeto do NELL foi iniciado em 2008, e depois de dois anos o sistema entrou em funcionamento como o pioneiro no processo autônomo de aquisição de conhecimentos no âmbito do aprendizado de máquina, como salienta o professor Estevam  Hruschka Júnior, do DC. “Outros grupos de pesquisa em inteligência artificial publicaram artigos, mas ainda não colocaram no ar um sistema de auto-aprendizado como o NELL”, afirma.

Os mecanismos do NELL são inspirados no processo de aprendizagem humana, com a assimilação de informações básicas e, no decorrer do tempo, a compreensão de dados complementares mais complexos. Atualmente, o NELL já conta com mais de 70 milhões de fatos e conceitos aprendidos a partir da leitura do conteúdo da internet no projeto Read the Web. “O NELL é o primeiro sistema computacional inteligente na história da Computação a aprender de maneira contínua em um processo chamado de aprendizado sem fim. Assim como nós seres humanos, o NELL aprende mais a cada dia e utiliza os conceitos já aprendidos para evoluir sua capacidade de aprendizado e sua base de conhecimento automaticamente”, destaca Hruschka Júnior. Inicialmente, o computador recebeu algumas informações de temas sobre os quais ele deveria aprender, como localidades, empresas, livros e pessoas, e a partir daí começou a ler o conteúdo da web para extrair conhecimento dos temas definidos.

O processo de aprendizado autônomo do NELL possibilitou o desenvolvimento de novas formas de lidar com as informações. O professor Hruschka Júnior explica que o sistema é capaz de alterar a estrutura inicial de sua própria base de conhecimento para o gerenciamento de informações, que permitiram a compreensão de informações mais específicas e mais precisas. “O NELL tem mecanismos que expandem a ontologia, tanto em relações quanto em categorias, para melhorar o desempenho. É o mesmo que ocorre com as pessoas, que precisam primeiro saber de alguns conceitos específicos para facilitar a compreensão de certos fatos”, aponta o docente.

Hoje, o NELL consegue lidar com a resposta sob demanda, ou seja, com base no conhecimento armazenado, o sistema é capaz de responder as perguntas feitas pelo usuário. Caso o sistema não consiga obter as respostas com alto nível de confiabilidade, o NELL é capaz de realizar uma nova leitura na internet e buscar novos conceitos e, se necessário, avaliar os dados encontrados. Os próximos passos são a construção de mecanismos que possibilitem a leitura de informações em vários idiomas. “Começamos o NELL em Inglês e já desenvolvemos vários algoritmos em Português, mas ainda não tínhamos atingindo um ponto em que a qualidade do aprendizado do NELL em Português fosse tão boa quando é em Inglês. No final do ano passado chegamos a um bom resultado que mostra a possibilidade de apresentar informações aprendidas em Português. Ainda para o final de 2014, planejamos implantar o sistema nas línguas espanhola e francesa (além da inglesa e portuguesa) e já temos uma parceria com um grupo da União Europeia para possibilitar que o NELL faça leituras em outras línguas europeias”, afirma Hruschka Júnior.

O docente explica que quando o programa desenvolver um suporte de informações suficientemente grande, será possível a compreensão de dados em outras línguas. Além disso, o sistema será capaz de obter informações da internet em outros idiomas e apresentar os dados em língua portuguesa, por exemplo. A ampliação de idiomas de domínio do NELL pode facilitar a busca de informações e a gama de fontes, mesmo se o usuário não tiver familiaridade com outras línguas. Como explica o docente, será possível extrair informações específicas, mesmo em materiais publicados em outras línguas, tanto na internet quanto em artigos científicos. “Quando tornamos o NELL independente do idioma, teremos um mecanismo com algorítimos internos que são iguais, independente da língua. Então, todo processo de comparação e validação apresenta a mesma eficácia. São poucas as tecnologias em Português que conseguem extrair informações de textos com alta precisão. Isso faz com que profissionais, pesquisadores, empresas e instituições que não trabalham com a língua inglesa fiquem muito restritos. A utilização de outros idiomas abre novas possibilidades”, afirma .

A estrutura do NELL, segundo Estevam, já apresenta um avanço nos serviços de buscas da internet, com a assimilação de tecnologia de inteligência artificial. “O resultado de uma busca pela internet não pode ser um monte de textos que devem ser lidos pelos usuários. As máquinas já têm a condição de trazer as respostas, ao invés de um conjunto de páginas a serem lidas pelo ser humano. A busca na web já está mudando e não é mais um conjunto de páginas, mas o mapeamento do conhecimento da web para trazer a resposta que o usuário solicitou”. Os sistemas de mapeamento da informação da web podem ser aplicados em pesquisas de opinião sobre empresas e serviços e necessidades dos consumidores, conforme o conteúdo publicado nas redes sociais e órgãos de imprensa, por exemplo. “Podemos construir sistemas computacionais que vão além do armazenamento e recuperação das páginas da web”, prevê o docente que revela que os avanços do NELL têm trazido benefícios diretos não só para a comunidade acadêmica como também para empresas e organizações em geral. Tais benefícios têm motivado a colaboração e o desenvolvimento de projetos em conjunto com a academia, com a indústria e outros setores da sociedade.

O docente da UFSCar adianta ainda que o NELL será capaz de assimilar o processamento de imagens e relacionar com o banco de dados de conceitos. Apesar do conjunto de tecnologias agregadas, Estevam salienta que, para o usuário final, o NELL é capaz de rodar em computadores domésticos e, num futuro próximo, também poderá ser utilizado em dispositivos móveis, como telefones celulares.

No mês de janeiro de 2014, o professor Estevam foi convidado para ministrar uma palestra e visitar a sede do Google, em Mountain View, Califórnia, Estados Unidos. O docente destaca que a oportunidade permitiu a troca de experiências e demanda entre os pesquisadores envolvidos no NELL e a empresa, principalmente no sentido de desenvolver ferramentas de busca mais inteligentes e confiáveis. “O convite se deu pelo interesse da gigante americana no projeto NELL e que pode contribuir com a iniciativa da empresa no desenvolvimento de uma base de conhecimento que contenha todo o conteúdo da internet, chamada "Knowledge Vault", e que pode revolucionar o processo de busca de informações na Web”, afirma o professor.

Para o docente, a aproximação entre as empresas e o meio acadêmico é importante para o desenvolvimento de tecnologias conforme as necessidades reais dos usuários. O NELL pode ser acessado em http://rtw.ml.cmu.edu/rtw.
25/03/2014
13:00:00
25/04/2014
18:00:00
Enzo Kuratomi
Sim
Não
6344