Sistema computacional identifica opinião das pessoas na internet
Lagoa do Sino
Conhecer a opinião das pessoas sobre produtos, serviços e até sobre fatos do dia a dia é um dos principais desafios para marcas, empresas, partidos políticos, acionistas etc. Na era da internet, essa necessidade se tornou mais complexa devido ao volume de informações que são geradas e circulam em redes sociais, blogs e sites. Pensando nisso, um grupo de pesquisadores do Laboratório de Sistemas Inteligentes e Distribuídos (LaSID) do Centro de Ciências em Gestão e Tecnologia (CCGT) do Campus Sorocaba da UFSCar desenvolveu um sistema capaz de analisar, automaticamente, uma grande quantidade de mensagens coletadas de redes sociais e estimar a opinião - positiva ou negativa - que a maioria dessas mensagens expressa a respeito de um assunto ou objeto de interesse.
"Pesquisas de opinião tradicionais são normalmente custosas, pois envolvem consultas individuais - seja por telefone ou por meio eletrônico - e a abrangência é frequentemente limitada [baixo volume de respostas]. Através desse sistema computacional inteligente, é possível analisar automaticamente a opinião de milhares de pessoas de qualquer lugar do mundo, em um curto espaço de tempo e com baixo custo", compara o professor Tiago Agostinho de Almeida, do Departamento de Computação (DComp) e coordenador do estudo que gerou a nova ferramenta. Com o sistema on-line, a análise se torna altamente dinâmica e pode ser usada rapidamente para atender a demanda do mercado e satisfazer os interessados em conhecer a opinião pública. Não obstante, a alta capacidade de abrangência permite que as análises se tornem muito mais robustas, confiáveis e, portanto, menos tendenciosas, avalia o professor.
Por exemplo, suponha que uma empresa tenha lançado um produto e gostaria de saber a opinião das pessoas a respeito dele. Atualmente, essa análise é feita, na maioria dos casos, por meio de questionários ou entrevistas realizadas com consumidores. Trata-se de um mecanismo lento e, muitas vezes, pouco representativo para obter opiniões. Com o sistema proposto, a empresa poderia obter essa análise de forma muito mais rápida e abrangente, pois milhares de mensagens postadas em redes sociais sobre o produto seriam coletadas e analisadas automaticamente, detalha Almeida.
Segundo o professor, um dos motivos do sistema proposto ter obtido melhores resultados que as técnicas tradicionais se deve à inovação da pesquisa que procurou aumentar a capacidade de processamento e análise de textos curtos e ruidosos como os que são comumente compartilhados nas redes sociais e pelo WhatsApp, através de smartphones.
Para o desenvolvimento do mecanismo, os pesquisadores propuseram um comitê composto por diversos métodos sofisticados de inteligência artificial e processamento de linguagem natural que são combinados automaticamente para processar mensagens de texto e predizer a opinião (muitas vezes implícita) expressa na mensagem, a respeito de algum objeto de interesse. O sistema realiza a "leitura", "interpretação" e detecção de contexto mesmo para mensagens repletas de gírias, símbolos, abreviações, emoticons etc. Além disso, articula técnicas de normalização léxica e indexação semântica para obter conceitos relacionados a termos isolados das mensagens. Dessa forma, é capaz de realizar a análise da opinião de maneira sensível ao contexto.
Por exemplo, em um contexto político, na mensagem 'Ele é um porco!', a palavra porco evidencia uma opinião negativa com relação a alguém. Porém, no contexto de uma conversa sobre animais, a mesma palavra não indica nenhuma opinião, mas apenas faz referência ao animal. Assim, através de técnicas modernas de detecção de contexto e indexação semântica, o sistema é capaz de discernir e analisar a opinião em mensagens de difícil interpretação até mesmo para humanos, ilustra o pesquisador.
Uma das grandes dificuldades encontradas ao analisar mensagens postadas em redes sociais é que elas geralmente são curtas e mal escritas, repletas de gírias, símbolos e abreviações, descreve o pesquisador. Por exemplo, a frase 'Por que você não vai também? Estou triste!' é comumente escrita como 'Pq vc naum vai tb? :('. Essas características impactam negativamente na representação e no processamento computacional, diz Almeida. Mas, esse desafio também foi superado com a ferramenta desenvolvida no Campus Sorocaba.
Realizado no período de 2012 a 2016, o estudo Análise de Sentimento de Mensagens de Texto via Comitê de Máquinas de Classificação envolveu dois alunos de mestrado e dois alunos de iniciação científica. A pesquisa contou com financiamento da Fapesp (de 2014 a 2016), além de uma bolsa Capes para o aluno de mestrado e duas bolsas de iniciação científica do CNPq.
Pesquisa premiada
O sistema foi testado com mensagens coletadas do Twitter, escritas em língua inglesa, em diversos contextos (filme, tecnologia, jogos eletrônicos, política etc). Os resultados obtidos foram superiores aos métodos tradicionais, comprovados por um rigoroso teste estatístico.
Almeida afirma que, de maneira prática, qualquer interessado em saber a opinião a respeito de alguma coisa (produto, serviço, pessoa, lugar, etc.) pode utilizar o sistema proposto para fazer essa análise, através do processamento massivo de uma grande quantidade de dados que podem ser obtidos, em tempo real, nas redes sociais. Imagine que uma pessoa está interessada em assistir o filme 'ABC' que acabou de estrear, mas antes gostaria de saber a opinião daqueles que assistiram. Você poderia usar o sistema para analisar em tempo real milhares de postagens em redes sociais e obter uma estimativa confiável da opinião dos telespectadores que fizeram comentários a respeito do filme nas últimas horas, reforça o pesquisador.
A pesquisa recebeu o prêmio de melhor artigo científico apresentado no Encontro Nacional de Inteligência Artificial e Computacional, realizado em novembro de 2015, em Natal (RN). Inicialmente, foram 80 trabalhos submetidos por pesquisadores de todo o Brasil, dos quais 40 foram aceitos e, dentre esses, o nosso foi considerado o melhor. Tal distinção é um forte indicativo da qualidade dos projetos que vêm sendo desenvolvidos no Campus Sorocaba da UFSCar. Desde 2012, este é quinto prêmio consecutivo que o LaSID recebeu por pesquisas e publicações realizadas, comemora o docente.
"Pesquisas de opinião tradicionais são normalmente custosas, pois envolvem consultas individuais - seja por telefone ou por meio eletrônico - e a abrangência é frequentemente limitada [baixo volume de respostas]. Através desse sistema computacional inteligente, é possível analisar automaticamente a opinião de milhares de pessoas de qualquer lugar do mundo, em um curto espaço de tempo e com baixo custo", compara o professor Tiago Agostinho de Almeida, do Departamento de Computação (DComp) e coordenador do estudo que gerou a nova ferramenta. Com o sistema on-line, a análise se torna altamente dinâmica e pode ser usada rapidamente para atender a demanda do mercado e satisfazer os interessados em conhecer a opinião pública. Não obstante, a alta capacidade de abrangência permite que as análises se tornem muito mais robustas, confiáveis e, portanto, menos tendenciosas, avalia o professor.
Por exemplo, suponha que uma empresa tenha lançado um produto e gostaria de saber a opinião das pessoas a respeito dele. Atualmente, essa análise é feita, na maioria dos casos, por meio de questionários ou entrevistas realizadas com consumidores. Trata-se de um mecanismo lento e, muitas vezes, pouco representativo para obter opiniões. Com o sistema proposto, a empresa poderia obter essa análise de forma muito mais rápida e abrangente, pois milhares de mensagens postadas em redes sociais sobre o produto seriam coletadas e analisadas automaticamente, detalha Almeida.
Segundo o professor, um dos motivos do sistema proposto ter obtido melhores resultados que as técnicas tradicionais se deve à inovação da pesquisa que procurou aumentar a capacidade de processamento e análise de textos curtos e ruidosos como os que são comumente compartilhados nas redes sociais e pelo WhatsApp, através de smartphones.
Para o desenvolvimento do mecanismo, os pesquisadores propuseram um comitê composto por diversos métodos sofisticados de inteligência artificial e processamento de linguagem natural que são combinados automaticamente para processar mensagens de texto e predizer a opinião (muitas vezes implícita) expressa na mensagem, a respeito de algum objeto de interesse. O sistema realiza a "leitura", "interpretação" e detecção de contexto mesmo para mensagens repletas de gírias, símbolos, abreviações, emoticons etc. Além disso, articula técnicas de normalização léxica e indexação semântica para obter conceitos relacionados a termos isolados das mensagens. Dessa forma, é capaz de realizar a análise da opinião de maneira sensível ao contexto.
Por exemplo, em um contexto político, na mensagem 'Ele é um porco!', a palavra porco evidencia uma opinião negativa com relação a alguém. Porém, no contexto de uma conversa sobre animais, a mesma palavra não indica nenhuma opinião, mas apenas faz referência ao animal. Assim, através de técnicas modernas de detecção de contexto e indexação semântica, o sistema é capaz de discernir e analisar a opinião em mensagens de difícil interpretação até mesmo para humanos, ilustra o pesquisador.
Uma das grandes dificuldades encontradas ao analisar mensagens postadas em redes sociais é que elas geralmente são curtas e mal escritas, repletas de gírias, símbolos e abreviações, descreve o pesquisador. Por exemplo, a frase 'Por que você não vai também? Estou triste!' é comumente escrita como 'Pq vc naum vai tb? :('. Essas características impactam negativamente na representação e no processamento computacional, diz Almeida. Mas, esse desafio também foi superado com a ferramenta desenvolvida no Campus Sorocaba.
Realizado no período de 2012 a 2016, o estudo Análise de Sentimento de Mensagens de Texto via Comitê de Máquinas de Classificação envolveu dois alunos de mestrado e dois alunos de iniciação científica. A pesquisa contou com financiamento da Fapesp (de 2014 a 2016), além de uma bolsa Capes para o aluno de mestrado e duas bolsas de iniciação científica do CNPq.
Pesquisa premiada
O sistema foi testado com mensagens coletadas do Twitter, escritas em língua inglesa, em diversos contextos (filme, tecnologia, jogos eletrônicos, política etc). Os resultados obtidos foram superiores aos métodos tradicionais, comprovados por um rigoroso teste estatístico.
Almeida afirma que, de maneira prática, qualquer interessado em saber a opinião a respeito de alguma coisa (produto, serviço, pessoa, lugar, etc.) pode utilizar o sistema proposto para fazer essa análise, através do processamento massivo de uma grande quantidade de dados que podem ser obtidos, em tempo real, nas redes sociais. Imagine que uma pessoa está interessada em assistir o filme 'ABC' que acabou de estrear, mas antes gostaria de saber a opinião daqueles que assistiram. Você poderia usar o sistema para analisar em tempo real milhares de postagens em redes sociais e obter uma estimativa confiável da opinião dos telespectadores que fizeram comentários a respeito do filme nas últimas horas, reforça o pesquisador.
A pesquisa recebeu o prêmio de melhor artigo científico apresentado no Encontro Nacional de Inteligência Artificial e Computacional, realizado em novembro de 2015, em Natal (RN). Inicialmente, foram 80 trabalhos submetidos por pesquisadores de todo o Brasil, dos quais 40 foram aceitos e, dentre esses, o nosso foi considerado o melhor. Tal distinção é um forte indicativo da qualidade dos projetos que vêm sendo desenvolvidos no Campus Sorocaba da UFSCar. Desde 2012, este é quinto prêmio consecutivo que o LaSID recebeu por pesquisas e publicações realizadas, comemora o docente.
03/03/2017
03/03/2017
11:10:00
17/03/2017
23:59:00
Denise Britto
Sim
Não
Estudante, Docente/TA, Pesquisador, Visitante
Professor Tiago Agostinho de Almeida, que coordenou estudos do novo sistema. Foto: Rafaela Plinta
9424