Ciência de Dados para Inovação Cívica recebe bolsa da Mozilla Research Projects

02 ago de 2018, por OKBR

Compartilhar

No último mês, a Operação Serenata de Amor, que integra nosso programa Ciência de Dados para Inovação Cívica, recebeu apoio da Mozilla Research Projects para avançar no processamento de linguagem natural de alguns de seus principais projetos, como o Querido Diário e o Perfil Político.

O Querido Diário faz a captura e análise de diários oficiais dos municípios para compreensão dos casos de dispensa de licitação. Atualmente, está presente em Goiânia e Porto Alegre, e em fase de construção para outros 40 municípios brasileiros. Já o Perfil Político pretende cruzar praticamente todos os bancos de dados públicos e oferecer informação jamais imaginada sobre o comportamento, intenções e histórico dos políticos.

Ambos os projetos lidam com textos corridos, por tratar-se da interpretação de diários oficiais, projetos de lei, relatórios e pareceres do legislativo. Na área técnica, esse tipo de trabalho, quando feito por robôs, é chamado de processamento de linguagem natural, também conhecido como PLN. Como a maior parte do que existe em PLN é feito pensando na língua inglesa, as ferramentas com textos em português não são capazes de entregar resultados satisfatórios. O jargão jurídico é outro obstáculo para a interpretação das máquinas.

Com esse desafio em mente, o programa enviou à Mozilla Research Projects um projeto de pesquisa com o título “A Brazilian bot to read government gazettes and bills: Using NLP to empower citizens and civic movements” (traduzindo para o bom PT-BR: “Um bot brasileiro para ler diários oficiais e contas do governo: usando PLN para empoderar cidadãos e movimentos cívicos”), que foi aprovado com uma bolsa.

Em breve, novidades a caminho.