Melhores Práticas para Publicação de Dados Conectados

22 dez de 2017, por OKBR

Compartilhar

Por Thiago Ávila*

Dando continuidade à nossa série de artigos sobre Dados Abertos conectados, vamos detalhar, neste artigo, um importante trabalho desenvolvido pelo Government Linked Data Working Group (Grupo de Trabalho para os Dados Conectados Governamentais) [1], “Melhores Práticas para Publicação de Dados Conectados” (Best Practices for Publishing Linked Data) [2].

Este trabalho foi elaborado para compilar as práticas mais relevantes para a publicação e utilização de dados de alta qualidade publicados por governos ao redor do mundo, como os Dados Abertos Conectados, com o propósito de orientar a publicação, uso e reutilização de dados abertos governamentais. Tais praticas têm, como público-alvo, administradores e desenvolvedores de sítios Web bem como gestores e técnicos que atuam com gestão de informações governamentais [2].

É composto de 10 melhores práticas que consideram o nível de envolvimento de partes interessadas na publicação de dados, cuidados com a legalidade, modelagem, processamento e organização dos dados, semântica, tempestividade, alta disponibilidade dos dados e ainda, como deve ser feita a sua divulgação para o público e sua manutenção. São descritas resumidamente a seguir [2,3]:

 

  1. Preparar partes interessadas (Prepare stakeholders): Etapa que visa preparar as partes interessadas, em especial os decisores, sobre o processo de criação de manutenção de dados abertos conectados;
  2. Selecionar conjuntos de dados (Select data): Etapa que visa _a seleção dos dados que serão publicados bem como irão prover benefícios para os usuários, que poderão utilizá-los e reusa-los para diversas finalidades;
  3. Modelar os dados (Model the data): Esta etapa visa estabelecer uma melhor representação dos objetos de dados e como eles serão utilizados por aplicações de forma independente a sua origem;
  4. Especificar uma licença apropriada (Specify an Appropriated License): Visa o estabelecimento das condições de uso (e não uso) dos dados que serão publicados. O reuso dos dados ocorre com maior frequência quando existe clareza sobre a sua origem, propriedade (autoria) e demais condições relacionadas ao uso destes dados;
  5. Estabelecer bons identificadores universais (URIs) para dados conectados (The Role of “Good URIs” for Linked Data): O núcleo dos dados conectados se baseia num planejamento bem feito de identificação e referenciamento dos dados na Web, baseados em URIs HTTP. Devem ser estabelecidos os requisitos para objetos de dados, suporte a diversos idiomas, alteração de dados ao longo do tempo e estratégia de persistência
  6. Utilizar vocabulários padrão (Standard Vocabularies): Descrever objetos com vocabulários previamente definidos, sempre que possível. Quando necessário, ampliar tais vocabulários de acordo com a necessidade. Podem ser criados novos vocabulários (somente quando necessário) seguindo as melhores práticas para este fim.
  7. Converter e enriquecer dados (Convert Data to Linked Data): Esta etapa visa estabelecer as condições para a conversão e o enriquecimento de dados para dados conectados. Estão contempladas atividades técnicas de melhoria dos dados, como conversão para formatos mais apropriados, desenvolver serializações, dentre outras. Para esta pesquisa, serão consideradas tarefas técnicas que preparem os dados para que sejam conectados ou que sejam melhorados para serem conectados futuramente. Pode ser entendida como uma etapa de enriquecimento de dados. É uma atividade comumente realizada por scripts ou processos automatizados;
  8. Prover acesso automatizado aos dados (Provide Machine Access to Data): Devem ser providos diversos meios e formatos para que ferramentas de busca e outros recursos de processamento e consumo automatizado possam utilizar os dados mediante recursos padrões da Web;
  9. Anunciar os conjuntos de dados (Announce to the Public): Devem ser divulgados os novos dados publicados para que a comunidade possa fazer o devido uso;
  10. Estabelecer um contrato social para os dados publicados (Social Contract of a Linked Data Publisher): Esta etapa visa destacar a necessidade de se reconhecer a responsabilidade em garantir a disponibilidade, manutenção e atualização dos dados publicados. Por serem conectados, tais dados precisam ter a garantia que vão ficar disponíveis onde a organização publicadora estabelece e ainda, será mantido ao longo do tempo.

 

Nos próximos artigos desta série poderemos detalhar cada uma das melhores práticas apresentadas neste artigo.

Até a próxima!!!

* Thiago Ávila é conselheiro consultivo da Open Knowledge Brasil.

* Este artigo foi desenvolvido a partir da pesquisa de Mestrado “Uma Proposta de Modelo de Processo para Publicação de Dados Abertos Conectados Governamentais”, de autoria de Thiago José Tavares Ávila, decorrente de pesquisas científicas desenvolvidas no Núcleo de Excelência em Tecnologias Sociais (NEES), do Instituto de Computação da Universidade Federal de Alagoas (UFAL). Esta série de artigos contam com a contribuição dos pesquisadores Dr. Ig Ibert Bittencourt (UFAL), Dr. Seiji Isotani (USP), e Armando Barbosa, Danila Oliveira, Judson Bandeira, Thiago Ávila e Williams Alcântara (UFAL).

[1] W3C. (2011) Government Linked Data Working Group

[2] W3C (2014)  Best Practices for Publishing Linked Data. 2014. Acessado em 02/05/2017. 

[3] ÁVILA, T. J. T. Uma proposta de modelo de processo para publicação de dados abertos conectados governamentais. 223 p. Dissertação (Mestrado) — Instituto de Computação, Universidade Federal de Alagoas, Maceió, Alagoas, Brasil, 2015. Dissertação de Mestrado em Modelagem Computacional do Conhecimento.

Texto publicado no site Thiago Ávila. Ele faz parte da série de artigos Dados abertos conectados.