Além da enciclopédia, Wikimedia também tem uma biblioteca

05 out de 2014, por OKBR

Compartilhar

* Por Luiz Augusto Pereira Fernandes

Algo que muitas pessoas desconhecem ou pouco dão atenção é que a Wikimedia, apesar de comumente associada a seu mais popular projeto (Wikipédia), mantém uma dúzia de iniciativas. Todas elas promovem, dentro de várias especificidades, meios de “cada ser humano compartilhar livremente a soma de todo o conhecimento“.

Falarei a seguir um pouco do Wikisource mas, antes, gostaria de retomar um pouco dos anos iniciais da Wikipédia, para em seguida apresentar uma das formas de trabalho atual dentro dos Wikisources com possibilidade de cooperação entre bibliotecas e editores dos projetos Wikimedia.

[[Autor:Alexandre_de_Gusmão]], contendo breves informações biográficas e links para  algumas das obras já disponibilizadas parcialmente pelo Wikisource. O box controle de  autoridade permite o acesso aos principais websites com informações complementares sobre o autor e suas obras, sendo alguns deles gerados a partir de catálogos de bibliotecas.

[[Autor:Alexandre_de_Gusmão]], contendo breves informações biográficas e links para algumas das obras já disponibilizadas parcialmente pelo Wikisource. O box controle de autoridade permite o acesso aos principais websites com informações complementares sobre o autor e suas obras, sendo alguns deles gerados a partir de catálogos de bibliotecas.

Histórico

Ainda hoje encontramos alguns termos nas Wikipédias cujos links são vermelhos. É a forma como o software MediaWiki encontra para chamar a atenção de que esse termo ainda não possui uma página própria e que eventual clique resultará num formulário de edição convidando o internauta a escrever sobre ele. No começo da Wikipédia era extremamente comum se deparar com dezenas desses links a cada página. As pessoas os seguiam e tinham as mais diversas reações.

Caracteres aleatórios (para ver se era isso mesmo que entenderam, uma enciclopédia lhes chamando para iniciar uma definição), mensagens de desapontamento, infração de direitos autorais ao copiar texto de outro website e, ocasionalmente, linhas iniciais de um futuro verbete promissor eram algumas das reações que as pessoas tinham ao deparar-se com tais links. Nos links para títulos de livros certas vezes acontecia ainda outra coisa: a pessoa sabia onde encontrava a íntegra daquela obra e, ao invés de escrever sobre ela, colava seu conteúdo no espaço de edição. Muitos eram os casos de obras disponíveis em meio digital mas com alguma restrição de direito autoral. Muitos outros eram os casos de obras em domínio público ou sob uma licença livre.

Até 2003 todas essas páginas eram marcadas para eliminação ou recicladas em verbetes. Mas, os editores da Wikipédia em inglês tiveram a idéia de reunir o envio das íntegras desses textos em um espaço próprio. O nome inicial era simultaneamente um improviso e um trocadilho: Project Sourceberg. “Source” se referindo à natureza dos materiais enviados (textos-fonte para estudos futuros), “berg” em alusão ao Project Gutenberg, já existente, mas com procedimentos de disponibilização de materiais diferentes dos de se publicar em uma plataforma wiki.

Desdobramentos diversos foram ocorrendo ao longo dos anos. De um wiki único a cerca de sessenta wikis divididos por idiomas mais um wiki geral de coordenação e para as línguas que ainda possuem pouco material disponível. Ou, se você preferir, uma rede de bibliotecas em meio wiki, especializadas por idiomas.

Comum a essa rede de wiki-bibliotecas, pequenos fatos isolados e repetidos foram ocorrendo. Várias pessoas não conseguiam confiar em um ambiente plenamente editável para consultar uma obra já existente e “finalizada”. Outras, confundiam o Wikisource com a Wikipédia e começavam a tentar corrigir informações datadas ou superadas. Outras, ainda, tentavam alterar erros tipográficos e de pontuação, propositais ou acidentais, dos textos originais.

Originais de obras digitalizadas e potencialidades

Bibliotecas em diversos locais do mundo têm iniciado ou ampliado seus esforços de digitalização de materiais. Essas digitalizações normalmente são feitas em um esforço simultâneo de preservação das peças originais e de disseminação desses mesmos materiais.
As peças mais vulneráveis a danos ou extravios são as obras raras. Existem critérios diversos para que um livro ou outro material possa ser considerado como raro. Mas, como um deles refere-se à antiguidade da obra, muitas vezes existirão livros que são raros e em domínio público por sua antiguidade. Geralmente são as digitalizações desse tipo específico de obras que as bibliotecas disponibilizam de forma irrestrita ao público, já que materiais mais recentes ainda estão sujeitos a direitos autorais. A partir dessa constatação que programadores voluntários desenvolveram uma extensão ao MediaWiki que permite trabalhar com essas digitalizações a partir do Wikisource.

É importante notar que, com isso, surgiram oportunidades diversas a três públicos diferentes (editores do Wikisource, bibliotecas e outras instituições que assumem para si a missão de colecionar e preservar materiais e, ainda, editores da Wikipédia). Os três têm a mesma finalidade – a disseminação do conhecimento – e poderão se unir em torno de uma mesma digitalização para atingir esse objetivo.

Tela de edição de uma página específica do livro. À direita, imagem digitalizada da página. À esquerda, box de edição do texto correspondente à página. O link instrumentos de  revisão incluem recursos para aumento ou redução de zoom da imagem exibida, bem  como alternância entre a tela atual de edição ou com a digitalização sendo exibida acima  e a caixa de edição exibida abaixo. Esta tela em específico contém o texto de OCR bruto,  gerado de forma automática ao se seguir um dos links vermelhos ilustrados da tela anterior.

Tela de edição de uma página específica do livro. À direita, imagem digitalizada da página. À esquerda, box de edição do texto correspondente à página. O link instrumentos de revisão incluem recursos para aumento ou redução de zoom da imagem exibida, bem como alternância entre a tela atual de edição ou com a digitalização sendo exibida acima e a caixa de edição exibida abaixo. Esta tela em específico contém o texto de OCR bruto, gerado de forma automática ao se seguir um dos links vermelhos ilustrados da tela anterior.

Há casos bem sucedidos dessa união de interesses e recursos, mas se debruçar neles infelizmente causaria a perda de foco deste texto. Esquematizando brevemente:

  • A biblioteca (ou instituição congênere) preserva o item em seu meio impresso e o digitaliza, com recursos próprios ou através de parcerias que possam ser viabilizadas inclusive com os colaboradores de projetos Wikimedia;
  • Os editores do Wikisource e/ou da Wikipédia poderão ajudar a instituição a definir os direitos autorais de cada um dos itens;
  • Os itens em domínio público poderão ter suas digitalizações hospedadas tanto em servidores da própria instituição, quanto diretamente nos servidores da Wikimedia Foundation. A segunda opção, aliás, poderia significar inclusive considerável redução de custos para programas de digitalização de materiais. Hospedar as digitalizações de forma simultânea em ambos os ambientes seria igualmente possível e viável;
  • A partir da extensão ao MediaWiki, editores do Wikisource são capazes de fazer a conversão das digitalizações e respectivos textos reconhecidos por OCR para hipertexto. A partir do hipertexto, por sua vez, uma outra ferramenta é capaz de transformar esses conteúdos em ePub, que fornecerá uma experiência de leitura em meio digital muito mais adequada do que se fosse pela digitalização bruta em si;
  • Se nós estivermos nos referindo a uma obra que contenha ilustrações, tais como dicionários ou enciclopédias, essas ilustrações poderão ser aproveitadas em diversos verbetes da Wikipédia. O texto de obras de referência, aliás, poderá ser utilizado como base a novos verbetes, cabendo aos editores da Wikipédia realizarem as devidas atualizações de seus dados.

Claro que será possível que editores interessados pelo Wikisource e/ou pela Wikipédia explorem essas potencialidades de forma individual, sem contar com nenhuma espécie de apoio das instituições guardiãs dos livros originais (por, dentre outros fatores, digitalizações brutas de materiais em domínio público serem igualmente de domínio público) mas, todos sairiam ganhando se esses esforços se dessem de forma conjunta. As próprias bibliotecas poderiam, dentre outras coisas, economizar recursos ao digitalizarem apenas itens ainda não disponibilizados por outras instituições, utilizando o Wikisource tanto para controle do que já está em meio digital (inclusive verificando sua qualidade de digitalização, que incluiria a apuração se eventuais lacunas de páginas se devem por falhas já no exemplar impresso ou por erro operacional ao digitalizar). Existirão casos em que uma re-digitalização se justifique por motivos além dos de qualidade (presença de autógrafos ou anotações no exemplar específico), mas a atual duplicação descontrolada de digitalizações não parece ter tais características.

Instituições cristalizadas há décadas ou séculos poderão possuir ressalvas em confiar à Wikimedia Foundation, existente há cerca de onze anos, a tutela de seus objetos digitais. Mas, além de onze anos para instituições baseadas em internet ser um tempo considerável, todos os conteúdos de todos os projetos Wikimedia são disponibilizados ao público em conjuntos e formatos voltados especificamente ao espelhamento. Ou seja, mesmo com alguma fatalidade ocorrendo, as perdas poderão ser consideravelmente minimizadas.

(*) Luiz Augusto Pereira Fernandes é voluntário nos projetos da Wikimedia Foundation desde 2004 e formando em Biblioteconomia e Ciência da Informação pela Fundação Escola de Sociologia e Política de São Paulo (FESPSP).