Digitalização une técnicas de 3 séculos

Impressas em antigas rotativas e preservadas em papel e microfilme, 2,4 milhões de páginas do ‘Estado’ ganham existência digital

Edmundo Leite, de O Estado de S.Paulo,

23 de maio de 2012 | 19h00

SÃO PAULO - Do século 19 ao 21. Para unir formas de propagação da informação de eras distantes, a digitalização do Acervo Estadão recorreu a várias ferramentas tecnológicas. Do mais moderno sistema de busca à antiga microfilmagem mecânica. Checagens manuais em originais centenários, impressos desde 1875 em rotativas de tipos móveis descendentes da invenção de Gutemberg, complementavam a verificação realizada por sofisticados softwares de indexação.

O trabalho iniciado em 2010 mobilizou cerca de 60 profissionais de especializações distintas. Técnicos, designers, jornalistas, historiadores e arquivistas se revezaram nas tarefas de transformar as antigas folhas de papel em arquivos digitais.

O primeiro passo foi avaliar as condições dos microfilmes feitos nos anos 1970. Mesmo na era digital, microfilmes ainda são considerados o meio mais seguro para a preservação de documentos. Com durabilidade estimada em até 500 anos, os pequenos rolos com fotogramas das páginas foram escaneados por um equipamento especial.

A partir deste momento, cada página passou a existir em três formatos: nos originais de papel preservados em duas coleções encadernadas do jornal, nos microfilmes e nos arquivos digitais. Se as coleções ocupam um espaço físico que se espalha em mais de 200 metros lineares de armários deslizantes, no formato digital os números também são superlativos. Os 137 anos de publicação resultaram em 10 Terabytes de dados, o equivalente a 2.000 discos de DVDs.

Para encontrar o que foi impresso em cada um dos 2,4 milhões de páginas, foi usado um programa de reconhecimento ótico de caracteres (OCR), que consegue ler e buscar palavras em imagens digitais.

O dicionário Bluteau, o mais antigo da língua portuguesa, digitalizado pelo Instituto de Estudos Brasileiros (IEB), num trabalho coordenado pela professora Márcia Moisés Ribeiro, foi incorporado ao sistema. Com isso, ao procurar pela palavra "farmácia", o resultado também trará as ocorrências da palavra com a grafia antiga: "pharmacia".

"É um trabalho de arqueologia", diz João Cabral, diretor de Produtos Digitais do Grupo Estado, responsável pelo projeto. "Nem as mais futuristas das pessoas que escreveram para o jornal naquela época poderiam imaginar que seus textos pudessem ser lidos dessa maneira."

O acervo digital do Estado pode ser acessado em acervo.estadao.com.br.

Leia as matérias do caderno especial Estadão Acervo.

Tudo o que sabemos sobre:
acervo-estadao

Encontrou algum erro? Entre em contato

O Estadão deixou de dar suporte ao Internet Explorer 9 ou anterior. Clique aqui e saiba mais.