O Livro dos 50 anos da Escola de Tropas Pára-quedistas

No livro dos 50 anos da Escola de Tropas Pára-quedistas consta a listagem oficial de todos os pára-quedistas militares portugueses que obtiveram com êxito o curso de pára-quedismo militar. Saiba como foi possível transcrever todos os dados para formato digital.

Ano de 2007. Introduzir dois milhões e duzentos mil caracteres num ficheiro informático não é tarefa fácil. Mais difícil quando se trata de copiar do papel para o computador os dados relativos aos cerca de quarenta e quatro mil pára-quedistas militares que receberam um número de brevet e que pertenceram a um determinado número de curso de pára-quedismo.
Uma vez que 50 anos de história de pára-quedismo em Portugal ficarão para sempre gravados na história futura, assim eu quero perpetuar o modo como os dados transitaram do papel para o computador. Para que todos saibam. Quando me foi dada a tarefa de passar os 44000 mil nomes dos livros de registo para formato digital, com o intuito futuro de serem incluídos no livro dos 50 anos da ETP, fiz um cálculo estimado do tempo, do trabalho e das dificuldades que iria encontrar.


Antes de começar

A ferramenta principal, além dos computadores – que já tinha disponíveis – era o pessoal para introduzir os dados. Não poderiam ser os recrutas ou pessoal pouco habituado a escrever no teclado (para minimizar os erros de introdução). Foram cedidos para este trabalho 30 pára-quedistas já formados. Dispunha deles, numa primeira fase, durante uma semana inteira e a tempo inteiro. Decidi logo que a introdução dos dados seria feita por binómio: um militar ditava enquanto o outro introduzia os dados. Podiam trocar de posição sempre que quisessem.

Os Livros dos registos

Os livros dos registos são seis. Um desses livros continha as folhas soltas, o que constituiu logo o primeiro problema: era impossível fazer corresponder bastantes “pares” de páginas, como se pode constatar. (clique na imagem para aumentar)

Uma grande quantidade de fotocópias estava ilegível. Os dados dos livros tinham sido inscritos através de máquina de escrever, e em livros com meio século de existência os dados tendem simplesmente a desaparecer). Assim, antes de distribuir as folhas pelos binómios verifiquei uma a uma se os dados estavam legíveis. Só assim poderia ter a certeza que iria ser feita uma cópia exacta e fiel dos dados inscritos nos livros.

Os livros foram fotocopiados e guardados novamente. Desta forma permitiu-se o manejo mínimo dos volumes, já de si gastos por cinco décadas de folhear…
No primeiro dia dei a missão aos binómios: sentaram-se na sala dos computadores e sob um calor intenso (cerca de 31 militares numa sala de 30 metros quadrados e com 15 computadores a trabalhar produzem muito calor), dei indicação para que todos fizessem um modelo igual no Excel, isto para que no final e ao juntar todos os ficheiros não houvesse qualquer discrepância, engano ou erro.

Os problemas durante a introdução dos dados

Os livros em si já continham erros: nomes próprios em letra minúscula, erros ortográficos, duplicados, omissões, rasuras, etc.
Dei indicações para que nada disso fosse alterado: Era para introduzir exatamente igual ao que estava nos livros, mesmo sabendo que alguns desses erros teriam que ser reparados mais tarde, um problema a ser tratado posteriormente.
Frisei várias vezes para que fizessem cópias de segurança regulares enquanto introduziam dados. Alguns não faziam e mais tarde pagavam isso com o reiniciar do trabalho (numa manhã faltou a luz após 2 horas de introdução de dados).

A generalizada pouca experiência dos militares aliada ao progressivo cansaço implicava uma atenção permanente à medida que os dias passavam e que parecia que o trabalho não andava. Permitia-lhes vários intervalos regulares e mesmo alguns momentos de distração. O meu objectivo não era pressioná-los, pois sabia que ao fazê-lo arriscar-me-ia a obter dados errados.
Sob um calor intenso e durante 2 semanas os dados foram sendo introduzidos nos 30 ficheiros de Excel.
O trabalho só estava a meio.

Um vídeo elucidativo da inserção dos dados nos computadores pode ser visto à direita.

A desvantagem de ter usado o Excel


Dos programas disponíveis para a inserção dos dados, elegi o Excel por ser o mais adequado. No entanto encontrei algumas desvantagens:
1 - O excel é limitado na quantidade de informação que consegue gerir. Tive que trabalhar com 5 ficheiros separados, pois quando tentava compilar 1 só ficheiro, o excel simplesmente bloqueava.

2 - Durante a introdução dos dados e ao iniciar a introdução dum número na respectiva célula, o excel queria fazer o preenchimento automático, usando um número introduzido anteriormente. Se o utilizador não estivesse atento a este pormenor introduzia o NIM/NIP/Nº de ordem errado. O mesmo se passava nas células onde se introduzia o nome completo dos pára-quedistas.

3 - Aconteceu algumas vezes: os ficheiros ficarem corrompidos de tanto abrir / fechar / gravar. Era uma sensação de frustração ter um ficheiro com dois mil nomes introduzidos e não poder aceder aos dados. A solução era começar de novo.

Outros problemas encontrados durante a introdução de dados:

1 - NIMS / NIPS / Números de Ordem iguais. Quando essa situação era encontrada a solução era deixar os dois militares com o mesmo número, pois era impossivel saber qual dos dois era o correcto.

2 - Erros nos nomes: Quando os nomes continham erros ortográficos elementares eram corrigidos, mas quando os erros suscitavam dúvida se seriam ou não um erro, eram deixados tal como estavam.

3 - Brevets não atribuídos, ou seja, as linhas estavam em branco. Manteve-se assim.

4 - Dados corrigidos à mão, riscados, rasurados, etc. Foram muitos, e nestes casos, adoptei a solução de aceitar as correcções manuais feitas posteriormente.


5 - Falta de dados. Por exemplo, do Brevet 20155 ao 20236 não têm qualquer número de ordem / Nip / Nim.

6 - Números de brevet não incrementados numa unidade, ou seja, os números não terem aparecido seguidos. O caso mais crónico é o que mostra a foto abaixo: Do número 32199 passa para o 33200, em vez de passar para o 32200. Mais à frente, esse erro é tentado corrigir mas provoca um erro maior ainda: Do 32200 ao 32339 não estão atribuídos.
Mais à frente passa do 33199 para o 33340. Foram omitidos no trabalho final por ser impossível outra solução.

Na foto abaixo é possível visualizar dados repetidos que ocorrem 100 números depois.

Fui de férias e levei comigo as 4 resmas de folhas impressas. Verifiquei folha a folha,  novamente os 44000 nomes comparando os dados impressos com os inscritos no computador. Erros que passaram na primeira vistoria foram corrigidos.
Depois passei à fase seguinte: Procurar duplicados. Manualmente tal operação era impossível de realizar. Usando uma fórmula no excel (para os curiosos aqui vai: =E(CONTAR.SE($D$2:$D$6809;$D2156)>1;Dupelink7;$D2156<>""), procurei e encontrei bastantes, tendo adotado as seguintes soluções:
1 - Nomes duplicados com números diferentes não foram alterados.
2 - Nomes duplicados sem número ou que suscitasse dúvida não foram alterados.
3 - Nomes duplicados exatamente iguais com números exatamente iguais: Foram eliminados quando ocorriam a primeira vez. Um exemplo concreto pode ser visto na imagem abaixo:

Se repararem no livro dos 50 anos, o brevet número 14587 está omitido. Deduzo que esta situação ocorreu quando o militar em questão não finalizava o curso de pára-quedismo e ingressava no seguinte. Por falta de coordenação ficou inscrito nos dois cursos.


Desta forma consegui verificar e corrigir duplicados em cada um dos ficheiros. Infelizmente não consegui fazê-lo entre os vários ficheiros, por limitações do excel, como referi atrás, pelo que houve alguns duplicados reais que permaneceram no trabalho final.O passo seguinte foi verificar os números dos cursos de pára-quedismo. Teria sido mais fácil se não houvesse discrepâncias entre o que estava escrito nos livros e o real. Havia situações em que estavam certos os dados dos livros, mas havia outras que o que estava certo era o real (quando digo real, significa que falei com pára-quedistas desses cursos). E houve ainda outras situações em que era impossível confirmar qual das duas situações era a correta. Face a este dilema optei pela solução de obter toda a informação doutra fonte presumivelmente fidedigna: As Ordens de Serviço. Durante três semanas, folhei todas as OS’s à procura dos números dos cursos de pára-quedismo e das datas de início e fim dos mesmos.


Enquanto folheava as Ordens de Serviço encontrava ocasionalmente o temível parágrafo que dizia: "Rectifica-se o publicado na OS nº W, onde se lê X deve-se passar a ler Y"! Isto significava que qualquer informação duma qualquer OS poderia não ser verdadeira e ser retificada 15 ou 20 Ordens de Serviço à frente! Houve alturas em que desesperava, pois com o tempo que dispunha era impossível folhear todas as Ordens de Serviço desde 1955 até 1998 (a partir de 1998 passaram a ser informatizadas). Usei algum pessoal disponível para me ajudar mas não chegou. Fiz muitas horas de pesquisa à noite, em casa (trazia os calhamaços e devolvia-os na manhã seguinte), contactei muitos pára-quedistas mais velhos e tirei muitas folhas de apontamentos.


Correlacionando todos os dados e depois de muitas verificações, perguntas, investigações e pesquisa cheguei ao trabalho final.

Na cerimónia de lançamento do livro.

Dedicatória inscrita no exemplar oferecido pelo então Comandante da Escola de Tropas Pára-quedistas, Coronel pára-quedista Carlos Perestrelo.

Dez anos mais tarde, já com um novo formato de página e com novas ferramentas (a par de mais conhecimentos), coloquei toda a base de dados disponível para consulta. Assim é possível agora consultar todos os pára-quedistas militares portugueses. Para consultar clique aqui.