Eb tecnologia: differenze tra le versioni

[versione verificata][versione verificata]
(Creata pagina con "'''Tecnologia utilizzata''' L'applicativo utilizzato per gestire l'Enciclopedia è https://www.mediawiki.org/wiki/MediaWiki MediaWiki, della Wikimedia Foundation, lo stes...")
 
Riga 1: Riga 1:
'''Tecnologia utilizzata'''
+
== Tecnologia utilizzata ==
  
L'applicativo utilizzato per gestire l'Enciclopedia è [[https://www.mediawiki.org/wiki/MediaWiki MediaWiki]], della Wikimedia Foundation, lo stesso utilizzato per la nota Wikipedia.
+
=== SCANSIONE ED INTERPRETAZIONE (OCR) DI 22 VOLUMI ===
 +
In seguito ad una preanalisi del materiale è stato possibile evidenziare i seguenti passaggi:
 +
** Effettuare la scansione dei 22 volumi.
 +
** In seguito alla scansione effettuare un riconoscimento dei caratteri tramite OCR di ultima generazione (impara dalle correzioni).
 +
** I primi 3 volumi dell'Enciclopedia sono stampati con una tecnica che richiede trattamento accessorio.
 +
** Fotografie e didascalie vanno adattate manualmente.
 +
** I dati ottenuti vanno confrontati con i file digitali esistenti per produrre un risultato ottimale.
 +
** Va fatta una correzione preliminare del testo per eliminare errori OCR e correggere eventuali refusi.
  
Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [[https://en.wikipedia.org/wiki/GNU_General_Public_License#Version_2 GNU GPL v.2]].
+
L'operazione di scansione e di OCR è stata effettuata da una struttura bresciana: [[http://www.labottegainformatica.it/ La Bottega Informatica]], una Cooperativa Sociale ONLUS.
 +
 
 +
Per velocizzare l'elaborazione le pagine dei volumi sono state separate:
 +
 
 +
[[file:scansione_01_preparare_libro.jpg|500px]]
 +
 
 +
Le pagine sono state poste nello scanner:
 +
 
 +
[[file:scansione_02_scanner.jpg|250px]]
 +
 
 +
Il personale della struttura ha verificato l'elaborazione dell'OCR:
 +
 
 +
[[file:scansione_03_scanner.jpg|500px]]
 +
 
 +
 
 +
=== APPLICATIVO PER L'ENCICLOPEDIA E TRAVASO DEI DATI ===
 +
Per poter pubblicare on-line i dati è necessario utilizzare un adeguato applicativo:
 +
** L'applicativo che sembra prestarsi meglio per questo tipo di opera è [[https://www.mediawiki.org/wiki/MediaWiki MediaWiki]], della Wikimedia Foundation, lo stesso utilizzato per la nota Wikipedia. Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [[https://en.wikipedia.org/wiki/GNU_General_Public_License#Version_2 GNU GPL v.2]].
 +
** È stata prevista una personalizzazione iniziale di MediaWiki per adattare il sistema alle peculiarità dell’Enciclopedia Bresciana.
 +
** A partire dai testi digitalizzati va realizzata con un programma ad hoc una strutturazione cui seguirà una classificazione, in modo che sia possibile inserire i dati nell'archivio dell'applicativo.
 +
** Va fatta a campione una revisione manuale delle voci importate automaticamente.

Versione delle 23:33, 23 mag 2016

Tecnologia utilizzata

SCANSIONE ED INTERPRETAZIONE (OCR) DI 22 VOLUMI

In seguito ad una preanalisi del materiale è stato possibile evidenziare i seguenti passaggi:

    • Effettuare la scansione dei 22 volumi.
    • In seguito alla scansione effettuare un riconoscimento dei caratteri tramite OCR di ultima generazione (impara dalle correzioni).
    • I primi 3 volumi dell'Enciclopedia sono stampati con una tecnica che richiede trattamento accessorio.
    • Fotografie e didascalie vanno adattate manualmente.
    • I dati ottenuti vanno confrontati con i file digitali esistenti per produrre un risultato ottimale.
    • Va fatta una correzione preliminare del testo per eliminare errori OCR e correggere eventuali refusi.

L'operazione di scansione e di OCR è stata effettuata da una struttura bresciana: [La Bottega Informatica], una Cooperativa Sociale ONLUS.

Per velocizzare l'elaborazione le pagine dei volumi sono state separate:

Scansione 01 preparare libro.jpg

Le pagine sono state poste nello scanner:

Scansione 02 scanner.jpg

Il personale della struttura ha verificato l'elaborazione dell'OCR:

Scansione 03 scanner.jpg


APPLICATIVO PER L'ENCICLOPEDIA E TRAVASO DEI DATI

Per poter pubblicare on-line i dati è necessario utilizzare un adeguato applicativo:

    • L'applicativo che sembra prestarsi meglio per questo tipo di opera è [MediaWiki], della Wikimedia Foundation, lo stesso utilizzato per la nota Wikipedia. Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [GNU GPL v.2].
    • È stata prevista una personalizzazione iniziale di MediaWiki per adattare il sistema alle peculiarità dell’Enciclopedia Bresciana.
    • A partire dai testi digitalizzati va realizzata con un programma ad hoc una strutturazione cui seguirà una classificazione, in modo che sia possibile inserire i dati nell'archivio dell'applicativo.
    • Va fatta a campione una revisione manuale delle voci importate automaticamente.