Eb tecnologia: differenze tra le versioni
| [versione verificata] | [versione verificata] |
(Creata pagina con "'''Tecnologia utilizzata''' L'applicativo utilizzato per gestire l'Enciclopedia è https://www.mediawiki.org/wiki/MediaWiki MediaWiki, della Wikimedia Foundation, lo stes...") |
|||
| Riga 1: | Riga 1: | ||
| − | + | == Tecnologia utilizzata == | |
| − | + | === SCANSIONE ED INTERPRETAZIONE (OCR) DI 22 VOLUMI === | |
| + | In seguito ad una preanalisi del materiale è stato possibile evidenziare i seguenti passaggi: | ||
| + | ** Effettuare la scansione dei 22 volumi. | ||
| + | ** In seguito alla scansione effettuare un riconoscimento dei caratteri tramite OCR di ultima generazione (impara dalle correzioni). | ||
| + | ** I primi 3 volumi dell'Enciclopedia sono stampati con una tecnica che richiede trattamento accessorio. | ||
| + | ** Fotografie e didascalie vanno adattate manualmente. | ||
| + | ** I dati ottenuti vanno confrontati con i file digitali esistenti per produrre un risultato ottimale. | ||
| + | ** Va fatta una correzione preliminare del testo per eliminare errori OCR e correggere eventuali refusi. | ||
| − | Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [[https://en.wikipedia.org/wiki/GNU_General_Public_License#Version_2 GNU GPL v.2]]. | + | L'operazione di scansione e di OCR è stata effettuata da una struttura bresciana: [[http://www.labottegainformatica.it/ La Bottega Informatica]], una Cooperativa Sociale ONLUS. |
| + | |||
| + | Per velocizzare l'elaborazione le pagine dei volumi sono state separate: | ||
| + | |||
| + | [[file:scansione_01_preparare_libro.jpg|500px]] | ||
| + | |||
| + | Le pagine sono state poste nello scanner: | ||
| + | |||
| + | [[file:scansione_02_scanner.jpg|250px]] | ||
| + | |||
| + | Il personale della struttura ha verificato l'elaborazione dell'OCR: | ||
| + | |||
| + | [[file:scansione_03_scanner.jpg|500px]] | ||
| + | |||
| + | |||
| + | === APPLICATIVO PER L'ENCICLOPEDIA E TRAVASO DEI DATI === | ||
| + | Per poter pubblicare on-line i dati è necessario utilizzare un adeguato applicativo: | ||
| + | ** L'applicativo che sembra prestarsi meglio per questo tipo di opera è [[https://www.mediawiki.org/wiki/MediaWiki MediaWiki]], della Wikimedia Foundation, lo stesso utilizzato per la nota Wikipedia. Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [[https://en.wikipedia.org/wiki/GNU_General_Public_License#Version_2 GNU GPL v.2]]. | ||
| + | ** È stata prevista una personalizzazione iniziale di MediaWiki per adattare il sistema alle peculiarità dell’Enciclopedia Bresciana. | ||
| + | ** A partire dai testi digitalizzati va realizzata con un programma ad hoc una strutturazione cui seguirà una classificazione, in modo che sia possibile inserire i dati nell'archivio dell'applicativo. | ||
| + | ** Va fatta a campione una revisione manuale delle voci importate automaticamente. | ||
Versione delle 23:33, 23 mag 2016
Tecnologia utilizzata
SCANSIONE ED INTERPRETAZIONE (OCR) DI 22 VOLUMI
In seguito ad una preanalisi del materiale è stato possibile evidenziare i seguenti passaggi:
- Effettuare la scansione dei 22 volumi.
- In seguito alla scansione effettuare un riconoscimento dei caratteri tramite OCR di ultima generazione (impara dalle correzioni).
- I primi 3 volumi dell'Enciclopedia sono stampati con una tecnica che richiede trattamento accessorio.
- Fotografie e didascalie vanno adattate manualmente.
- I dati ottenuti vanno confrontati con i file digitali esistenti per produrre un risultato ottimale.
- Va fatta una correzione preliminare del testo per eliminare errori OCR e correggere eventuali refusi.
L'operazione di scansione e di OCR è stata effettuata da una struttura bresciana: [La Bottega Informatica], una Cooperativa Sociale ONLUS.
Per velocizzare l'elaborazione le pagine dei volumi sono state separate:
Le pagine sono state poste nello scanner:
Il personale della struttura ha verificato l'elaborazione dell'OCR:
APPLICATIVO PER L'ENCICLOPEDIA E TRAVASO DEI DATI
Per poter pubblicare on-line i dati è necessario utilizzare un adeguato applicativo:
- L'applicativo che sembra prestarsi meglio per questo tipo di opera è [MediaWiki], della Wikimedia Foundation, lo stesso utilizzato per la nota Wikipedia. Tale sistema nella versione di base è liberamente disponibile: si tratta infatti di un software free ed open source rilasciato con licenza [GNU GPL v.2].
- È stata prevista una personalizzazione iniziale di MediaWiki per adattare il sistema alle peculiarità dell’Enciclopedia Bresciana.
- A partire dai testi digitalizzati va realizzata con un programma ad hoc una strutturazione cui seguirà una classificazione, in modo che sia possibile inserire i dati nell'archivio dell'applicativo.
- Va fatta a campione una revisione manuale delle voci importate automaticamente.