Consegnati a Venezia i primi risultati di Venice Time Machine

condividi
condividi

Consegnati a Venezia i primi risultati della Venice Time Machine: 190mila documenti d’archivio, 720mila documenti fotografici, 3000 libri per un totale di 2 milioni di immagini scansionate.

Raffaele Santoro, Direttore dell’Archivio di Stato di Venezia, Frédéric Kaplan direttore del DHLab del Politecnico di Losanna e Responsabile del progetto Venice Time Machine e Dorit Raines, Docente di Storia delle Biblioteche e della Documentazione e Presidente del Sistema Bibliotecario dell’Università Ca’ Foscari Venezia, hanno presentato i primi concreti risultati delle campagne di digitalizzazione del patrimonio archivistico, librario e iconografico di Venezia: si tratta di veri e propri monumenti digitali, presto esplorabili con nuove interfacce digitali.

Nell’arco di 2 anni di attività sono stati digitalizzati:

190mila documenti dell’Archivio di Stato di Venezia

720mila immagini della Fototeca della Fondazione Giorgio Cini

3000 volumi riguardanti Venezia e la sua storia provenienti dalle più importanti biblioteche cittadine (Biblioteca Nazionale Marciana, Sistema Bibliotecario d’Ateneo e la Biblioteca di Area Umanistica dell’Università Ca’Foscari Venezia, Istituto Veneto di Scienze, Lettere ed Arti).

In totale, oltre 2 milioni di pagine e immagini


Le fonti – Che cosa è stato digitalizzato

La digitalizzazione in Archivio di Stato ha avuto per oggetto 250 anni di fondi fiscali e catastali dal 1514 al 1740 (Dieci Savi alle Decime).

La Repubblica di Venezia dalla fine del XV secolo istituì un sistema di rilevazione delle ricchezze possedute dagli abitanti di Venezia e del dogado, ai fini di una tassazione diretta sugli stessi beni. Le fonti fiscali e catastali rappresentano l’ossatura informativa dell’analisi urbana perché permettono di ricostruire, attraverso i secoli e in modo molto preciso, le localizzazioni dei beni immobili, chi erano i proprietari, gli affittuari, le funzioni e le loro rendite. Questo permette di avere una mappatura completa delle chiavi primarie di accesso ai documenti: nomi di persone, luoghi e date. Le fonti in Archivio di Stato sono state digitalizzate con scanner planare semiautomatico adatto ai manoscritti e a documenti fragili di grande formato. Le acquisizioni sono conformi ai più alti standard di conservazione digitale per il patrimonio culturale.

Nelle più importanti biblioteche cittadine (Biblioteca Nazionale Marciana, Sistema Bibliotecario d’Ateneo e la Biblioteca di Area Umanistica dell’Università Ca’Foscari, Istituto Veneto di Scienze, Lettere ed Arti) sono stati digitalizzate le fonti secondarie, libri e periodici, che trattano 200 anni di storiografia veneziana nei suoi molteplici aspetti: culturale, sociale, economica, artistica, architettonica, urbana, istituzionale e diplomatica. Una grande parte, quindi, del sapere già prodotto dagli storici e dai loro studi su Venezia costituirà una fonte complementare collegata alle fonti primarie. Per l’acquisizione delle fonti secondarie ci si è serviti di una tecnologia di scanner robotici capaci di girare le pagine automaticamente.

Le 720.000 scansioni di fonti iconografiche digitalizzate alla Fondazione Giorgio Cini integrano la tipologia documentaria accessibile al pubblico e agli studiosi. La fototeca, costituita una trentina di fondi fotografici differenti, rappresenta un importante corpus di immagini dedicate soprattutto al Veneto e a Venezia e permette di ripercorrere visivamente, anche opere d’arte in istituzioni italiane e musei stranieri raccolte in collezioni private. Vi sono immagini di dipinti, incisioni, opere grafiche, sculture, interni di monumenti architettonici e luoghi d’arte. Per i fondi fotografici della Fondazione Giorgio Cini è stata prodotta e certificata una nuova tipologia di scanner, in collaborazione con Adam Lowe di Factum Arte Madrid, capace di numerizzare un documento recto-verso ogni quattro secondi.


L’estrazione di dati

Alla campagna di digitalizzazione è seguita una incessante opera di ‘annotazione’ dei documenti scansionati per estrarre i dati importanti per il sistema informativo.

In Archivio di Stato sulle fonti documentarie sono state prodotte da storici, paleografi e archivisti, oltre 160.000 trascrizioni manuali di nomi, luoghi e parole chiave. Grazie a queste annotazioni è stato sviluppato un sistema

automatico di riconoscimento delle scritture capace di trascrivere parole che non erano state annotate precedentemente con una percentuale di errore, su ogni carattere, intorno al 10%. Questo livello di performance permette di ritrovare nomi nei documenti anche se non sono stati trascritti manualmente.

Sulle fonti secondarie sono state prodotte manualmente circa 200.000 annotazioni di riferimenti bibliografici, in nota a piè di pagina e bibliografia. Grazie a queste annotazioni è stato sviluppato un sistema automatico di riconoscimento che ha permesso di estrarre 3 milioni di riferimenti bibliografici.

Dalle fonti iconografiche sono state estratti tutti i dati testuali relativi alla loro collocazione, soggetto, autore e altro, ovvero tutte le informazioni utili che permettono di ritrovare le immagini con chiavi testuali. Grazie a migliaia di annotazioni manuali è stato possibile sviluppare un sistema che riconosce le similarità tra immagini.


Accesso al patrimonio digitale

Il patrimonio digitale sarà accessibile attraverso dei motori di ricerca: Canvas, Replica, e Linked Books.

Canvas è un motore di ricerca e un’interfaccia di visualizzazione e annotazione di documenti. Può essere utilizzato per visualizzare i documenti d’archivio in originale e come spazio di lavoro per annotarli direttamente seguendo degli schemi strutturati. Il motore di ricerca di Canvas permette di cercare parole chiave tra i contenuti già annotati e parole che il sistema è stato capace di leggere automaticamente. Il lavoro sui documenti svolto dai ricercatori può così essere facilmente condiviso rendendo più efficace l’accesso alle fonti storiche.

Linked Books è un motore di ricerca bibliografico capace di cercare le connessioni tra fonti secondarie (libri e articoli) e primarie (i documenti d’archivio). È possibile ad esempio accedere a tutte le voci bibliografiche che citano un documento e viceversa vedere tutti i documenti citati in un contributo bibliografico. Questo permette per la prima volta di vedere nel tempo l’evoluzione della storia della storiografia veneziana.

Replica è un motore di ricerca iconografico che permette di esplorare, con diverse chiavi di accesso, grandi collezioni iconografiche. Le opere della fototeca della Fondazione Giorgio Cini possono essere esplorate seguendo i dati testuali come l’autore o una data specifica ma anche navigando tra i legami visivi tra opere e i loro dettagli. Questa tipologia di accesso alle collezioni fotografiche è un’assoluta novità perché permette di visualizzare le genealogie visive e la circolazione di motivi nell’arte veneziana.

I motori di ricerca saranno testati nei prossimi mesi presso le Istituzioni veneziane prima di essere messi on line a disposizione di un pubblico più ampio. Oltre alla campagna di digitalizzazione massiva per la conservazione del patrimonio lo sviluppo di queste interfacce dimostra, con la collaborazione di tutti gli specialisti, archivisti e studiosi coinvolti, un metodo alternativo per accedere patrimonio culturale digitale e sperimentare nuovi metodi per produrre conoscenza.