COMPUTATIONAL PHILOLOGY: DATA STRUCTURES AND ALGORITHMS

Anno accademico
2021/2022 Programmi anni precedenti
Titolo corso in inglese
COMPUTATIONAL PHILOLOGY: DATA STRUCTURES AND ALGORITHMS
Codice insegnamento
FM0488 (AF:338877 AR:190760)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
L-LIN/01
Periodo
4° Periodo
Anno corso
2
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
Questo corso presenterà un approccio alla ricerca filologica che si posiziona all'intersezione tra le scienze testuali e i metodi computazionali, e pone al suo centro i dati testuali stessi, rivisitando sia il loro modo di produzione (*ecdotica computazionale*) che il loro processo analitico (*analisi computazionale*).

Le lezioni si alterneranno tra due aree principali.

1. Ecdotica computazionale

Questa parte tratterà i diversi aspetti del edizione critica e introdurrà all'uso di algoritmi di apprendimento automatico e reti neurali per il riconoscimento del testo manoscritto, l'annotazione linguistica e la lemmatizzazione, e ai metodi per la collazione assistita dal computer e la stemmatologia.

2. Analisi computazionale e stilometria

Questa seconda parte del corso si concentrerà sull'analisi computazionale dei dati testuali, con particolare attenzione alla stilometria e all'attribuzione della paternità. Si partirà da considerazioni generali sulla quantificazione delle caratteristiche testuali, e in particolare dei tratti individuali, e si presenterà una gamma completa di metodi di analisi, adatti a una varietà di contesti e obiettivi (testi anonimi, paternità contestata tra un insieme chiuso o aperto di candidati, verifica della paternità, ecc.), comprese le statistiche descrittive ed esplorative (riduzione della dimensionalità, ecc.), il clustering (ad es. clustering gerarchico) e metodi supervisionati (SVM e reti neurali).

Tradotto con www.DeepL.com/Translator (versione gratuita)
Alla fine di questo corso ci si aspetta che gli studenti siano in grado di eseguire analisi stilometriche, specialmente per l'attribuzione della paternità, così come di applicare strumenti e algoritmi essenziali per la produzione di corpora testuali ed edizioni digitali (riconoscimento del testo manoscritto, annotazione linguistica, collazione assistita dal computer, ecc.)
Non ci sono prerequisiti formali per questa classe, ma nozioni di filologia, così come nozioni di base di programmazione (in particolare con R e/o Python) saranno utili.
- Introduzione alla filologia computazionale

Ecdotica computazionale

- Acquisizione del testo e riconoscimento del testo manoscritto
- Normalizzazione e annotazione linguistica
- Allineamento e collazione
- Stemmatologia

Stilometria

- Esplorazione di un corpus anonimo e trattamento delle attribuzioni controverse.
- Riconoscere il tocco di un autore
- Profiling
- Aprire la scatola.
Stilometria

- CAFIERO (Florian), CAMPS (Jean-Baptiste), Affaires de style, Paris, 2022.
- JUOLA (Patrick), Authorship Attribution, Delft, 2008.
- KARSDORP (Folgert), KESTEMONT (Mike), and RIDDELL (Allen), Humanities Data Analysis: Case Studies with Python, 2021.

Ecdotica computazionale

- ANDREWS (Tara), “The third way: philology and critical edition for a digital age”, Variants: the Journal of the European Society for Textual Scholarship, 10 (2012), URL: http://boris.unibe.ch/43071/ .
- CAMPS (Jean-Baptiste), « La philologie computationnelle à l’École des chartes : premier bilan et perspectives » (to be published).
- CAMPS (Jean-Baptiste), ING (Lucence), and SPADINI (Elena), “Collating Medieval Vernacular Texts. Aligning Witnesses, Classifying Variants”, in DH2019 Digital Humanities Conference 2019.
La classe sarà valutata attraverso un caso di studio reale sull'attribuzione dell'autore. Squadre di studenti dovranno eseguire vari compiti per aiutare a identificare l'autore di un testo contestato. Se conclusivi, i risultati potrebbero anche essere presentati in una conferenza.
La classe conterrà una miscela di sviluppi teorici e pratici, con presentazione da parte dell'insegnante, così come la pratica sul computer, utilizzando gli strumenti e i linguaggi di programmazione adeguati. Alcune classi lasceranno spazio alle presentazioni dei loro risultati da parte degli studenti stessi.
Inglese
scritto e orale
Programma definitivo.
Data ultima modifica programma: 02/02/2022