STATISTICAL INFERENCE AND LEARNING

Anno accademico
2026/2027 Programmi anni precedenti
Titolo corso in inglese
STATISTICAL INFERENCE AND LEARNING
Codice insegnamento
CM0471 (AF:577103 AR:323997)
Lingua di insegnamento
Inglese
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
2
Sede
VENEZIA
L'insegnamento Statistical Inference and Learning è un corso a scelta del corso di laurea magistrale in Computer Science and Information Technology. Fornisce allo studente strumenti avanzati per l’analisi statistica dei dati con forte orientamento computazionale. L'obiettivo è sviluppare le competenze necessarie per affrontare problemi di inferenza e di previsione nei più svariati ambiti tecnologico-scientifici, con particolare enfasi sull'implementazione algoritmica delle tecniche studiate.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. conoscenza e comprensione:
- conoscere e comprendere i principi fondamentali dell'inferenza statistica in ambito frequentista e in ottica Bayesiana.
- conoscere e comprendere metodi avanzati di apprendimento statistico dell’informazione per la previsione
2. capacità di applicare conoscenza e comprensione:
- implementare autonomamente metodi di inferenza statistica per la stima e l’apprendimento dell’informazione
- applicare tecniche di simulazione statistica (bootstrap, jackknife, metodi Monte Carlo) per l'inferenza e la valutazione dei modelli
- utilizzare in modo autonomo il linguaggio R per analizzare dataset anche ad alta dimensionalità
3. capacità di giudizio:
- esprimere valutazioni autonome rispetto alla validità e alla fattibilità di diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
- scegliere consapevolmente tra approcci frequentisti e bayesiani in funzione del problema e dei dati a disposizione
Si assume che gli studenti abbiano competenze base di statistica descrittiva e probabilità ottenute durante la laurea triennale. In particolare, è importante che gli studenti abbiano piena dimestichezza con i concetti di base del calcolo delle probabilità e delle variabili casuali. In caso si raccomanda un ripasso dei primi due capitoli del testo di Bontempi G., Statistical Foundations of Machine Learning: The Handbook, Machine Learning Group, ULB.
Il programma del corso di Statistical Inference and Learning prevede la presentazione e la discussione dei seguenti argomenti:
1. Principi dell'inferenza statistica — stima puntuale ed intervallare in ottica frequentista;
2. Verifica delle ipotesi — test d’ipotesi classici, tipo di controllo dell'errore nei test multipli;
3. Regressione lineare — stima, inferenza, diagnostica e implementazione computazionale
4. Metodi non parametrici — random forest, gradient boosting e altri metodi di stima non parametrica
5. Simulazione nell'inferenza statistica — bootstrap, jackknife e metodi Monte Carlo
6. Elementi di statistica bayesiana — Concetti di base. Distribuzione a priori, verosimiglianza, distribuzione a posteriori. Stima e diagnostica.

L'approccio del corso è fortemente computazionale: le tecniche vengono implementate in R (www.r-project.org) a partire dai principi, limitando l'uso di pacchetti predefiniti con lo scopo di programmare i metodi ad-hoc grazie ad R e RStudio.
• Bontempi G., Statistical Foundations of Machine Learning: The Handbook, Machine Learning Group, ULB (https://dipot.ulb.ac.be/dspace/bitstream/2013/325210/3/syl.pdf ) — testo principale per gli argomenti 1–5
• James G., Witten D., Hastie T., Tibshirani R. (2023), An Introduction to Statistical Learning, 2ª ed., Springer (https://www.statlearning.com/ ) — Di riferimento per il controllo nei test d’ipotesi con confronti multipli
• Gelman A. et al. (2013), Bayesian Data Analysis, 3ª ed., Chapman & Hall (https://sites.stat.columbia.edu/gelman/book/BDA3.pdf ) — riferimento per la statistica bayesiana (argomento 6)
• Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle

La verifica dell'apprendimento avviene tramite un esame scritto costituito da due parti. Ogni parte comprende due domande teorico-metodologiche e un esercizio pratico.
La durata totale sarà di 2 ore. Ogni studente analizzerà un dataset fornito dal docente e risponderà a domande di carattere metodologico.
La valutazione complessivamente sono progettate per misurare:
- (1) la conoscenza della teoria degli argomenti del corso,
- (2) qualità e correttezza delle analisi statistiche condotte
- (3) uso appropriato della terminologia tecnica
- (4) correttezza e coerenza delle conclusioni

Il punteggio massimo per ciascuna parte è 16 punti e il punteggio finale è dato dalla somma dei punteggi delle due parti.
Per superare l'esame è necessario ottenere almeno 9 punti in ciascuna delle due parti. Se la prima parte non risulta sufficiente, la seconda parte non verrà corretta. Un punteggio complessivo superiore a 30 punti corrisponde alla lode. Durante l'esame è consentito l'uso di un formulario reso disponibile dal docente e del software R/RStudio. La prova si svolge in modalità closed-book: non è consentita la consultazione di libri, appunti o materiali di alcun tipo.
Una verifica orale potrebbe essere richiesta per la conferma del voto finale.

Importante:
È prevista una prova intermedia dopo la metà del corso, corrispondente alla prima parte dell'esame (due domande teorico-metodologiche e un esercizio pratico). Se la prova intermedia è superata con un punteggio di almeno 9 punti, lo studente potrà sostenere esclusivamente la seconda parte dell'esame durante il primo appello. In questo caso, il punteggio finale sarà dato dalla somma del punteggio ottenuto nella prova intermedia e del punteggio ottenuto nella seconda parte dell'esame del primo appello.
scritto

Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.

Il risultato dell’esame è valutato come segue:
- sufficiente (18–22 punti), se lo studente dimostra una sufficiente conoscenza e comprensione dei metodi del corso, è in grado di applicarli e interpretarli adeguatamente e utilizza correttamente la terminologia tecnica;
- discreta (23–25 punti), se lo studente mostra una buona conoscenza e comprensione dei metodi del corso, li applica e interpreta in modo convincente e usa la terminologia tecnica con discreta accuratezza;
- buona (26–28 punti), se lo studente possiede una solida conoscenza e comprensione dei metodi del corso, li applica e interpreta in maniera del tutto convincente e impiega la terminologia tecnica in modo accurato;
- ottima (29–30 punti), se lo studente dimostra un’eccellente conoscenza e comprensione dei metodi del corso, li applica e interpreta in modo brillante e utilizza la terminologia tecnica con estrema accuratezza.
La lode è riservata agli studenti che, oltre ad aver ottenuto un risultato ottimo, dimostrano un impegno eccezionale nella svolgimento e nella presentazione del progetto, apportando contributi o spunti originali.
Lezioni di teoria convenzionali accompagnate da esercitazioni in aula, discussione di casi studio e laboratori.
Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle.
Il software statistico utilizzato nel corso è R (www.r-project.org).
Programma definitivo.
Data ultima modifica programma: 16/04/2026