STATISTICAL INFERENCE AND LEARNING
- Anno accademico
- 2026/2027 Programmi anni precedenti
- Titolo corso in inglese
- STATISTICAL INFERENCE AND LEARNING
- Codice insegnamento
- CM0471 (AF:577103 AR:323997)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- SECS-S/01
- Periodo
- I Semestre
- Anno corso
- 2
- Sede
- VENEZIA
Inquadramento dell'insegnamento nel percorso del corso di studio
Risultati di apprendimento attesi
1. conoscenza e comprensione:
- conoscere e comprendere i principi fondamentali dell'inferenza statistica in ambito frequentista e in ottica Bayesiana.
- conoscere e comprendere metodi avanzati di apprendimento statistico dell’informazione per la previsione
2. capacità di applicare conoscenza e comprensione:
- implementare autonomamente metodi di inferenza statistica per la stima e l’apprendimento dell’informazione
- applicare tecniche di simulazione statistica (bootstrap, jackknife, metodi Monte Carlo) per l'inferenza e la valutazione dei modelli
- utilizzare in modo autonomo il linguaggio R per analizzare dataset anche ad alta dimensionalità
3. capacità di giudizio:
- esprimere valutazioni autonome rispetto alla validità e alla fattibilità di diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
- scegliere consapevolmente tra approcci frequentisti e bayesiani in funzione del problema e dei dati a disposizione
Prerequisiti
Contenuti
1. Principi dell'inferenza statistica — stima puntuale ed intervallare in ottica frequentista;
2. Verifica delle ipotesi — test d’ipotesi classici, tipo di controllo dell'errore nei test multipli;
3. Regressione lineare — stima, inferenza, diagnostica e implementazione computazionale
4. Metodi non parametrici — random forest, gradient boosting e altri metodi di stima non parametrica
5. Simulazione nell'inferenza statistica — bootstrap, jackknife e metodi Monte Carlo
6. Elementi di statistica bayesiana — Concetti di base. Distribuzione a priori, verosimiglianza, distribuzione a posteriori. Stima e diagnostica.
L'approccio del corso è fortemente computazionale: le tecniche vengono implementate in R (www.r-project.org) a partire dai principi, limitando l'uso di pacchetti predefiniti con lo scopo di programmare i metodi ad-hoc grazie ad R e RStudio.
Testi di riferimento
• James G., Witten D., Hastie T., Tibshirani R. (2023), An Introduction to Statistical Learning, 2ª ed., Springer (https://www.statlearning.com/ ) — Di riferimento per il controllo nei test d’ipotesi con confronti multipli
• Gelman A. et al. (2013), Bayesian Data Analysis, 3ª ed., Chapman & Hall (https://sites.stat.columbia.edu/gelman/book/BDA3.pdf ) — riferimento per la statistica bayesiana (argomento 6)
• Letture e materiali integrativi distribuiti durante il corso tramite la piattaforma Moodle
Modalità di verifica dell'apprendimento
La durata totale sarà di 2 ore. Ogni studente analizzerà un dataset fornito dal docente e risponderà a domande di carattere metodologico.
La valutazione complessivamente sono progettate per misurare:
- (1) la conoscenza della teoria degli argomenti del corso,
- (2) qualità e correttezza delle analisi statistiche condotte
- (3) uso appropriato della terminologia tecnica
- (4) correttezza e coerenza delle conclusioni
Il punteggio massimo per ciascuna parte è 16 punti e il punteggio finale è dato dalla somma dei punteggi delle due parti.
Per superare l'esame è necessario ottenere almeno 9 punti in ciascuna delle due parti. Se la prima parte non risulta sufficiente, la seconda parte non verrà corretta. Un punteggio complessivo superiore a 30 punti corrisponde alla lode. Durante l'esame è consentito l'uso di un formulario reso disponibile dal docente e del software R/RStudio. La prova si svolge in modalità closed-book: non è consentita la consultazione di libri, appunti o materiali di alcun tipo.
Una verifica orale potrebbe essere richiesta per la conferma del voto finale.
Importante:
È prevista una prova intermedia dopo la metà del corso, corrispondente alla prima parte dell'esame (due domande teorico-metodologiche e un esercizio pratico). Se la prova intermedia è superata con un punteggio di almeno 9 punti, lo studente potrà sostenere esclusivamente la seconda parte dell'esame durante il primo appello. In questo caso, il punteggio finale sarà dato dalla somma del punteggio ottenuto nella prova intermedia e del punteggio ottenuto nella seconda parte dell'esame del primo appello.
Modalità di esame
Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.
Graduazione dei voti
- sufficiente (18–22 punti), se lo studente dimostra una sufficiente conoscenza e comprensione dei metodi del corso, è in grado di applicarli e interpretarli adeguatamente e utilizza correttamente la terminologia tecnica;
- discreta (23–25 punti), se lo studente mostra una buona conoscenza e comprensione dei metodi del corso, li applica e interpreta in modo convincente e usa la terminologia tecnica con discreta accuratezza;
- buona (26–28 punti), se lo studente possiede una solida conoscenza e comprensione dei metodi del corso, li applica e interpreta in maniera del tutto convincente e impiega la terminologia tecnica in modo accurato;
- ottima (29–30 punti), se lo studente dimostra un’eccellente conoscenza e comprensione dei metodi del corso, li applica e interpreta in modo brillante e utilizza la terminologia tecnica con estrema accuratezza.
La lode è riservata agli studenti che, oltre ad aver ottenuto un risultato ottimo, dimostrano un impegno eccezionale nella svolgimento e nella presentazione del progetto, apportando contributi o spunti originali.
Metodi didattici
Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle.
Il software statistico utilizzato nel corso è R (www.r-project.org).