MACHINE LEARNING FOR DATA SCIENCE

Anno accademico
2026/2027 Programmi anni precedenti
Titolo corso in inglese
MACHINE LEARNING FOR DATA SCIENCE
Codice insegnamento
CT0659 (AF:521679 AR:301180)
Lingua di insegnamento
Inglese
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea
Settore scientifico disciplinare
INF/01
Periodo
I Semestre
Anno corso
3
Sede
VENEZIA
Il corso si basa sulle conoscenze acquisite nei precedenti insegnamenti di programmazione, statistica, analisi dei dati e machine learning introduttivo. A partire da tali competenze, il corso approfondisce modelli e metodologie di machine learning più avanzati, con particolare attenzione al loro impiego in applicazioni di data science.

L’insegnamento fornisce agli studenti strumenti concettuali e operativi per comprendere, progettare, addestrare, valutare e utilizzare modelli di machine learning. Il corso dedica particolare attenzione alle reti neurali, all’ottimizzazione dei modelli, al deep learning, ai modelli generativi e ai modelli basati su transformer.

I concetti teorici sono introdotti insieme a esempi e applicazioni, con l’obiettivo di sviluppare la capacità di ragionare sul comportamento dei modelli, sulle procedure di valutazione, sulle scelte sperimentali e sui limiti dei sistemi di machine learning.
Al termine del corso, gli studenti avranno acquisito conoscenze e competenze relative ai principali metodi di machine learning avanzato per applicazioni di data science, con particolare attenzione alla progettazione, all’addestramento, alla valutazione e all’uso critico dei modelli.

Gli studenti saranno in grado di comprendere i principi generali alla base dei modelli di machine learning avanzato, con particolare riferimento ai modelli neurali, ai metodi di deep learning e alle applicazioni moderne dell’intelligenza artificiale. Comprenderanno inoltre le principali fasi di sviluppo di un sistema di machine learning, dalla definizione del problema alla scelta dell’approccio metodologico, fino alla valutazione dei risultati.

Gli studenti saranno in grado di applicare metodi di machine learning a problemi di data science, utilizzare strumenti software appropriati, impostare un’analisi sperimentale, valutare i risultati ottenuti e discutere i limiti dell’approccio adottato.

Gli studenti saranno inoltre in grado di valutare criticamente la qualità di un modello, l’affidabilità dei risultati, le possibili fonti di errore o bias, e gli aspetti legati alla riproducibilità, alla qualità dei dati e all’uso responsabile delle tecnologie di intelligenza artificiale.

Infine, gli studenti saranno in grado di presentare in modo chiaro un progetto di machine learning, motivare le scelte metodologiche adottate, discutere i risultati ottenuti e approfondire autonomamente nuovi metodi, strumenti e applicazioni.
È richiesta una conoscenza di base della programmazione in Python, dell’algebra lineare, della probabilità, della statistica e dell’analisi dei dati.

È inoltre consigliata familiarità con i concetti di base del machine learning supervisionato e non supervisionato, con la suddivisione train/test, la cross-validation e la valutazione dei modelli.

È utile una conoscenza di base di librerie Python quali NumPy, pandas, matplotlib e scikit-learn. Non è richiesta una conoscenza preliminare di librerie di deep learning.
Il corso introduce metodi avanzati di machine learning per applicazioni di data science, con particolare attenzione ai modelli neurali, ai metodi di deep learning e alle applicazioni moderne dell’intelligenza artificiale.

Dopo un richiamo dei principali concetti metodologici necessari per l’analisi, l’addestramento e la valutazione dei modelli, il corso approfondisce l’uso di tecniche di machine learning per la costruzione di sistemi predittivi e generativi.

Saranno discussi aspetti relativi alla progettazione dei modelli, alla loro ottimizzazione, alla valutazione delle prestazioni e all’interpretazione dei risultati. Il corso potrà inoltre introdurre applicazioni recenti basate su modelli pre-addestrati, modelli generativi e sistemi intelligenti per l’elaborazione di dati complessi.

Particolare attenzione sarà dedicata agli aspetti metodologici e critici legati all’uso del machine learning in contesti applicativi, inclusi riproducibilità, affidabilità, limiti dei modelli, qualità dei dati, bias e uso responsabile dei sistemi di intelligenza artificiale.
Materiali didattici, slide, notebook e letture selezionate saranno resi disponibili su Moodle.

Saranno inoltre utilizzate documentazione e tutorial di scikit-learn, PyTorch, Hugging Face e librerie correlate. Ulteriori riferimenti potranno essere indicati durante il corso per argomenti specifici.
La verifica dell’apprendimento si basa su un lavoro di gruppo e su una discussione orale.

Il lavoro di gruppo richiede agli studenti di sviluppare e documentare un progetto coerente con gli argomenti del corso. Il progetto avrà l’obiettivo di applicare metodi di machine learning a un problema di data science, includendo la definizione del problema, la scelta dell’approccio metodologico, l’analisi dei dati, la valutazione dei risultati e la discussione dei limiti del lavoro svolto.

La discussione orale ha lo scopo di verificare la comprensione individuale degli argomenti trattati nel corso e delle scelte effettuate nel progetto. Durante l’orale, gli studenti potranno essere chiamati a presentare il lavoro svolto, motivare le principali decisioni metodologiche, interpretare i risultati ottenuti e discutere possibili miglioramenti.

La valutazione terrà conto della qualità complessiva del progetto, della correttezza metodologica, della chiarezza della presentazione, della capacità di analisi critica e della preparazione individuale dimostrata durante la discussione orale.
orale

Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.

La valutazione terrà conto del livello di comprensione degli argomenti del corso, della capacità di applicare in modo appropriato i metodi studiati, della qualità del progetto svolto e della capacità di discuterne criticamente risultati e limiti.

Una valutazione sufficiente sarà attribuita agli studenti che dimostrano una conoscenza di base degli argomenti trattati e una partecipazione adeguata al lavoro progettuale.

Una valutazione intermedia sarà attribuita agli studenti che dimostrano buona comprensione dei metodi, capacità di applicarli correttamente e chiarezza nella presentazione e discussione del progetto.

Una valutazione elevata sarà attribuita agli studenti che dimostrano solida comprensione metodologica, autonomia nell’analisi del problema, qualità nella realizzazione del progetto e capacità critica nella discussione dei risultati.

La lode sarà attribuita in presenza di eccellente comprensione degli argomenti, elevata qualità del lavoro progettuale, autonomia metodologica e ottima capacità comunicativa.
Il corso combina lezioni, esempi, casi di studio e attività computazionali. A seconda degli argomenti trattati, esempi ed esercizi in Python potranno essere utilizzati per illustrare l’implementazione e la valutazione dei modelli di machine learning.
Programma definitivo.
Data ultima modifica programma: 05/06/2026