LEARNING WITH MASSIVE DATA
- Anno accademico
- 2022/2023 Programmi anni precedenti
- Titolo corso in inglese
- LEARNING WITH MASSIVE DATA
- Codice insegnamento
- CM0638 (AF:398307 AR:214340)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- ING-INF/05
- Periodo
- II Semestre
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Risultati di apprendimento attesi
Gli studenti acquisiscono conoscenze sulle architetture di calcolo parallelo, sui paradigmi e sugli ambienti di programmazione parallela, e sulla progettazione di algoritmi per dataset massivi.
Gli studenti raggiungeranno i seguenti risultati di apprendimento:
Conoscenza e comprensione: i) comprensione dei concetti base del multi-threading e del calcolo distribuito; ii) comprensione dei costi di un programma di analisi di dataset massivi parallelo e non (cache, memory, network) e loro modellazione; iii) comprensione dei pattern di progettazione di algoritmi per dataset massivi.
Capacità di applicare conoscenza e comprensione: i) capacità di progettare e sviluppare algoritmi per dataset massivi ii) capacità di stimare e misurare la performance di un algoritmo parallelo; iii) capacità di sviluppare algoritmi per dataset massivi tramite l'uso dei pattern di programmazione parallela
Capacità di giudizio: i) capacità di analizzare e confrontare differenti metodi o algoritmi e di scegliere la più appropriata ad un dato problema sulla base di un modello di costo
Abilità comunicative: i) saper esporre in maniera esaustiva i risultati sperimentali di una analisi comparativa tra differenti soluzioni e algoritmi
Prerequisiti
Contenuti
- Thread Parallelism
- Large-scale parallelism
- Recommender systems
- Learning to Rank
- Link Analysis
- Advertising on the Web
Testi di riferimento
Jure Leskovec, Anand RajaramanJeffrey David Ullman. Mining of Massive Datasets 3rd Edition. Cambridge University Press 2020.
Modalità di verifica dell'apprendimento
La prova scritta consiste in domande di carattere teorico sugli argementi trattati durante il corso.
Il progetto richiede di sviluppare un algoritmo per uno specifico problema di data anlysis. Lo studente deve scegliere e motivare la soluzione secondo lui più opportuna e consegnare un report che verrà discusso con il docente.