LAB OF INFORMATION SYSTEMS AND ANALYTICS

Anno accademico 2020/2021 Programmi anni precedenti
Titolo corso in inglese LAB OF INFORMATION SYSTEMS AND ANALYTICS
Codice insegnamento ET7008 (AF:304951 AR:170894)
Modalità Per la modalità didattica vedi gli orari delle lezioni
Crediti formativi universitari 6
Livello laurea Laurea
Settore scientifico disciplinare INF/01
Periodo 4° Periodo
Anno corso 2
Sede RONCADE
Spazio Moodle Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Uno dei ruoli principali del Digital Manager è quello di sfruttare le risorse disponibili per gestire processi di digitalizzazione e sviluppare soluzioni nell'ambito dell'Information Technology.
In particolare, lo studente di questo corso sarà in grado di sfruttare tecniche moderne di AI per estrarre dell'informazione significativa partendo da dati di vario genere.
Questo tipo di competenza prevede una forte conoscenza teorica e pratica delle tecniche di analisi di dati.

L'obiettivo del corso è quello di insegnare agli studenti metodi e tecnologia per effettuare analisi di dati e discutere delle tecniche fondamentali di analisi predittiva e descrittiva.
Durante le lezioni diversi strumenti e tecniche saranno presentate, dal punto di vista teorico e pratico in maniera tale che gli studenti possano essere in grado di confrontare i suddetti strumenti per estrarre dell'informazione significativa da questi.
Il risultato della sopracitata analisi potrà essere poi usato come punto di partenza per ulteriori considerazioni e conseguenti decisioni.
Risultati di apprendimento attesi
Alla fine del corso lo studente sarà in grado di applicare in maniera appropriata algoritmi e tecniche descrittive di dati e gestire gli strumenti presentati durante le lezioni.
Gli studenti saranno inoltre in grado di produrre uno studio comparativo con la rappresentazione dei dati.

Gli obiettivi di apprendimento possono essere suddivisi in tre aree:

1. Conoscenza e comprensione:
- capire le basi teoriche degli algoritmi principali presentati durante le lezioni
- capire principi e funzionamenti di tecniche di learning supervisionato
- capire principi e funzionamenti di tecniche di learning non supervisionato

2. Applicazione della conoscenza e comprensione in situazioni pratiche:
- essere in grado di applicare algoritmi di learning ai dati
- essere in grado di utilizzare gli strumenti visti a lezione
- essere in grado di comparare ed interpretare correttamente diversi risultati da diversi algoritmi

3. Comunicazione:
- presentare un'analisi comparativa di diversi metodi di analisi
- essere in grado di preentare correttamente i risultati attraverso grafici appropriati

Prerequisiti
Gli studenti devono aver acquisito le conoscenze di base necessarie nei corsi di "Introduction to Coding and Data Management" e "Probability and Statistics".
Contenuti
1. Introduzione a Data Science
2. Ricerca di similarità nei testi
- rappresentazione di testi, tokenizzazione, stemming, Lemmatization; Vector space; misure di similarità
3. Filtraggio Collaborativo ( content-based, item-based)
4. Clustering
- clustering basati su centroide, gerarchico, agglomerativo, density-based
5. Learning supervisionato
- training di modelli, validazione e tuning, classificazione, regressione, Feature Engineering, alberi decisionali
6. Apprendimento Ensemble
- Bagging e Boosting; Bias vs. Variance trade-off; Over-fitting e Under-fitting; Random Forest
Testi di riferimento
- Python Data Science Handbook. O’Reilly. 2016.
- Slides, appunti presentati durante le lezioni
Modalità di verifica dell'apprendimento
Gli obiettivi di apprendimento saranno verificati attraverso una serie di esercizi/report ed in maniera scritta.

Gli esercizi richiederanno di applicare tecniche di analisi di dati ad un dataset e di condurre uno studio comparativo.
Lo studente dovrà scegliere e motivare dettagliatamente attraverso una discussione le motivazioni della propria soluzione.
Metodi didattici
Lezioni frontali e sessioni di laboratorio.

Durante il corso verranno usati i seguenti strumenti: Jupyter, scikit-learn.
Lingua di insegnamento
Inglese
Modalità di esame
scritto e orale
Programma definitivo.
Data ultima modifica programma
03/02/2021