LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Anno accademico
- 2020/2021 Programmi anni precedenti
- Titolo corso in inglese
- LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Codice insegnamento
- ET7008 (AF:338640 AR:170894)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea
- Settore scientifico disciplinare
- INF/01
- Periodo
- 4° Periodo
- Anno corso
- 2
- Sede
- RONCADE
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
In particolare, lo studente di questo corso sarà in grado di sfruttare tecniche moderne di AI per estrarre dell'informazione significativa partendo da dati di vario genere.
Questo tipo di competenza prevede una forte conoscenza teorica e pratica delle tecniche di analisi di dati.
L'obiettivo del corso è quello di insegnare agli studenti metodi e tecnologia per effettuare analisi di dati e discutere delle tecniche fondamentali di analisi predittiva e descrittiva.
Durante le lezioni diversi strumenti e tecniche saranno presentate, dal punto di vista teorico e pratico in maniera tale che gli studenti possano essere in grado di confrontare i suddetti strumenti per estrarre dell'informazione significativa da questi.
Il risultato della sopracitata analisi potrà essere poi usato come punto di partenza per ulteriori considerazioni e conseguenti decisioni.
Risultati di apprendimento attesi
Gli studenti saranno inoltre in grado di produrre uno studio comparativo con rappresentazione dei dati.
Gli obiettivi di apprendimento possono essere suddivisi in tre aree:
1. Conoscenza e comprensione:
- capire le basi teoriche degli algoritmi principali presentati durante le lezioni
- capire principi e funzionamenti di tecniche di learning supervisionato
- capire principi e funzionamenti di tecniche di learning non supervisionato
2. Applicazione della conoscenza e comprensione in situazioni pratiche:
- essere in grado di applicare algoritmi di learning ai dati
- essere in grado di utilizzare gli strumenti visti a lezione
- essere in grado di comparare ed interpretare correttamente diversi risultati da diversi algoritmi
3. Comunicazione:
- presentare un'analisi comparativa di diversi metodi di analisi
- essere in grado di presentare correttamente i risultati attraverso grafici appropriati
Prerequisiti
Contenuti
- Data-driven approaches and Big Data
- What is Machine Learning and Data Mining: concepts of supervised and unsupervised approaches
- Kinds of data
- Managing a Data Science project
2. Ricerca di similarità nei testi
- rappresentazione di testi, tokenization, stemming, Lemmatization; Vector space; misure di similarità
3. Clustering
- clustering basati su centroide, gerarchico, agglomerativo, density-based
- valutazione di modelli di clustering
4. Learning supervisionato
- training di modelli, validazione e tuning, Feature Engineering
- classificazione, regressione, alberi decisionali
5. Introduzione a CNN e Deep Learning
Testi di riferimento
- Data Science for Business. O'Reilly. 2013.
- Introduction to Machine Learning with Python. O'Reilly. 2016.
- Slides, appunti presentati durante le lezioni
Modalità di verifica dell'apprendimento
Il progetto richiederà di applicare tecniche di analisi di dati ad un dataset e di condurre uno studio comparativo.
Lo studente dovrà scegliere e motivare dettagliatamente attraverso una discussione le motivazioni della propria soluzione.
Modalità di esame
Metodi didattici
Durante il corso verranno usati i seguenti strumenti: Jupyter, scikit-learn.