LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Anno accademico
- 2024/2025 Programmi anni precedenti
- Titolo corso in inglese
- LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Codice insegnamento
- ET7008 (AF:463487 AR:258201)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea
- Settore scientifico disciplinare
- INF/01
- Periodo
- 4° Periodo
- Anno corso
- 2
- Sede
- RONCADE
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Tali competenze richiedono una solida conoscenza teorica e pratica dell'analisi dei dati.
Questo corso ha l'obiettivo di insegnare agli studenti metodi e tecnologie per un'analisi dei dati efficace, discutendo le tecniche fondamentali per l'analisi predittiva e descrittiva dei dati. Durante le lezioni, saranno presentati vari strumenti e tecniche, sia dal punto di vista teorico che pratico, in modo che gli studenti possano confrontare tali strumenti ed estrarre conoscenza dai dataset presentati.
I risultati dell'analisi menzionata sono sfruttati come punto di partenza per ulteriori decisioni e considerazioni.
Risultati di apprendimento attesi
Gli studenti raggiungeranno i seguenti risultati di apprendimento, suddivisi in tre aree principali:
1. Conoscenza e comprensione:
- Comprendere le basi teoriche dei principali algoritmi presentati durante le lezioni;
- Comprendere i principi e le differenze degli algoritmi di apprendimento non supervisionato;
- Comprendere i principi e le differenze degli algoritmi di apprendimento supervisionato.
2. Applicazione delle conoscenze e comprensione in situazioni pratiche:
- Essere in grado di applicare tecniche di analisi supervisionate e non supervisionate appropriate ai dati;
- Essere in grado di utilizzare gli strumenti software per l'analisi dei dati utilizzati durante le lezioni (ad esempio, scikit-learn);
- Essere in grado di confrontare e interpretare correttamente i diversi risultati di analisi ottenuti da diversi algoritmi.
3. Comunicazione:
- Redigere un rapporto di analisi comparativa comprensivo tra i diversi metodi di analisi dei dati;
- Presentare i risultati con grafici e diagrammi appropriati.
Prerequisiti
Contenuti
- Approcci basati sui dati e Big Data
- Cos'è il Machine Learning e il Data Mining: concetti di approcci supervisionati e non supervisionati
- Tipologie di dati
- Gestione di un progetto di Data Science
2. Clustering:
- Riduzione della dimensionalità
- Valutazione della qualità del clustering
3. Apprendimento Supervisionato
- Addestramento, validazione e ottimizzazione dei modelli; Feature Engineering
- Classificazione; Regressione; Alberi decisionali
4. Ricerca di Similarità nei Testi
- Rappresentazione del testo; Tokenizzazione, Stemming, Lemmatizzazione; Spazio vettoriale; Misure di similarità
Testi di riferimento
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2nd ed.). O'Reilly Media.
Modalità di verifica dell'apprendimento
L'esame scritto richiederà agli studenti di rispondere a domande aperte sui contenuti del corso.
Il progetto richiede l'applicazione di metodi di analisi dei dati a un dataset di complessità limitata e comporta la conduzione di un'analisi comparativa di diversi strumenti applicati a un dataset o problema specifico. Lo studente deve scegliere e motivare la soluzione più appropriata e consegnare un rapporto che discuta un'analisi comparativa dei metodi scelti.