LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Anno accademico
- 2025/2026 Programmi anni precedenti
- Titolo corso in inglese
- LAB OF INFORMATION SYSTEMS AND ANALYTICS
- Codice insegnamento
- ET7008 (AF:595136 AR:293524)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea
- Settore scientifico disciplinare
- INF/01
- Periodo
- 4° Periodo
- Anno corso
- 2
- Sede
- RONCADE
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Tali competenze richiedono una solida conoscenza teorica e pratica dell'analisi dei dati.
Questo corso ha l'obiettivo di insegnare agli studenti metodi e tecnologie per un'analisi dei dati efficace, discutendo le tecniche fondamentali per l'analisi predittiva e descrittiva dei dati. Durante le lezioni, saranno presentati vari strumenti e tecniche, sia dal punto di vista teorico che pratico, in modo che gli studenti possano confrontare tali strumenti ed estrarre conoscenza dai dataset presentati.
I risultati dell'analisi menzionata sono sfruttati come punto di partenza per ulteriori decisioni e considerazioni.
Risultati di apprendimento attesi
Gli studenti raggiungeranno i seguenti risultati di apprendimento, suddivisi in tre aree principali:
1. Conoscenza e comprensione:
- Comprendere le basi teoriche dei principali algoritmi presentati durante le lezioni;
- Comprendere i principi e le differenze degli algoritmi di apprendimento non supervisionato;
- Comprendere i principi e le differenze degli algoritmi di apprendimento supervisionato.
2. Applicazione delle conoscenze e comprensione in situazioni pratiche:
- Essere in grado di applicare tecniche di analisi supervisionate e non supervisionate appropriate ai dati;
- Essere in grado di utilizzare gli strumenti software per l'analisi dei dati utilizzati durante le lezioni (ad esempio, scikit-learn);
- Essere in grado di confrontare e interpretare correttamente i diversi risultati di analisi ottenuti da diversi algoritmi.
3. Comunicazione:
- Redigere un rapporto di analisi comparativa comprensivo tra i diversi metodi di analisi dei dati;
- Presentare i risultati con grafici e diagrammi appropriati.
Prerequisiti
Contenuti
- Approcci basati sui dati e Big Data
- Cos'è il Machine Learning e il Data Mining: concetti di approcci supervisionati e non supervisionati
- Tipologie di dati
- Gestione di un progetto di Data Science
2. Clustering:
- Riduzione della dimensionalità
- Valutazione della qualità del clustering
3. Apprendimento Supervisionato
- Addestramento, validazione e ottimizzazione dei modelli; Feature Engineering
- Classificazione; Regressione; Alberi decisionali
4. Ricerca di Similarità nei Testi
- Rappresentazione del testo; Tokenizzazione, Stemming, Lemmatizzazione; Spazio vettoriale; Misure di similarità
Testi di riferimento
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems (2nd ed.). O'Reilly Media.
Modalità di verifica dell'apprendimento
L'esame scritto richiederà agli studenti di rispondere a domande aperte sui contenuti del corso.
Il progetto richiede l'applicazione di metodi di analisi dei dati a un dataset di complessità limitata e comporta la conduzione di un'analisi comparativa di diversi strumenti applicati a un dataset o problema specifico. Lo studente deve scegliere e motivare la soluzione più appropriata e consegnare un rapporto che discuta un'analisi comparativa dei metodi scelti.
Modalità di esame
Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.