GESTIONE DEI DATI DIGITALI
- Anno accademico
- 2025/2026 Programmi anni precedenti
- Titolo corso in inglese
- DATA MANAGEMENT
- Codice insegnamento
- NS001B (AF:582240 AR:328523)
- Lingua di insegnamento
- Italiano
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Minor
- Settore scientifico disciplinare
- INF/01
- Periodo
- II Semestre
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
L’insegnamento intende fornire a studentesse e studenti una preparazione introduttiva, metodologica e applicativa sui principali processi di gestione dei dati digitali, con particolare attenzione all’integrazione tra strumenti visuali di analisi dei dati, tecniche elementari di Machine Learning e applicazioni di Intelligenza Artificiale generativa.
Il corso è progettato per studenti e studentesse provenienti da percorsi disciplinari diversi e non richiede competenze pregresse di programmazione. Attraverso attività laboratoriali guidate, i partecipanti impareranno a costruire semplici workflow di analisi dati con Orange Data Mining e a progettare un tutor virtuale o assistente conversazionale con Flowise, eventualmente integrando documenti, basi informative e architetture RAG.
Alla fine del corso studentesse e studenti saranno in grado di elaborare un progetto di gestione dei dati digitali finalizzato alla risoluzione di un problema pratico o conoscitivo, documentando le fasi di acquisizione, preparazione, analisi, visualizzazione e valorizzazione dei dati mediante strumenti di IA specialistica e generativa.
Risultati di apprendimento attesi
Al termine dell’insegnamento, studentesse e studenti saranno in grado di:
• descrivere le caratteristiche fondamentali dei dati digitali;
• distinguere dati strutturati, semi-strutturati e non strutturati;
• illustrare le principali fasi del processo di gestione dei dati digitali;
• comprendere il ruolo dei dati nei processi di analisi, previsione e decisione;
• descrivere in termini introduttivi le principali tecniche di analisi dei dati: classificazione, regressione, clustering, analisi esplorativa e visualizzazione;
• comprendere il significato di rappresentazione vettoriale di testi, immagini e documenti;
• distinguere tra Intelligenza Artificiale specialistica e Intelligenza Artificiale generativa;
• descrivere il funzionamento logico-generale di un Large Language Model;
• comprendere i concetti di prompt, embedding, vector store, retrieval e architettura RAG;
• riconoscere potenzialità, limiti e rischi degli strumenti di IA applicati alla gestione dei dati digitali.
2. Capacità di applicare conoscenza e comprensione
Studentesse e studenti saranno in grado di:
• acquisire e organizzare dataset digitali in funzione di una domanda di analisi;
• utilizzare strumenti visuali per esplorare, pulire e trasformare dati digitali;
• costruire un workflow di analisi dati mediante Orange Data Mining;
• applicare semplici tecniche di classificazione, regressione, clustering o visualizzazione;
• interpretare gli output prodotti da un workflow di analisi;
• rappresentare i risultati mediante grafici, diagrammi e visualizzazioni appropriate;
• utilizzare strumenti di IA generativa per sintetizzare, classificare, riorganizzare e interrogare contenuti digitali;
• progettare prompt efficaci per guidare l’elaborazione di testi, dati e documenti;
• configurare un semplice tutor virtuale o assistente conversazionale mediante Flowise;
• progettare una semplice architettura RAG per l’interrogazione di una base documentale.
3. Capacità di giudizio
Studentesse e studenti saranno in grado di:
• selezionare strumenti, tecniche e workflow adeguati rispetto al problema affrontato;
• valutare la qualità dei dati disponibili e riconoscerne limiti, incompletezze o distorsioni;
• interpretare criticamente i risultati prodotti da modelli di analisi e strumenti di IA;
• distinguere tra correlazione, previsione, classificazione e spiegazione;
• riconoscere possibili errori, bias, allucinazioni o risposte non verificabili prodotte da sistemi generativi;
• valutare l’appropriatezza di una soluzione digitale rispetto al contesto d’uso, ai destinatari e agli obiettivi decisionali o conoscitivi.
4. Abilità comunicative
Studentesse e studenti saranno in grado di:
• presentare in modo chiaro le fasi di un progetto di gestione dei dati digitali;
• descrivere un workflow di analisi dati utilizzando un lessico tecnico di base corretto;
• comunicare i risultati dell’analisi attraverso grafici, visualizzazioni e brevi report;
• documentare il funzionamento di un tutor virtuale o assistente conversazionale;
• argomentare le scelte metodologiche e operative adottate nei due elaborati;
• collaborare con colleghi e docente durante esercitazioni, revisioni e attività progettuali.
Prerequisiti
Contenuti
PARTE PRIMA
Il processo di gestione dei dati digitali
Strumento software: Orange Data Mining
1. La nuova intelligenza digitale e il ciclo di vita del dato
• Dati, informazioni e conoscenza
• Il dato digitale come risorsa conoscitiva e decisionale
• Le fasi del processo di gestione dei dati digitali
• Acquisizione, archiviazione, elaborazione, rappresentazione, attivazione e adattamento
• Relazione tra dati, modelli, previsioni e decisioni
• Intelligenza umana, intelligenza artificiale e intelligenza ibrida
2. Acquisizione, archiviazione e qualità dei dati
• Fonti di dati digitali
• Dati strutturati, semi-strutturati e non strutturati
• Dataset, osservazioni, variabili e metadati
• Formati comuni: CSV, Excel, testi, immagini, documenti
• Criteri di qualità del dato
• Errori, valori mancanti, duplicati, anomalie e incoerenze
• Organizzazione logica dei dati in funzione dell’analisi
3. Analisi esplorativa, pre-processing e rappresentazione dei dati
• Esplorazione iniziale di un dataset
• Distribuzioni, relazioni, confronti e andamenti
• Pulizia e trasformazione dei dati
• Normalizzazione, codifica e selezione delle variabili
• Rappresentazione vettoriale di testi e immagini digitali
• Concetti introduttivi di feature, embedding e similarità
• Utilizzo di Orange Data Mining per costruire workflow visuali
4. Modelli di analisi, previsione e visualizzazione
• Differenza tra analisi descrittiva, predittiva e decisionale
• Classificazione: previsione di categorie
• Regressione: previsione di valori numerici
• Clustering: individuazione di gruppi nei dati
• Serie temporali e modelli autoregressivi: trend, variazioni e previsione
• Valutazione elementare dei risultati
• Data visualization e infografica
• Grafici, dashboard e comunicazione dei risultati
PARTE SECONDA
IA generativa e gestione dei dati digitali
Strumenti software: Mistral AI Studio, Flowise
5. Dall’IA specialistica all’IA generativa
• Differenza tra IA specialistica e IA generativa
• Machine Learning, Deep Learning e Large Language Model
• Applicazioni dell’IA generativa alla gestione dei dati digitali
• Elaborazione di testi, tabelle, documenti e contenuti semi-strutturati
• Opportunità, limiti e rischi dell’automazione generativa
• Verifica critica degli output prodotti dai modelli
6. Architettura logico-funzionale di un LLM e tecniche di prompting
• Token, contesto e generazione linguistica
• Embedding e rappresentazione semantica
• Addestramento, inferenza e allineamento
• Allucinazioni, bias e controllo dell’output
• Prompt descrittivi, istruttivi e vincolati
• Role prompting, few-shot prompting e prompt strutturati
• Prompt per analisi, sintesi, classificazione, estrazione e trasformazione di dati
7. Elaborazione dei dati mediante IA generativa
• Analisi e sintesi di documenti
• Estrazione di informazioni da testi e contenuti digitali
• Classificazione qualitativa di contenuti
• Generazione di tabelle, schemi, report e sintesi operative
• Progettazione di workflow generativi per supportare attività conoscitive e decisionali
• Utilizzo di piattaforme di IA generativa, con particolare riferimento a Mistral AI Studio
8. Progettazione di agenti, tutor virtuali e architetture RAG
• Dal chatbot all’agente di IA generativa
• Istruzioni di sistema, obiettivi, vincoli e comportamento conversazionale
• Memoria, strumenti e workflow
• Retrieval-Augmented Generation
• Indicizzazione di documenti e basi informative
• Vector store e ricerca semantica
• Progettazione di un tutor virtuale con Flowise
• Cenni ai sistemi multi-agente e agli orchestratori
Testi di riferimento
1. G.B. Ronsivalle, La nuova intelligenza digitale. Come trasformare i dati in decisioni per progettare il futuro, Maggioli Editore, Collana Apogeo Education, 2022.
2. G.B. Ronsivalle, I. Baccan, A. Bersan, The Orange Box. Il nuovo laboratorio di Machine Learning, Edizioni Wemole, 2024.
Materiali didattici integrativi
Saranno inoltre messi a disposizione dal docente:
• slide del corso;
• dispense operative;
• dataset di esercitazione;
• tutorial per Orange Data Mining;
• tutorial per Mistral AI Studio e Flowise;
• esempi di workflow;
• esempi di prompt e configurazioni di tutor virtuali;
• documenti o corpus testuali per esercitazioni RAG. .
Modalità di verifica dell'apprendimento
Step 1 — Sviluppo di un workflow con Orange Data Mining
Punteggio massimo: 15 punti
Soglia minima di superamento: 9 punti
La prova consiste nella realizzazione di un workflow di gestione e analisi dati mediante Orange Data Mining.
Studentesse e studenti dovranno:
• selezionare o utilizzare un dataset fornito dal docente;
• formulare una domanda di analisi;
• importare e organizzare il dataset in Orange;
• svolgere operazioni di esplorazione e pre-processing;
• applicare almeno una tecnica di analisi, modellazione o visualizzazione;
• interpretare i risultati ottenuti;
• produrre una breve relazione descrittiva del workflow.
Consegna richiesta
• File del workflow Orange.
• Dataset utilizzato o indicazione della fonte.
• Breve relazione descrittiva.
• Eventuali screenshot delle principali visualizzazioni.
• Commento interpretativo dei risultati.
Step 2 — Sviluppo di un tutor virtuale con Flowise
Punteggio massimo: 15 punti
Soglia minima di superamento: 9 punti
La prova consiste nella progettazione e realizzazione di un tutor virtuale o assistente conversazionale mediante Flowise.
Studentesse e studenti dovranno:
• definire un dominio di applicazione;
• identificare destinatari e finalità del tutor;
• progettare il comportamento conversazionale dell’agente;
• configurare prompt, istruzioni e vincoli;
• eventualmente integrare una base documentale mediante architettura RAG;
• testare il sistema attraverso esempi di interazione;
• documentare limiti, rischi e possibili miglioramenti.
Consegna richiesta
• Esportazione o documentazione del workflow Flowise.
• Descrizione del tutor virtuale realizzato.
• Prompt di sistema o istruzioni principali.
• Eventuale corpus documentale utilizzato.
• Esempi di domande e risposte.
• Breve relazione critica sul funzionamento del sistema.
Modalità di esame
Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.
Graduazione dei voti
- Step 1 — Workflow con Orange Data Mining | Punteggio massimo: 15 punti | Soglia minima: 9 punti
- Step 2 — Tutor virtuale con Flowise | Punteggio massimo: 15 punti | Soglia minima: 9 punti
- Totale: Punteggio massimo: 30 punti | Soglia minima: 19 punti
Il voto finale è espresso in trentesimi.
La lode potrà essere attribuita in presenza di elaborati particolarmente originali, completi e rigorosi, capaci di integrare in modo efficace analisi dati, visualizzazione, progettazione dell’agente e valutazione critica dei risultati.
Il docente potrà prevedere un breve colloquio integrativo, anche contestuale alla presentazione degli elaborati, nei casi in cui sia necessario approfondire l’autenticità, l’originalità o la comprensione effettiva del lavoro svolto.
Metodi didattici
• sessioni di esposizione teorica supportate da slide multimediali;
• momenti di interazione e discussione guidata;
• analisi di casi d’uso;
• dimostrazioni operative degli strumenti software;
• esercitazioni individuali e di gruppo;
• simulazioni guidate;
• attività laboratoriali con Orange Data Mining;
• attività laboratoriali con Mistral AI Studio e Flowise;
• revisione progressiva degli elaborati finali.
Il corso adotta un approccio orientato al learning by doing. Ogni concetto teorico viene collegato a un’attività pratica, a un esempio applicativo o a una fase del progetto finale.
Potranno essere messi a disposizione materiali asincroni, videotutorial e schede operative per approfondire l’utilizzo degli strumenti software impiegati durante il corso.
Obiettivi Agenda 2030 per lo sviluppo sostenibile
Questo insegnamento tratta argomenti connessi alla macroarea "Capitale umano, salute, educazione" e concorre alla realizzazione dei relativi obiettivi ONU dell'Agenda 2030 per lo Sviluppo Sostenibile