DATI E CONOSCENZA

Anno accademico
2021/2022 Programmi anni precedenti
Titolo corso in inglese
FROM DATA TO KNOWLEDGE
Codice insegnamento
NS001D (AF:361775 AR:191610)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Minor
Settore scientifico disciplinare
SECS-S/01
Periodo
Estivo
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento è una delle attività formative del Minor in Computer and Data Science e consente allo studente di acquisire la conoscenza e la comprensione dei principali strumenti in uso per l'analisi e l'estrazione di informazione dai dati.
L'obiettivo dell’insegnamento è fornire conoscenze di statistica descrittiva, di calcolo delle probabilità e di alcuni argomenti di base dell'inferenza, nonché abilità nell’utilizzo di programmi specifici per l'analisi dei dati e la comunicazione delle informazioni ricavate.
Alla fine del corso, lo studente sarà in grado di individuare ed applicare i modelli e le metodologie di analisi più adatti al contesto di interesse, con l'obiettivo di guidare le scelte più adeguate; inoltre saprà interpretare e comunicare i risultati ottenuti.

1. Conoscenza e comprensione:
-conoscere i principali strumenti per la rappresentazione grafica e la sintesi delle caratteristiche fondamentali di un insieme di dati
-conoscere i concetti di base del calcolo delle probabilità e le principali distribuzioni di probabilità
-conoscere alcune metodologie di base dell'inferenza statistica

2. Capacità di applicare conoscenza e comprensione:
-saper utilizzare programmi specifici per l'analisi dei dati e per la comunicazione dei risultati
-saper utilizzare la terminologia adeguata in tutti i processi di applicazione e comunicazione delle conoscenze acquisite

3. Capacità di giudizio:
-saper contestualizzare le conoscenze acquisite, individuando i modelli e i metodi più adeguati alla situazione di interesse

4. Abilità comunicative:
-saper presentare in modo chiaro ed esaustivo i risultati ottenuti da un'analisi statistica
-sapere interagire con i pari e con il docente, in modo critico e rispettoso, in presenza e sul forum dell’aula virtuale

5. Capacità di apprendimento:
-saper utilizzare ed integrare informazioni provenienti da appunti, libri, slide e sessioni pratiche di laboratorio
-saper consultare criticamente i testi di riferimento e altri testi di introduzione all'analisi dei dati.
Nozioni di matematica a livello di scuola superiore e abilità di base nell'uso del computer.
Il corso fornisce un'introduzione alla statistica, attraverso esempi pratici e casi di studio. Le prime due settimane del corso hanno lo scopo di introdurre agli studenti le tecniche più utilizzate per la sintesi e la rappresentazione grafica di un insieme di dati, oltre che il programma R (https://cloud.r-project.org/ ) e l'interfaccia di RStudio (https://www.rstudio.com/ ) per la sintesi, la rappresentazione e l'analisi dei dati e la reportistica finale. Nell'ultima settimana, vengono presentati e discussi in dettaglio alcuni casi studio in maniera molto approfondita. Le lezioni teoriche sono sempre motivate da esempi e applicazioni a problemi pratici di interesse in diversi ambiti.

Nello specifico, la parte statistica è composta da
- elementi di statistica descrittiva: popolazione e campione; tipi di variabili; rappresentazioni grafiche e indici sintetici; relazioni fra variabili
- cenni di incertezza stocastica: errore statistico e come si collega all'inferenza statistica
- introduzione ai metodi di regressione.

Rafael A. Irizarry, Introduction to Data Science - Data Analysis and Prediction Algorithms with R - https://rafalab.github.io/dsbook/
Mine Çetinkaya-Rundel. Introduction to Modern Statistics - https://openintro-ims.netlify.app/index.html
Robinson, R. e White, H. (2016) Elementary Statistics with R - http://homerhanumat.github.io/elemStats/
Grolemund, Garrett, & Wickham, Hadley. (2017). "R for Data Science". Available at https://r4ds.had.co.nz/index.html

Letture integrative:
Altro materiale indicato dal docente durante il corso.
L'esame prevede la redazione e la presentazione di report statistico redatto in R su un data set, in modo da misurare:
. le conoscenze della teoria degli argomenti del corso,
. la capacità di applicare la teoria per risolvere problemi reali.

Lezioni frontali ed esercitazioni in classe con l'uso del programma R. Utilizzo della piattaforma Moodle per la verifica dell'apprendimento in itinere e per la condivisione del materiale del corso. Uso di programmi open source per l'analisi e la presentazione dei risultati.
Italiano
scritto
Programma definitivo.
Data ultima modifica programma: 03/04/2022