STATISTICAL INFERENCE AND LEARNING

Anno accademico
2018/2019 Programmi anni precedenti
Titolo corso in inglese
STATISTICAL INFERENCE AND LEARNING
Codice insegnamento
CM0471 (AF:274848 AR:159110)
Modalità
In presenza
Crediti formativi universitari
6
Livello laurea
Laurea magistrale (DM270)
Settore scientifico disciplinare
SECS-S/01
Periodo
I Semestre
Anno corso
1
Sede
VENEZIA
Spazio Moodle
Link allo spazio del corso
L’insegnamento ricade tra le attività educative del corso di laurea magistrale in Computer Science che consentono allo studente di acquisire strumenti avanzati per l’analisi di dati mediante tecniche statistiche e di apprendimento automatico. L’obiettivo dell’insegnamento è sviluppare le competenze statistiche necessarie per analizzare dati caratterizzati da alta dimensionalità al fine di risolvere problemi di previsione e classificazione che sorgono nei più svariati ambiti tecnologico-scientifici, biomedici ed economico-aziendali.
La frequenza e la partecipazione alle attività formative proposte dal corso e lo studio individuale consentiranno agli studenti di:
1. (conoscenza e comprensione)
- conoscere e comprendere metodi avanzati propri dell’apprendimento statistico per la sintesi, previsione e classificazione anche sulla base di insiemi di dati con relazioni complesse e alta dimensionalità
2. (capacità di applicare conoscenza e comprensione)
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni con dataset caratterizzati da alta dimensionalità
- utilizzare in modo autonomo software statistico per analizzare dataset caratterizzati da alta dimensionalità
3. (capacità di giudizio)
- esprimere valutazioni autonome rispetto alla validità e alla fattibilità di diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
E' richiesta una conoscenza di base del calcolo delle probabilità a livello di un corso di laurea triennale di informatica. Gli argomenti che vengono assunti per noti sono: eventi, assiomi della probabilità, probabilità condizionata e indipendenza, variabili casuali, valore atteso, varianza, covarianza e correlazione, principali variabili casuali discrete (binomiale e Poisson), principali variabili casuali continue (uniforme, normale, esponenziale), teorema del limite centrale, legge dei grandi numeri. A titolo esemplificativo gli argomenti sono coperti dai capitoli 2-3-4 del testo Baron (2014).

Baron M (2014). Probability and Statistics for Computer Scientistis. Second Edition. CRC Press.
Il corso è suddiviso in due moduli. Il primo modulo approfondisce le conoscenze generali di inferenza statistica. Gli argomenti del primo modulo costituiscono le basi per il secondo modulo che riguarda l’apprendimento statistico. Dettaglio dei contenuti che verranno presentati e discussi a lezione:
1. Richiami di inferenza statistica
-- stima puntuale
-- stima intervallare
-- verifica d'ipotesi
2. Apprendimento statistico
-- modelli previsivi
-- classificazione
-- metodi di ricampionamento
-- scelta fra modelli e regolarizzazione
L’utilizzo del linguaggio R (www.r-project.org) è una parte integrante dei due moduli del corso.
- James G, Witten D, Hastie T, Tibshirani R (2015). An Introduction to Statistical Learning. 6th version. Springer. Pagina web http://www-bcf.usc.edu/~gareth/ISL/ Capitoli 1-6
- Letture e materiali integrativi distribuiti durante il corso tramite piattaforma moodle
La verifica dell'apprendimento avviene tramite una prova scritta suddivisa in due parti. La prima parte è un esame scritto tradizionale di un’ora e mezza con esercizi che servono a valutare le conoscenze teoriche degli argomenti dell’insegnamento. La seconda parte dura due ore e consiste nell’analisi di un dataset utilizzando il software R per valutare l'abilità di mettere in pratica le conoscenze acquisite nell’insegnamento. Entrambe le prove valgono 16 punti. Il punteggio complessivo è dato dalla somma dei punteggi nelle due prove scritte. Punteggi complessivi superiori a 30 corrispondono alla lode.
Lezioni di teoria convenzionali accompagnate da esercitazioni in aula, discussione di casi studio e laboratori. Materiale didattico curato del docente verrà distribuito durante il corso tramite la piattaforma Moodle. Il software statistico utilizzato nel corso è R (www.r-project.org).
Inglese
scritto

Questo insegnamento tratta argomenti connessi alla macroarea "Cambiamento climatico e energia" e concorre alla realizzazione dei relativi obiettivi ONU dell'Agenda 2030 per lo Sviluppo Sostenibile

Programma definitivo.
Data ultima modifica programma: 19/12/2018