STATISTICAL LEARNING FOR DATA SCIENCE - 2
- Anno accademico
- 2023/2024 Programmi anni precedenti
- Titolo corso in inglese
- STATISTICAL LEARNING FOR DATA SCIENCE - 2
- Codice insegnamento
- EM1401 (AF:449546 AR:257593)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6 su 12 di STATISTICAL LEARNING FOR DATA SCIENCE
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- SECS-S/01
- Periodo
- 2° Periodo
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Risultati di apprendimento attesi
1. (conoscenza e comprensione)
- conoscere e comprendere metodi statistici per la sintesi, previsione e classificazione utilizzando basi di dati complesse e di alta dimensionalità.
2. (capacità di applicare conoscenza e comprensione)
- trattamento preliminare: preparare un insieme di dati per le analisi successive
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni
- utilizzare in modo autonomo software statistico per analizzare basi di dati con alta dimensione
3. (capacità di giudizio)
- valutare la validità e la fattibilità delle diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
- presentare i risultati delle analisi in maniera chiara e concisa utilizzando strumenti per la ricerca riproducibile
Prerequisiti
Contenuti
Strumenti per data science e ricerca riproducibile
- Introduzione a R e Rstudio
- Preparare i report attraverso Rmarkdown
preparazione dei dati , pulizia dei dati. visualizzazione dei dati,
Inferenza statistica
- Campionamento
- Stima
- Verifica d'ipotesi
Apprendimento statistico
- Regressione lineare
- Classificazione
- Metodi di ricampionamento
- Selezione del modello e la regolarizzazione nel modello lineare
- Modelli nonlineari
Testi di riferimento
Chester Ismay, Albert Y. Kim (2019) Statistical Inference via Data Science: A ModernDive into R and the tidyverse! , CRC Press ( https://moderndive.com/ )
Yihui Xie (2019) bookdown: Authoring Books and Technical Documents with R Markdown, CRC/Press ( https://bookdown.org/yihui/bookdown/ )
Modalità di verifica dell'apprendimento
La prova finale scritta contiene 3 esercizi scelti in modo da misurare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare i metodi appresi per risolvere problemi reali.
Il punteggio massimo della prova scritta è di 33 punti. L'utilizzo dei libri, degli appunti e delle risorse elettroniche durante la prova finale non è consentito. Solo il materiale presente in Moodle può essere consultato.
Il punteggio finale è dato dalla somma del punteggio ottenuto nelle prove parziali e il punteggio della prova finale. Un punteggio complessivo che supera o eguaglia i 33 punti corrisponde alla lode.
Modalità di esame
Metodi didattici
Altre informazioni
È richiesto che gli studenti si registrino sulla piattaforma e-learning di ateneo moodle.unive.it.