STATISTICAL LEARNING FOR DATA SCIENCE - 1
- Anno accademico
- 2021/2022 Programmi anni precedenti
- Titolo corso in inglese
- STATISTICAL LEARNING FOR DATA SCIENCE - 1
- Codice insegnamento
- EM1401 (AF:358730 AR:188042)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6 su 12 di STATISTICAL LEARNING FOR DATA SCIENCE
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- SECS-S/01
- Periodo
- 1° Periodo
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Risultati di apprendimento attesi
1. (conoscenza e comprensione)
- conoscere e comprendere metodi statistici per la sintesi, previsione e classificazione utilizzando basi di dati complesse e di alta dimensionalità.
2. (capacità di applicare conoscenza e comprensione)
- applicare il trattamento preliminare: preparare un insieme di dati per le analisi successive
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni
- utilizzare in modo autonomo software statistico per analizzare basi di dati con alta dimensione
3. (capacità di giudizio)
- valutare la validità e la fattibilità delle diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
- presentare i risultati delle analisi in maniera chiara e concisa utilizzando strumenti per la ricerca riproducibile
Prerequisiti
Contenuti
Strumenti per data science e ricerca riproducibile
- Introduzione a R e Rstudio
- Preparare i report attraverso Rmarkdown
preparazione dei dati, pulizia dei dati, visualizzazione dei dati.
Inferenza statistica
- Campionamento
- Stima
- Verifica d'ipotesi
Apprendimento statistico
- Regressione lineare
- Classificazione
- Metodi di ricampionamento
- Selezione del modello e la regolarizzazione nel modello lineare
- Modelli nonlineari
Testi di riferimento
version. Springer. Webpage http://www-bcf.usc.edu/~gareth/ISL/ Chapters 1-7
Chester Ismay, Albert Y. Kim (2019) Statistical Inference via Data Science: A ModernDive
into R and the tidyverse! , CRC Press ( https://moderndive.com/ )
Yihui Xie (2019) bookdown: Authoring Books and Technical Documents with R Markdown,
CRC/Press ( https://bookdown.org/yihui/bookdown/ )
Modalità di verifica dell'apprendimento
La prova finale scritta contiene 3 esercizi scelti in modo da misurare
1. le conoscenze della teoria degli argomenti del corso,
2. la capacità di applicare i metodi appresi per risolvere problemi reali.
Il punteggio finale è dato dalla somma dei punteggi dei quattro esercizi. L'utilizzo dei libri, degli appunti e delle risorse elettroniche durante la prova finale non è consentito.
Modalità di esame
Metodi didattici
descrizione dei metodi e sessioni pratiche che descrivono l'implementazione e l'applicazione
dei metodi ai problemi reali. I metodi saranno implementati con il software statistico R
(www.r-project.org). Gli studenti sono incoraggiati a portare i propri laptop (no tablet!) ed a sperimentare
con il codice durante il corso.
Altre informazioni
Le informazioni si riferiscono all'intero corso.
È richiesto che gli studenti si registrino sulla pagina del corso della piattaforma e-learning di ateneo moodle.unive.it