STATISTICAL LEARNING FOR DATA SCIENCE - 1 - PRACTICE
- Anno accademico
- 2025/2026 Programmi anni precedenti
- Titolo corso in inglese
- STATISTICAL LEARNING FOR DATA SCIENCE - 1 - PRACTICE
- Codice insegnamento
- EM1401 (AF:561294 AR:326606)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 0 su 12 di STATISTICAL LEARNING FOR DATA SCIENCE
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- SECS-S/01
- Periodo
- 1° Periodo
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Risultati di apprendimento attesi
1. (conoscenza e comprensione)
- conoscere e comprendere metodi statistici per la sintesi, previsione e classificazione utilizzando basi di dati complesse e di alta dimensionalità.
2. (capacità di applicare conoscenza e comprensione)
- applicare il trattamento preliminare: preparare un insieme di dati per le analisi successive
- applicare in modo autonomo metodi statistici avanzati per sintetizzare informazioni, effettuare previsioni e classificazioni
- utilizzare in modo autonomo software statistico per analizzare basi di dati con alta dimensione
3. (capacità di giudizio)
- valutare la validità e la fattibilità delle diverse tecniche statistiche e comprendere il loro impatto sui risultati delle analisi
- presentare i risultati delle analisi in maniera chiara e concisa utilizzando strumenti per la ricerca riproducibile
Prerequisiti
Contenuti
Strumenti per data science e ricerca riproducibile
- Introduzione a R e Rstudio
- Prepararazione dei report attraverso Rmarkdown
Preparazione dei dati, pulizia dei dati, visualizzazione dei dati, manipolazione e analisi esplorativa.
Inferenza statistica
- Campionamento
- Stima
- Verifica d'ipotesi
Apprendimento statistico
- Regressione lineare
- Classificazione
- Metodi di ricampionamento
- Selezione del modello e la regolarizzazione nel modello lineare
- Modelli nonlineari
Testi di riferimento
version. Springer. Webpage http://www-bcf.usc.edu/~gareth/ISL/ Chapters 1-7
Chester Ismay, Albert Y. Kim (2019) Statistical Inference via Data Science: A ModernDive
into R and the tidyverse! , CRC Press ( https://moderndive.com/ )
Yihui Xie (2019) bookdown: Authoring Books and Technical Documents with R Markdown,
CRC/Press ( https://bookdown.org/yihui/bookdown/ )
Modalità di verifica dell'apprendimento
1. Il codice R utilizzato per risolvere gli esercizi.
2. I risultati ottenuti, sia numerici che grafici.
3. Interpretazione dei risultati.
Dopo la pubblicazione degli esiti della prova scritta, gli studenti che avranno raggiunto almeno 18/30 saranno convocati per una breve prova orale. Questa fase dell'esame valuterà le stesse competenze e conoscenze richieste nella prova scritta.
Modalità di esame
Il/la docente ha il dovere di vigilare affinché siano rispettate le regole di autenticità e originalità delle prove d'esame. Di conseguenza, nei casi in cui vi sia il sospetto di un comportamento irregolare, l'esame può prevedere un ulteriore approfondimento, contestuale alla prova d'esame, che potrà essere realizzato anche in modalità differente rispetto alle modalità sopra riportate.
Graduazione dei voti
Metodi didattici
descrizione dei metodi e sessioni pratiche che descrivono l'implementazione e l'applicazione
dei metodi ai problemi reali. I metodi saranno implementati con il software statistico R
(www.r-project.org). Gli studenti sono incoraggiati a portare i propri laptop (no tablet!) ed a sperimentare
con il codice durante il corso.
Altre informazioni
Le informazioni si riferiscono all'intero corso.
È richiesto che gli studenti si registrino sulla pagina del corso della piattaforma e-learning di ateneo moodle.unive.it