HEALTH DATA SCIENCE
- Anno accademico
- 2023/2024 Programmi anni precedenti
- Titolo corso in inglese
- HEALTH DATA SCIENCE
- Codice insegnamento
- EM1413 (AF:382717 AR:208970)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 6
- Livello laurea
- Laurea magistrale (DM270)
- Settore scientifico disciplinare
- SECS-S/05
- Periodo
- 4° Periodo
- Anno corso
- 2
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Si esamineranno dunque i principali strumenti statistici più comuni per poter analizzare dati di salute:
- metodi staticici per l'analisi di dati categoriali
- metodi statistici per l'analisi dei costi sanitari
- modelli di sopravvivenza.
Le tecniche statistiche saranno esplorate da un punto di vista teorico e pratico attraverso attività di laboratorio (in R, analizzando dati reali provenienti da diversi sistemi di sorveglianza sanitari).
Risultati di apprendimento attesi
- Capacità di utilizzare, confrontare ed interpretare metodi statistici per dati sanitari (dal punto di vista teorico e pratico in R).
Prerequisiti
Contenuti
- Tipologia di dati sanitari (rif. Etzioni)
- Survey: Il caso americano Behavioral Risk Factor Surveillance System (BRFSS) e quello italiano Progressi delle Aziende Sanitarie per la Salute in Italia (PASSI).
- Dati sanitari e politiche sanitarie
2. Modelli statistici per i dati sanitari:
2.a: Analisi di dati categoriali (rif. Agresti):
- Analisi delle tabelle di contingenza e confronto di proporzioni. Rischio relativo, odds ratio e test chi-quadro di indipendenza.
- Regressione logistica. Interpretazione, valutazione e selezione. Predittori categoriali e dati aggregati.
- Regressione di Poisson e binomiale negativa, interpretazione, valutazione e selezione.
- Modelli logit multicategoriali (per dati nominali e ordinali). Interpretazione, valutazione e selezione.
- Modelli lineari generalizzati. Definire la regressione logistica come modello lineare generalizzato.
- Modelli misti lineari generalizzati (modello logistico-normale) Interpretazione, valutazione e selezione.
2.b: Analisi costi assistenza sanitaria (rif. Etzioni):
- Modelli log cost e distribuzione lognormale
- Modelli gamma
- Modelli mistura
- Altri modelli per dati asimmetrici.
2.c: Modellazione dei dati di sopravvivenza (rif. Collett):
- Introduzione all'analisi della sopravvivenza.
- Funzione di sopravvivenza, funzione di rischio, censura.
- Modelli di rischio proporzionale, regressione di Cox.
3. Laboratorio di analisi dei dati sanitari
- Casi studio e applicazioni pratiche con R.
Testi di riferimento
Collett, D. (2015). Modelling survival data in medical research. CRC press. (ch 2, 3)
Etzioni, R. (2020). Statistics for Health Data Science (ch 1, 6)
Modalità di verifica dell'apprendimento
2. Studenti non frequentanti: l'esame consiste in rispondere a 4-5 domande riguardanti un dataset (le domande sono simili agli esempi proposti durante il laboratorio in classe). L'esame è a libro aperto. È possibile utilizzare R e Rmarkdown o qualsiasi altro software per tutta la durata dell'esame. Per gli studenti che desiderano aumentare il voto dell'esame scritto, è possibile sostenere un esame orale il giorno della correzione dell'esame.
Modalità di esame
Metodi didattici
Obiettivi Agenda 2030 per lo sviluppo sostenibile
Questo insegnamento tratta argomenti connessi alla macroarea "Capitale umano, salute, educazione" e concorre alla realizzazione dei relativi obiettivi ONU dell'Agenda 2030 per lo Sviluppo Sostenibile