AUTONOMOUS, DISTRIBUTED AND PERVASIVE SYSTEMS-2
- Anno accademico
- 2023/2024 Programmi anni precedenti
- Titolo corso in inglese
- AUTONOMOUS, DISTRIBUTED AND PERVASIVE SYSTEMS-2
- Codice insegnamento
- PHD156-2 (AF:471255 AR:258249)
- Lingua di insegnamento
- Inglese
- Modalità
- In presenza
- Crediti formativi universitari
- 2
- Livello laurea
- Corso di Dottorato (D.M.45)
- Settore scientifico disciplinare
- INF/01
- Periodo
- Annuale
- Anno corso
- 1
- Sede
- VENEZIA
- Spazio Moodle
- Link allo spazio del corso
Inquadramento dell'insegnamento nel percorso del corso di studio
Questo corso presenta alcuni degli algoritmi fondamentali di compressione dei dati -- tutti ampiamente adottati da strumenti che utilizziamo ogni giorno, come file systems, reti di computer, motori di ricerca, e basi dati. Questi algoritmi sono ormai diventati conoscenza indispensabile in molti campi dell’informatica, tra cui Information Retrieval, l’apprendimento automatico, l’elaborazione del linguaggio naturale, la fisica applicata, e la bioinformatica.
Risultati di apprendimento attesi
- comprendere ad analizzare i principali algoritmi di compressione lossless per interi e sequenze di interi.
- saper scegliere consapevolmente una buona tecnica di compressione per la specifica applicazione pratica.
Prerequisiti
Contenuti
- Cos'è e perché la compressione dei dati?
- Modello Base e Limiti
- Compromessi tra spazio e tempo
- Domande fondamentali, indecidibilità
- Dati, Informazione, Ridondanza, Limitazioni Tecnologiche
2. Il problema della codifica statica di numeri interi
- Decodificabilità unica
- Codice Unario, Binario, Binario Minimo, Gamma, Delta, Golomb, Rice, Golomb Esponenziale, Fibonacci, Variable-Byte
- Efficacia
- Contenuto informativo, entropia, distribuzioni
- Codici di ridondanza minima, disuguaglianza di Kraft-McMillan
3. Elenco compressori
- Il problema della codifica di liste ordinate
- Limite inferiore
- Approcci "a blocchi", PForDelta, "Simple", Elias-Fano, Elias-Fano partizionato, Rank & Select su vettori binari, codice interpolante, codice ad indirizzamento direttamente, metodi ibridi
4. Compressori statistici
- Il problema della codifica statistica e di ridondanza minima
- Assegnazione di codici canonici prefix-free
- Shannon-Fano
- Huffman, Huffman canonico
- Codifica aritmetica
- Sistemi numerici asimmetrici
5. Compressori basati su dizionario
- Il problema della codifica basata su dizionario
-LZ77, LZSS, gzip, LZ78, LZW
- Varianti, panoramica dei compressori
Testi di riferimento
- David Salomon. 2007. Variable-Length Codes for Data Compression. Springer Science & Business Media, ISBN 978-1-84628-959-0.
- Alistair Moffat and Andrew Turpin. 2002. Compression and Coding Algorithms. Springer Science & Business Media, ISBN 978-1-4615-0935-6.
- Gonzalo Navarro. 2016. Compact Data Structures. Cambridge University Press, ISBN 978-1-107-15238-0.
- Articoli di ricerca indicati nel materiale didattico
Modalità di verifica dell'apprendimento
1. Implementazione (corretta!) di un algoritmo di compressione dei dati e discussione.
2. Studio un articolo di ricerca e discussione.
3. Contribuzione al corso: preparazione di alcune slides su un nuovo argomento. (L'insegnante ti darà un elenco di argomenti.)
4. Studio di un problema di ricerca (può portare a una pubblicazione con l'insegnante).