Centro di servizi per le strumentazioni scientifiche di Ateneo

Gestione dati complessi

Il Sistema per Calcolo Scientifico di Ca' Foscari (SCSCF) è un insieme di elaboratori e programmi volti all’esecuzione di calcoli particolarmente impegnativi in termini di potenza di calcolo e archiviazione di grandi moli di dati, con lo scopo di soddisfare le crescenti esigenze dei ricercatori dell'Università Ca' Foscari Venezia.

Il sistema, inaugurato nel mese di febbraio del 2014, è nato da una collaborazione tra il Dipartimento di Economia ed il Dipartimento di Scienze Ambientali, Informatica e Statistica ed ha usufruito di un cofinanziamento dell’Università Ca' Foscari Venezia. Recentemente si è aggiunto come sponsor l'European Centre for Living Technologies. Hanno anche contribuito docenti del Dipartimento di Scienze Molecolari e Nanosistemi.

Il Sistema per il Calcolo Scientifico di Ca’ Foscari ha come scopo principale il supporto alle attività di ricerca dei gruppi proponenti.

Presentiamo alcune delle attività svolte divise per macroaree:

Computational Economics and Finance

Education and well-being late in life: the case of China

Titolare della ricerca: Danilo Cavapozzi
Titolo della ricerca: Education and well-being late in life: the case of China
Tema della ricerca: Microeconometrics
Breve descrizione: Analisi dell'effetto dell'istruzione sul benessere degli anziani in Cina.

Risk attitudes, investment behavior and linguistic variation

Titolare della ricerca: Juliana Bernhofer
Titolo della ricerca: Risk attitudes, investment behavior and linguistic variation
Tema della ricerca: Empirical Economics
Breve descrizione: Empirical analysis with SHARE data using STATA.


Computational Mathematics, Statistics and Econometrics

Econometrics of Networks

Titolare della ricerca: Matteo Iacopini
Titolo della ricerca: Econometrics of Networks
Tema della ricerca: Computational Econometrics
Breve descrizione: Modelling (mostly Bayesian) and estimation of econometric models for time series of networks.

Implementation of meshless methods

Titolare della ricerca: Flavio Sartoretto
Titolo della ricerca: Implementation of meshless methods
Tema della ricerca: Numerical solution of Partial Differential Equations
Breve descrizione: We devise and implement meshless methods for solving elliptic equations.

On the Consistency of the Two-step Estimates of the MS-DFM: A Monte-Carlo Study

Titolare della ricerca: Anna Petronevich
Titolo della ricerca: On the Consistency of the Two-step Estimates of the MS-DFM: A Monte-Carlo Study
Tema della ricerca: Applied econometrics
Breve descrizione: In this paper we study the consistency and small-sample behavior of the two-step estimates of the Markov-Switching Dynamic Factor Model.


Computational Physics and Chemistry

Emergence of new phases in biopolymers

Titolare della ricerca: Achille Giacometti
Titolo della ricerca: Emergence of new phases in biopolymers
Tema della ricerca: Soft Matter and Computational Biology
Breve descrizione: Using coarse-grained models for proteins, DNA and liquid crystals, we investigate the emergence of new phases in biopolymers, with particular attention to the effect of the solvent.

High-level Ab Initio Investigations on Molecular Systems

Titolare della ricerca: Andrea Pietropolli Charmet
Titolo della ricerca: High-level Ab Initio Investigations on Molecular Systems
Tema della ricerca: Ab Initio Methods;  Spectroscopy; Computational Chemistry
Breve descrizione: High-level Quantum-chemical Studies on Molecular Systems and their Spectroscopic Properties.


Computer Science

Revealing Structure in Large Graphs

Titolare della ricerca: Marco Fiorucci
Titolo della ricerca: Revealing Structure in Large Graphs
Tema della ricerca: Computer Science
Breve descrizione: Efficiently understand and process massive volumes of interrelated data based on “regular partitions” (E. Szemerédi) of their graph abstractions.


Enviromental Modelling

Climate Change and Watershed Planning: Understanding the Related Impacts and Risks

Titolare della ricerca: Arthur Hrast Essenfelder
Titolo della ricerca: CLIMATE CHANGE AND WATERSHED PLANNING: Understanding the Related Impacts and Risks
Tema della ricerca: GCM/RCM Data Processing
Breve descrizione: Utilised the SCSCF to process large amounts of climate data stored in NetCDF file formats (e.g. downscaling, statistics, etc.).

Modelling deposition of organic matter from aquaculture farms

Titolare della ricerca: Daniele Brigolin
Titolo della ricerca: Modelling deposition of organic matter from aquaculture farms
Tema della ricerca: Ecological modelling
Breve descrizione: Simulations were performed in order to explore changes in the deposition pattern of mussel farms in the Adriatic under different scenarios of hydrodynamic forcing.

È possibile visionare alcuni degli articoli scientifici prodotti anche grazie all’ausilio computazionale di SCSCF.

I nodi di calcolo

Il Sistema di Calcolo Scientifico Ca' Foscari (SCSCF) dispone di un cluster di nodi di calcolo e di altri dispositivi correlati.

Il cuore del cluster è composto da 7 nodi di calcolo: i primi 5 nodi sono di tipo 1, i successivi sono di tipo 2. Inoltre è disponibile un nodo per applicazioni Big Data.
Per i nodi di calcolo, in totale, sono pertanto disponibili 240 core e 2.25 TB di RAM.
Le risorse Big Data sono quindi in totale 20 core e 128 GB  di RAM.

Il sistema dispone inoltre di un nodo che ospita, sotto forma di macchine virtuali, il sistema di frontend, con cui gli utenti del sistema interagiscono, ed alcuni servizi software necessari al coordinamento della macchina.

Configurazione Nodo di Calcolo di tipo 1

CARATTERISTICA        DESCRIZIONE
ModelloHP ProLiant DL560 Gen8
Modello di CPUIntel Xeon E5-4610v2
Numero di CPU (Socket)4
Frequenza CPU2.30 GHz (Turbo 2.70 GHz)
Numero di Core per CPU8
Numero di HyperThread per core2 (disabilitato)
RAM256 GB PC3-12800R (DDR3-1600) ECC
Connettività10Gbit Ethernet Dual Port, Intel X540-AT2 + 4 Gbit Ethernet

Configurazione Nodo di Calcolo di tipo 2

CARATTERISTICA        DESCRIZIONE
ModelloHP ProLiant DL560 Gen9
Modello di CPUIntel Xeon E5-4627v3
Numero di CPU (Socket)4
Frequenza CPU2.30 GHz (Turbo 3.20 GHz)
Numero di Core per CPU10
RAM512 GB RDIMM, 2133MT/s, Quad Rank
Scheda graficaNVIDIA Quadro K2200, 640 core
Connettività10Gbit Ethernet Dual Port, HP 530T + 4 Gbit Ethernet

Configurazione Nodo per applicazioni Big Data

CARATTERISTICA        DESCRIZIONE
ModelloDell PowerEdge R630
Modello di CPUIntel Xeon E5-2650v3
Numero di CPU (Socket)2
Frequenza CPU2.30 GHz (Turbo 3 GHz)
Numero di Core per CPU10
RAM128 GB RDIMM, 2133MT/s, Dual Rank, x4 Data Width
Connettività10Gbit Ethernet Dual Port, Intel X540-AT2 + 4 Gbit Ethernet

Configurazione Nodo Frontend

CARATTERISTICA        DESCRIZIONE
ModelloDELL PowerEdge R620
Modello di CPUIntel Xeon E5-2640v2
Numero di CPU (Socket)2
Frequenza CPU2.00 GHz (Turbo 2.50 GHz)
Numero di Core per CPU8
Numero di HyperThread per core2
RAM64 GB PC3-12800R (DDR3-1600) ECC
Connettività10Gbit Dual port, Broadcom BCM57810 + 4 Gbit Ethernet

La memorizzazione dati

La memorizzazione dei dati degli utenti è affidata ad un Network Attached Storage (NAS) che condivide lo spazio di memorizzazione con tutti i nodi.
Il backup dei dati è affidato ad un secondo NAS.

Configurazione NAS dati utenti

CARATTERISTICA        DESCRIZIONE
ModelloSynology RackStation RS3614xs+
Modello di CPUIntel Xeon E3-1230v2 (Quad Core 3.3 GHz)
RAM8 GB DDR3 ECC
Dischi10 Western Digital Caviar Red Pro 4TB (WD4001FFSX)
Cache SSD2 Samsung SSD 850 Pro 512 GB (MZ-7KE512BW)
RidondanzaRAID 10
Capacità finale20 TB
Connettività10Gbit Ethernet Dual Port, Intel X540T2 + 4 Gbit Ethernet

Configurazione NAS backup

CARATTERISTICA        DESCRIZIONE
ModelloSynology RackStation RS2414RP+
Modello di CPUIntel Atom D2700 (Dual Core 2.13 GHz)
RAM2 GB DDR3
Dischi12 Western Digital Caviar Red 4TB (WD40EFRX)
Cache SSD2 Samsung SSD 850 Pro 512 GB (MZ-7KE512BW)
RidondanzaSynology Hybrid RAID
Capacità finale40 TB
Connettività4 Gbit Ethernet

La connettivià tra i nodi

La connettività tra nodi per la comunicazione tra processi (IPC) e quella tra nodi ed il NAS coi dati degli utenti (Storage) è garantita da due reti indipendenti, ognuna con uno switch 10 Gbit dedicato. La connettività di servizio (ad es. per il login degli utenti o per la connettività internet) è garantita da una rete Gbit.

Apparati di rete

CARATTERISTICA        DESCRIZIONE
Switch per IPCNetgear XS712T, 12-port 10Gbit Ethernet
Switch per StorageNetgear XS712T, 12-port 10Gbit Ethernet
Switch di servizioNetgear JGS516, 16-port Gbit Ethernet

Il software

Attualmente sono disponibili i seguenti tool software:

  • MatLab
  • R
  • Fortran
  • C/C++
  • Java
  • Python
  • Cuda
  • OpenMPI
  • Octave
  • Sage
  • LaTeX

E’ disponibile per MATLAB il "Parallel Computing Toolbox", che consente di parallelizzare jobs MATLAB in maniera semplice.

Le decisioni sull’allocazione delle risorse destinate al SCSCF, nonché sulle politiche per il suo utilizzo da parte degli utenti, è affidato ad un comitato di gestione, la cui composizione attuale è:

Docenti

  • Roberto Casarin: professore di Econometria. Si occupa di inferenza statistica Bayesiana, metodi Metropolis-Hastings e Monte Carlo Sequenziale per la simulazione stocastica, metodi di previsione e di combinazione e calibrazione delle previsioni. In ambito modellizzazione i suoi temi di ricerca includono modelli Bayesiani nonparametrici, modelli dinamici nonlineari per l'analsi delle serie storiche ed in particolare modelli markoviani a cambiamento di regime e modelli a volatilità stocastica. Si occupa inoltre di modelli grafici e tensori aleatori per dati complessi e di grandi dimensioni. In ambito applicato si interessa dell'analisi dei tassi di cambio e dei rendimenti azionari, delle reti finanziari e delle reti sociali.
  • Marco Marozzi: insegna statistica e matematica a Ca' Foscari. Suoi importanti temi di ricerca sono la statistica computazionale e i metodi statistici computer-intensive.
  • Paolo Pellizzari: professore di Matematica per l'Economia e le Scienze Sociali. Insegna financial literacy, economia computazionale e modelli quantitativi per le decisioni a livello triennale, magistrale e dottorale. I suoi campi di ricerca includono modelli ad agenti eterogenei per finanza ed economia, spesso in presenza di razionalità limitata; metodi computazionali e simulazione; uso di nuove tecnologie nell'insegnamento.
  • Flavio Sartoretto: professore di Calcolo Scientifico. Si è occupato di algoritmi numerici paralleli  per il calcolo di autovalori ed autovettori. Utilizza SCSCF per mettere a punto algoritmi numerici per la risoluzione di Equazioni Differenziali alle Derivate Parziali.

Tecnici

  • Carlo Busetto: tecnico informatico afferente al DEC, si occupa della gestione di SCSCF e del supporto agli utenti che usano MatLab.
  • Giovannamaria Zamara: tecnico informatico afferente al DAIS, si occupa della gestione di SCSCF e delle relative pagine Web.

Documenti consultabili del comitato di gestione


Statistiche di utilizzo

Da qui è possibile visualizzare il grafico dinamico dell'ultimo mese di utilizzo.

c1, c2, c3 e c4 rappresentano i nodi di Calcolo di tipo 1, c6 e c7 sono i nodi di Calcolo di tipo 2. Invece b1 rappresenta il nodo per applicazioni Big Data.

Ci sono due tipi di utilizzatori: sponsor ed utenti.

Gli sponsor sono coloro i quali si impegnano a finanziare la manutenzione della macchina qualora sia necessario. Per diventare sponsor bisogna farne domanda al comitato di gestione (e-mail:  scscf.gest@listserv.unive.it), se accolta bisogna pagare una quota di ingresso.

Gli utenti sono coloro i quali uno sponsor ha autorizzato ad utilizzare la macchina. Gli utenti debbono compilare un modulo di accesso al sistema che va inviato al comitato di gestione.

Elenco degli sponsor

Carlo Barbante (DAIS)
Diana Barro (DEC)
Antonella Basso (DEC)
Michele Bernasconi (DEC)
Monica Billio (DEC)
Silvia Bozza (DEC)
Daniele Brigolin (DAIS)
Agar Brugiavini (DEC)
Stefano Campostrini (DEC)
Roberto Casarin (DEC)
Danilo Cavapozzi (DEC)
Marco Corazza (DEC)
Fulvio Corsi (DEC)
Carlo Gaetan (DAIS)
Margherita Gerolimetto (DEC)
Achille Giacometti (DSMN)
Federica Giummole' (DAIS)
Carlo Giupponi (DEC)
Claudio Lucchese (DAIS)
Marcella Lucchetta (DEC)
Stefano Magrini (DEC)
Elena Meschi (DEC)
Andrea Moro (DEC)

Salvatore Orlando (DAIS)
Mario Padula (DEC)
Antonio Paradiso (DEC)
Francesca Parpinel (DEC)
Giacomo Pasini (DEC)
Andrea Pastore (DEC)
Roberto Pastres (DAIS)
Marcello Pelillo (ECLT)
Loriana Pelizzon (DEC)
Paolo Pellizzari (DEC)
Andrea Pietropolli Charmet (DSMN)
Claudio Pizzi (DEC)
Irene Poli (DAIS)
Roberto Roson (DEC)
Angelo Rubino (DAIS)
Flavio Sartoretto (DAIS)
Debora Slanzi (DAIS)
Paolo Stoppa (DSMN)
Stefano Tonellato (DEC)
Andrea Torsello (DAIS)
Cristiano Varin (DAIS)
Mario Volpe (DEC)
Matteo Zucchetta (DAIS)

Last update: 16/10/2019