Open Science e EOSC

Mentre l'Open Access (OA) è nato in un contesto in cui l'obiettivo principale è l'accesso aperto ai risultati della ricerca, intesi come risultati trasformati in testi, accessibili grazie a licenze appropriate, l’Open Science (OS) invece punta a un vero e proprio cambio di mentalità, perché estende l’OA all’intero ciclo di vita dei dati (non quindi alle sole pubblicazioni), dall’inizio del progetto di ricerca a ben oltre la sua conclusione. 

Principi dell'Open Science

I principi della scienza aperta sono:

  • la conoscenza è un bene comune; se la ricerca è finanziata con fondi pubblici, la scienza aperta è un dovere nei confronti dei cittadini
  • la sostenibilità, la collaborazione e l’inclusione
  • l’etica della ricerca, intesa come trasparenza del processo di produzione dei risultati scientifici
  • la riproducibilità del dato scientifico
  • la partecipazione della società civile (Valentina Meschia, Citizen science: la scienza di tutti, 2016)

La partecipazione alla scienza aperta non solo innesca il principio virtuoso di aumento della conoscenza, ma anche di innovazione per il mercato (che può accedere alla ricerca di base) e di  aumento nel ritorno degli investimenti. “If I had to express my views about the digital future - that of Europe or indeed, of the whole world - I could do it with one word: data. The digital economy revolves around data. It is the driving force behind those three main elements of productivity, innovation and digitalisation. Let’s not lose time being afraid - let’s build an open and vibrant data economy” (Andrus Ansip, Productivity, Innovation and digitalisation, 2015).

Le ricadute sull’intera società della scienza aperta sono multiple e così riassumibili, in sintesi:

  • più conoscenza interdisciplinare di qualità, trasparente, certificata (no fake news), gratuita e aggiornata in tempo reale grazie a internet
  • migliore sfruttamento dei dei dati scientifici tramite il loro riuso
  • riduzione dello scientific divide che esclude gli scienziati operanti in aree del mondo meno sviluppate (esclusione derivante dalla non sostenibilità dei costi delle pubblicazioni scientifiche)

Da indagini che hanno coinvolto ricercatori europei, emerge però che solo una parte utilizza infrastrutture digitali e pubblica i propri contributi ad accesso aperto. Del resto mancano sovente politiche nazionali e strategie a supporto dell’Open Access delle pubblicazioni alle quali si aggiunge, come aggravante, la considerazione dell’accesso aperto nei processi di valutazione della ricerca.

Il ruolo dei repository, in un contesto di Open Science, è importante soprattutto relativamente alla European Open Science Cloud. "The path to open science contains many components. One of these components is open repositories with free access to researchers. With a strict open path, the repository is also based on Open Source Software. Open access policies are essential, as are open infrastructures and open contents. Repositories can support this openness by offering open licenses, open metadata, the possibility to use open formats and open thesaureses. Another principal point is transparency. Open peer review should be possible, and the description of processes should also be transparent. Of course, an open license should provide all data types and metadata as well" (Susanne Blumesberger, Ways to Open Science. Open Research Infrastructures and the role of repositories, 2019).

Nell’ambito della ricerca scientifica, l’attività relativa alla gestione dei dati è definita Research Data Management (RDM). Deriva dalla necessità di garantire la riproducibilità delle ricerche, coerentemente con la politica di gestione dei dati, stabilita dall’istituto di ricerca.
Il RDM è un’attività operativa ed è pertanto imprescindibile che sia supportata dalla governance (locale e nazionale) con l’adozione di policy che definiscono ruoli e attività a carico dell’istituzione e del ricercatore.

Policy dei dati della ricerca

L’adozione di politiche per il RDM è un elemento fondamentale verso la European Open Science Cloud e spetta alla governance dell’istituzione in quanto documento strategico di visione complessiva.

Nella policy l’Ateneo riconosce il valore dei dati prodotti durante la ricerca come prodotto scientifico, riconosce l’importanza della loro gestione per il mantenimento della qualità della ricerca e si impegna ad applicare elevati standard per la loro raccolta, archiviazione e conservazione, secondo le linee guida della Commissione europea

La policy definisce i suoi ambiti di applicazione, il trattamento dei dati, le responsabilità, i diritti e i doveri dell’istituzione e del ricercatore, la durata di conservazione del dato.

Per dati della ricerca si intendono registrazioni fattuali, che possono assumere la forma di numeri, simboli, testi, immagini o suoni, utilizzati come fonti primarie per la ricerca, comunemente accettate nelle comunità di ricerca come necessarie per convalidare i dati della ricerca (fonte: Griffith Research Data Registry dell'Australian Griffith University).
A titolo esemplificativo possono essere considerati dati i risultati (positivi o negativi) di tutti gli esperimenti rilevanti per la ricerca, fatti, osservazioni, esperienze, fonti edite e inedite, riferimenti bibliografici, software e codici, testi, oggetti del presente o del passato, raccolti o creati in formato digitale e/o cartaceo. I dati della ricerca possono essere espressi in formato numerico, descrittivo, audio o video, ed essere grezzi o elaborati (fonte: Policy di Ateneo per l'accesso aperto alle pubblicazioni e ai dati della ricerca dell'Università degli studi di Bologna).

Dati della ricerca

Sempre più spesso i programmi di finanziamento della ricerca chiedono che i dati della ricerca siano resi disponibili per consentire una validazione delle pubblicazioni scientifiche perché “una ricerca pubblicata senza dati è solo la pubblicità della ricerca” (Barkhiet-Donoho, WaveLab and Reproducible Research, 1995).

Per rendere i dati chiaramente disponibili è necessario abbinarli a licenze appropriate che ne consentano un utilizzo corretto, subordinato alla corretta citazione della fonte (così come avviene per le pubblicazioni OA e l’applicazione delle licenze Creative Commons). 

Di seguito una definizione di dati aperti: “Open data is data that can be freely used, re-used and redistributed by anyone - subject only, at most, to the requirement to attribute and sharealike:  availability and access, re-use and distribution, universal participation, interoperability.The focus is on non-personal data, that is, data which does not contain information about specific individuals For some kinds of government data, national security restrictions may apply“ (fonte: opendatahandbook.org)  

Per questo motivo l’accesso chiuso deve essere motivato (secondo il principio Open Access by default with some opt outs / as open as possible, as closed as necessary) e applicabile a casi specifici ben definiti (tutela della privacy delle persone coinvolte nella ricerca, ragioni di sicurezza, produzione di dati sensibili, sfruttamento economico dei risultati della ricerca/brevetti) o altrimenti ben motivati.

La condivisione dei risultati delle ricerche (dati e pubblicazioni) implica problemi di conservazione, accesso, integrità, licenze; per essere davvero open, i dati devono essere FAIR (Findable - Accesible - Interoperable - Reusable), cioè accessibili, ricercabili, utilizzabili, valutabili e comprensibili (Barend Mons et al., The FAIR Guiding Principles for scientific data management and stewardship in Scientific Data, 2016).

FAIR Data

L’applicazione dei principi FAIR prevede che i dati siano:

  1. Findable: rintracciabili e descritti, utilizzando identificatori persistenti (ossia “codici stabili” formati da stringhe numeriche/alfanumeriche di caratteri che vanno associati in modo univoco e permanente ai dati. Ad esempio: DOI, metadati ricchi e di qualità, possibilmente ontologie e tassonomie standardizzate (Dubin Core, ADS Guides and Guidelines for metadata, DCC guide for Metadata standards ecc.) e repository registrati
  2. Accessible: disponibili per la condivisione e riutilizzo, con il minor numero di restrizioni, salvo motivata decisione contraria, secondo il principio Open Access by default with some opt outs/as open access as possible, as closed as necessary. Accessibile non deve essere scambiato necessariamente per “dato aperto” (possono essere previsti sistemi di autenticazione)
  3. Interoperable: i dati dovrebbero essere salvati in formati non proprietari, non compressi, non criptati, con standard documentati, in grado di essere elaborati da sistemi operativi con linguaggi conformi ai principi FAIR
  4. Reusable: implica l’indicazione per i dati di una licenza di utilizzo e corredati da informazioni relative alla loro formazione

Per maggiori informazioni rimandiamo all'intervento di Susanna Mornati, FAIR DATA e Action Plan, 2018.

La compatibilità dei dati prodotti dalla ricerca con i principi FAIR è garantita dalla corretta elaborazione del Data Management Plan (DMP).

Data Management Plan

Il DMP è lo strumento per eccellenza del research data management per la gestione del workflow dei dati: data collection, data documentation, data storage & backup, data access & security, data preservation & reuse. 

Può essere definito come un piano formale di gestione dei dati che accompagna il lavoro di ricerca e descrive quali dati sono raccolti, processati e generati, dove vengono archiviati, a quali licenze e limitazioni sono legati, chi ha diritto al loro riutilizzo.
Permette una gestione responsabile dei dati che in questo modo sono resi FAIR.

Il DMP è inoltre uno strumento per programmare e comunicare, sino dall’inizio dell’attività, la raccolta, conservazione, riuso e divulgazione dei dati, unitamente ai metadati associati. Quanto più i metadati saranno ricchi, tanto maggiore sarà la discoverability del dato. 

Il DMP è redatto dal principal investigator sotto forma di template (come nel caso dei due schemi proposti dal Data Monitoring Board dell’Ateneo) o tool online (DCC, Data Stewardship Wizard, easyDMP) e rappresenta l’intero ciclo di vita del dato assicurandone tracciabilità, disponibilità, autenticità, citabilità, conservazione appropriata, adesione a parametri legali chiari e l’adozione di misure di sicurezza adeguate, che ne assicurano e disciplinano gli usi successivi.

Il dato dovrà essere: affidabile, robusto, completo, esaustivo, unico, certificato.

Gli attori del DMP sono:

  • ente finanziatore (erogatore del finanziamento, ad esempio la UE)
  • principal investigator (fruitore del finanziamento e redattore del DMP)
  • strutture di supporto (consulenze e supporto con competenze trasversali)
  • istituzione (istituto di ricerca che rilascia la policy sui dati della ricerca, dà valore alla ricerca e ne organizza il supporto)

Per saperne di più si consiglia di consultare il sito del Data Monitoring Board di Ca’ Foscari  che ha elaborato due tipi di DMP: DMP semplificato per Ethic Issues (per la gestione di dati sensibili o comunque problematiche legate alla privacy delle persone coinvolte nella ricerca, quindi i dati rimarranno riservati e protetti), DMP completo per gli Open Data (per la gestione dei dati che possono essere utilizzati, modificati e condivisi da chiunque per qualsiasi motivo, a patto che se ne preservino la provenienza e l’apertura).

L’Open Science è un obiettivo della Commissione Europea e, per supportarla, ha lanciato nel 2015 un’iniziativa a rinforzo delle politiche europee verso la realizzazione della European Open Science Cloud (EOSC) entro il 2020. EOSC è una piattaforma cloud, liberamente accessibile online che si basa su infrastrutture già esistenti e mira a offrire servizi a tutti i livelli per gestire, condividere e riutilizzare i dati della ricerca in sicurezza e nel rispetto delle norme. 

EOSC

"According to the Commission, the EOSC is not an actual cloud service, it is a kind of reengineering of existing e-infrastructures based on scientific data. The EOSC will be a federated environment for the sharing and re-use of scientific data, based on existing and emerging elements in the Member States, with lightweight international guidance and governance and a large degree of freedom regarding practical implementation”.  In this context Open Science is seen in a visionary way, as a movement to make scientific research, data, and dissemination accessible at all levels of an enquiring society. This will be possible only if we understand how to manage and steer the different components and players, at all levels of the Open Science Cloud” (Paolo Budroni, The Data Way to OpenScience - Understanding Policies, 2017).

European Open Science Cloud (EOSC) è un ecosistema tecnologico basato su infrastrutture già esistenti il cui obiettivo è offrire servizi a tutti i livelli per gestire, condividere e riutilizzare i dati della ricerca in sicurezza e nel rispetto delle norme (Realising the European Open Science Cloud).

In EOSC sostenibilità, condivisione e collaborazione sono le parole chiave che si sostituiscono a chiusura e competizione.


Il nostro ateneo è stato tra i primi in Italia a costruire ponti verso la Europen Open Science Cloud promuovendo il movimento dell'Open Science anche attraverso l'organizzazione di eventi e workshop (Open Science @ Ca' Foscari):

Last update: 06/12/2019