This current PhD thesis aims at researching solutions to the long-standing gap in the research infrastructure field of formal modelling and discovery of information. Research Infrastructures (RIs) are facilities, resources and services used by the research community to conduct research and promote innovation. They provide access to tools, data and algorithms, pooled on working environments named Virtual Research Environments (VREs). Due to their nature, Research Infrastructures (RIs) are a heterogeneous landscape of resource types and diverse, often redundant, models for describing the same resource entities. Such diversity drastically diminishes the capabilities of a consistent fruition of the knowledge and skills available within an infrastructure, and ultimately limits the creation of federations of RI. The current state of knowledge in the field is even more complex due to the emerging concept of Hybrid Data Infrastructures (HDIs), which combine on-premises resources with resources provisioned by cloud and/or grid computing infrastructures. The focus of this study is to address the critical aspects of this heterogeneity and provides to the research infrastructure field both the conceptual and analytical instruments for expanding the scale at which the infrastructures currently operate. The following research questions are investigated in this study: - Research question 1: Is it possible to formalise a uniform resource model to seamlessly federate research infrastructures? - Research question 2: To what extent do state-of-the-art discovery algorithms need to be amended to properly handle VREs across Hybrid Data Infrastructures? - Research question 3: To what extent does the interface of a discovery service can support the new model and algorithms? First objective is attained with the definition of a resource model open by design. An accurate mathematical notation presents a minimal but powerful model consisting of few constructs. This is an abstract model, which can be instantiated to accommodate almost every possible scenario. Second objective is confronted with the design of a novel communication model based on the concept of transaction. Transactional models are not a new idea; rather they have been extensively described in the literature since the 80s. However, this work identifies a misapplication of these models in the context of research infrastructure and proposes changes to support the emerging requirements in the field. Lastly, the third objective refers to the impact that the first two questions have on architectural aspects of the services devoted to distribute the information in a research infrastructure. This point is deeply investigated with a detailed design of a production-ready solution to prove the validity and accuracy of the theoretical aspects of this thesis. The originality of the proposed thesis consists also in its methodology. In fact, this dissertation offers an innovative analytical and methodological approach to address these research questions. A key-enabling component of modern Hybrid Data Infrastructures, the Information System (IS), is used as platform to validate this work. An IS is central to all the themes tackled in this thesis. It exploits the resource model, plays the role of registry inside the infrastructure, deals with an intensive communication with all the other actors and works with the heterogeneity of such a context. Its ultimate goal is to provide uniform views of the resources assigned to each VRE, regardless of their origin. The study presented in this thesis has been conducted within the InfraScience group, the research group pioneering the Enabling Scientific Data Infrastructures field in the past two decades. The group operates at the Institute of Information Science and Technologies (ISTI), an institute of the Italian National Research Council (CNR). This invaluable environment provided a unique ground to develop and validate the theories illustrated in the thesis. Focusing on the validation, the abstract resource model has been instantiated in the gCube model of the D4Science HDI, while the transactional model has been translated in the design of the IS, successfully implemented and adopted by the same HDI. The dissertation carries innovative theoretical, methodological and analytical value in the research infrastructure field and especially in the emerging Hybrid Data Infrastructures. Importantly, this work has been validated in one of the most challenging contexts available. The thesis is organised in chapters: Chapters 1 and 2 describe the problem statement; Chapter 3 provides a state-of-the-art overview of the problem; Chapter 4 develops the theoretical framework by describing both the abstract and gCube resource models; Chapters 5 presents transaction model, how it can be used, and why it focuses on the transaction technique; Chapter 6 offers the core methodological support with the description of the IS to support the abstract resource model and the transaction model and; Chapters 7 and 8 conclude with the validation of proposed study and the contribution to the literature it provides.

Questa tesi di dottorato si propone di ricercare soluzioni alle lacune nel campo delle infrastrutture di ricerca riguardo la loro modellazione formale e la scoperta delle informazioni. Le infrastrutture di ricerca sono un insieme di risorse e servizi utilizzati da una comunità scientifica per condurre ricerche e promuovere l'innovazione. Forniscono accesso a strumenti, dati e algoritmi, riuniti in ambienti di lavoro denominati ambienti di ricerca virtuali - Virtual Research Environment (VRE). A causa della loro natura, le infrastrutture di ricerca sono un insieme eterogeneo di tipi di risorse e modelli diversi, spesso ridondanti, per descrivere le stesse entità. Tale diversità riduce drasticamente le capacità di una fruizione coerente delle conoscenze e delle competenze disponibili all'interno di un'infrastruttura e, in ultima analisi, limita la creazione di federazioni. Lo stato attuale delle conoscenze sul campo è ancora più complesso a causa del concetto emergente di Hybrid Data Infrastructure (HDI), che combina risorse locali con risorse fornite da altre infrastrutture. L'obiettivo di questo studio è quello di affrontare gli aspetti critici di questa eterogeneità e fornire al campo delle infrastrutture di ricerca sia gli strumenti concettuali che analitici per espandere la scala a cui le infrastrutture operano attualmente. Le seguenti domande di ricerca sono state investigate in questo studio: 1) È possibile formalizzare un modello di risorse uniformi per federare in modo trasparente le infrastrutture di ricerca? 2) In che misura è necessario modificare gli algoritmi di scoperta delle informazioni per gestire correttamente i VRE attraverso le HDI? 3) In che misura l'interfaccia di un servizio di scoperta può supportare il nuovo modello e gli algoritmi? Il primo obiettivo è stato raggiunto con la definizione di un modello di risorse aperto per progetto. Un'accurata notazione matematica presenta un modello minimale ma potente costituito da pochi costrutti. Questo è un modello astratto, che può essere istanziato per adattarsi a quasi tutti gli scenari possibili. Il secondo obiettivo è confrontato con la progettazione di un nuovo modello di comunicazione basato sul concetto di transazioni. I modelli transazionali non sono una nuova idea; piuttosto sono stati ampiamente descritti in letteratura dagli anni '80. Tuttavia, questo lavoro identifica un'applicazione errata di questi modelli nel contesto delle infrastrutture di ricerca e propone modifiche per supportare i requisiti emergenti nel campo. Infine, il terzo obiettivo si riferisce all'impatto che le prime due domande hanno sugli aspetti architettonici dei servizi dedicati alla distribuzione delle informazioni di un'infrastruttura di ricerca. Questo punto è stato approfondito con una progettazione dettagliata di una soluzione pronta per la produzione per dimostrare la validità e l'accuratezza degli aspetti teorici di questa tesi. L'originalità della tesi proposta consiste anche nella sua metodologia. In realtà, questa tesi offre un approccio analitico e metodologico innovativo per rispondere a queste domande di ricerca. Un componente chiave per l'abilitazione delle moderne HDI, il sistema informativo (Information System (IS)), viene utilizzato come piattaforma per convalidare questo lavoro. Un IS è centrale in tutti i temi affrontati in questa tesi. Sfrutta il modello di risorse, svolge il ruolo di registro all'interno dell'infrastruttura, gestisce una comunicazione intensiva con tutti gli altri attori e lavora con l'eterogeneità di tale contesto. Il suo obiettivo finale è fornire una visione uniforme delle risorse assegnate a ciascun VRE, indipendentemente dalla loro origine. Lo studio presentato in questa tesi è stato condotto all'interno del gruppo InfraScience, il gruppo di ricerca pioniere nel campo delle infrastrutture di ricerca scientifica negli ultimi due decenni. Il gruppo opera presso l'Istituto di Scienze e Tecnologie dell'Informazione (ISTI), un istituto del Consiglio Nazionale delle Ricerche (CNR). Questo ambiente inestimabile ha fornito un punto di partenza unico per sviluppare e convalidare le teorie illustrate nella tesi. Concentrandosi sulla validazione, il modello di risorse astratte è stato istanziato nel modello gCube di D4Science HDI, mentre il modello transazionale è stato tradotto nella progettazione del Sistema Informativo, implementato con successo e adottato dalla stessa HDI. La tesi presenta un valore innovativo teorico, metodologico e analitico nel campo delle infrastrutture di ricerca e in particolare nelle emergenti infrastrutture ibride di dati. È importante sottolineare che questo lavoro è stato convalidato in uno dei contesti più impegnativi disponibili. La tesi è organizzata in capitoli: i capitoli 1 e 2 descrivono la definizione del problema; il capitolo 3 fornisce una panoramica sullo stato dell'arte; il capitolo 4 sviluppa il quadro teorico descrivendo sia i modelli astratti che i modelli di risorse gCube; il capitolo 5 presenta il modello transazionale, come può essere utilizzato e perché si concentra sulla tecnica della transazione; il capitolo 6 offre il supporto metodologico principale con la descrizione dell'IS per supportare il modello di risorsa astratto e il modello delle transazioni; infine i capitoli 7 e 8 forniscono la validazione dello studio proposto e il contributo di ricerca.

Transactional REST Information System for Federated Research Infrastructures enabling Virtual Research Environments / Frosini L.. - (17/05/2019), pp. 1-163.

Transactional REST Information System for Federated Research Infrastructures enabling Virtual Research Environments

Frosini L
17/05/2019

Abstract

This current PhD thesis aims at researching solutions to the long-standing gap in the research infrastructure field of formal modelling and discovery of information. Research Infrastructures (RIs) are facilities, resources and services used by the research community to conduct research and promote innovation. They provide access to tools, data and algorithms, pooled on working environments named Virtual Research Environments (VREs). Due to their nature, Research Infrastructures (RIs) are a heterogeneous landscape of resource types and diverse, often redundant, models for describing the same resource entities. Such diversity drastically diminishes the capabilities of a consistent fruition of the knowledge and skills available within an infrastructure, and ultimately limits the creation of federations of RI. The current state of knowledge in the field is even more complex due to the emerging concept of Hybrid Data Infrastructures (HDIs), which combine on-premises resources with resources provisioned by cloud and/or grid computing infrastructures. The focus of this study is to address the critical aspects of this heterogeneity and provides to the research infrastructure field both the conceptual and analytical instruments for expanding the scale at which the infrastructures currently operate. The following research questions are investigated in this study: - Research question 1: Is it possible to formalise a uniform resource model to seamlessly federate research infrastructures? - Research question 2: To what extent do state-of-the-art discovery algorithms need to be amended to properly handle VREs across Hybrid Data Infrastructures? - Research question 3: To what extent does the interface of a discovery service can support the new model and algorithms? First objective is attained with the definition of a resource model open by design. An accurate mathematical notation presents a minimal but powerful model consisting of few constructs. This is an abstract model, which can be instantiated to accommodate almost every possible scenario. Second objective is confronted with the design of a novel communication model based on the concept of transaction. Transactional models are not a new idea; rather they have been extensively described in the literature since the 80s. However, this work identifies a misapplication of these models in the context of research infrastructure and proposes changes to support the emerging requirements in the field. Lastly, the third objective refers to the impact that the first two questions have on architectural aspects of the services devoted to distribute the information in a research infrastructure. This point is deeply investigated with a detailed design of a production-ready solution to prove the validity and accuracy of the theoretical aspects of this thesis. The originality of the proposed thesis consists also in its methodology. In fact, this dissertation offers an innovative analytical and methodological approach to address these research questions. A key-enabling component of modern Hybrid Data Infrastructures, the Information System (IS), is used as platform to validate this work. An IS is central to all the themes tackled in this thesis. It exploits the resource model, plays the role of registry inside the infrastructure, deals with an intensive communication with all the other actors and works with the heterogeneity of such a context. Its ultimate goal is to provide uniform views of the resources assigned to each VRE, regardless of their origin. The study presented in this thesis has been conducted within the InfraScience group, the research group pioneering the Enabling Scientific Data Infrastructures field in the past two decades. The group operates at the Institute of Information Science and Technologies (ISTI), an institute of the Italian National Research Council (CNR). This invaluable environment provided a unique ground to develop and validate the theories illustrated in the thesis. Focusing on the validation, the abstract resource model has been instantiated in the gCube model of the D4Science HDI, while the transactional model has been translated in the design of the IS, successfully implemented and adopted by the same HDI. The dissertation carries innovative theoretical, methodological and analytical value in the research infrastructure field and especially in the emerging Hybrid Data Infrastructures. Importantly, this work has been validated in one of the most challenging contexts available. The thesis is organised in chapters: Chapters 1 and 2 describe the problem statement; Chapter 3 provides a state-of-the-art overview of the problem; Chapter 4 develops the theoretical framework by describing both the abstract and gCube resource models; Chapters 5 presents transaction model, how it can be used, and why it focuses on the transaction technique; Chapter 6 offers the core methodological support with the description of the IS to support the abstract resource model and the transaction model and; Chapters 7 and 8 conclude with the validation of proposed study and the contribution to the literature it provides.
17
Istituto di Scienza e Tecnologie dell'Informazione "Alessandro Faedo" - ISTI
Questa tesi di dottorato si propone di ricercare soluzioni alle lacune nel campo delle infrastrutture di ricerca riguardo la loro modellazione formale e la scoperta delle informazioni. Le infrastrutture di ricerca sono un insieme di risorse e servizi utilizzati da una comunità scientifica per condurre ricerche e promuovere l'innovazione. Forniscono accesso a strumenti, dati e algoritmi, riuniti in ambienti di lavoro denominati ambienti di ricerca virtuali - Virtual Research Environment (VRE). A causa della loro natura, le infrastrutture di ricerca sono un insieme eterogeneo di tipi di risorse e modelli diversi, spesso ridondanti, per descrivere le stesse entità. Tale diversità riduce drasticamente le capacità di una fruizione coerente delle conoscenze e delle competenze disponibili all'interno di un'infrastruttura e, in ultima analisi, limita la creazione di federazioni. Lo stato attuale delle conoscenze sul campo è ancora più complesso a causa del concetto emergente di Hybrid Data Infrastructure (HDI), che combina risorse locali con risorse fornite da altre infrastrutture. L'obiettivo di questo studio è quello di affrontare gli aspetti critici di questa eterogeneità e fornire al campo delle infrastrutture di ricerca sia gli strumenti concettuali che analitici per espandere la scala a cui le infrastrutture operano attualmente. Le seguenti domande di ricerca sono state investigate in questo studio: 1) È possibile formalizzare un modello di risorse uniformi per federare in modo trasparente le infrastrutture di ricerca? 2) In che misura è necessario modificare gli algoritmi di scoperta delle informazioni per gestire correttamente i VRE attraverso le HDI? 3) In che misura l'interfaccia di un servizio di scoperta può supportare il nuovo modello e gli algoritmi? Il primo obiettivo è stato raggiunto con la definizione di un modello di risorse aperto per progetto. Un'accurata notazione matematica presenta un modello minimale ma potente costituito da pochi costrutti. Questo è un modello astratto, che può essere istanziato per adattarsi a quasi tutti gli scenari possibili. Il secondo obiettivo è confrontato con la progettazione di un nuovo modello di comunicazione basato sul concetto di transazioni. I modelli transazionali non sono una nuova idea; piuttosto sono stati ampiamente descritti in letteratura dagli anni '80. Tuttavia, questo lavoro identifica un'applicazione errata di questi modelli nel contesto delle infrastrutture di ricerca e propone modifiche per supportare i requisiti emergenti nel campo. Infine, il terzo obiettivo si riferisce all'impatto che le prime due domande hanno sugli aspetti architettonici dei servizi dedicati alla distribuzione delle informazioni di un'infrastruttura di ricerca. Questo punto è stato approfondito con una progettazione dettagliata di una soluzione pronta per la produzione per dimostrare la validità e l'accuratezza degli aspetti teorici di questa tesi. L'originalità della tesi proposta consiste anche nella sua metodologia. In realtà, questa tesi offre un approccio analitico e metodologico innovativo per rispondere a queste domande di ricerca. Un componente chiave per l'abilitazione delle moderne HDI, il sistema informativo (Information System (IS)), viene utilizzato come piattaforma per convalidare questo lavoro. Un IS è centrale in tutti i temi affrontati in questa tesi. Sfrutta il modello di risorse, svolge il ruolo di registro all'interno dell'infrastruttura, gestisce una comunicazione intensiva con tutti gli altri attori e lavora con l'eterogeneità di tale contesto. Il suo obiettivo finale è fornire una visione uniforme delle risorse assegnate a ciascun VRE, indipendentemente dalla loro origine. Lo studio presentato in questa tesi è stato condotto all'interno del gruppo InfraScience, il gruppo di ricerca pioniere nel campo delle infrastrutture di ricerca scientifica negli ultimi due decenni. Il gruppo opera presso l'Istituto di Scienze e Tecnologie dell'Informazione (ISTI), un istituto del Consiglio Nazionale delle Ricerche (CNR). Questo ambiente inestimabile ha fornito un punto di partenza unico per sviluppare e convalidare le teorie illustrate nella tesi. Concentrandosi sulla validazione, il modello di risorse astratte è stato istanziato nel modello gCube di D4Science HDI, mentre il modello transazionale è stato tradotto nella progettazione del Sistema Informativo, implementato con successo e adottato dalla stessa HDI. La tesi presenta un valore innovativo teorico, metodologico e analitico nel campo delle infrastrutture di ricerca e in particolare nelle emergenti infrastrutture ibride di dati. È importante sottolineare che questo lavoro è stato convalidato in uno dei contesti più impegnativi disponibili. La tesi è organizzata in capitoli: i capitoli 1 e 2 descrivono la definizione del problema; il capitolo 3 fornisce una panoramica sullo stato dell'arte; il capitolo 4 sviluppa il quadro teorico descrivendo sia i modelli astratti che i modelli di risorse gCube; il capitolo 5 presenta il modello transazionale, come può essere utilizzato e perché si concentra sulla tecnica della transazione; il capitolo 6 offre il supporto metodologico principale con la descrizione dell'IS per supportare il modello di risorsa astratto e il modello delle transazioni; infine i capitoli 7 e 8 forniscono la validazione dello studio proposto e il contributo di ricerca.
Information System
REST
REST Transaction
Virtual Research Environment
Research Infrastructure
Hybrid Data Infrastructure
Information System Model
Prof. Cinzia Bernardeschi, Dr. Pasquale Pagano, Prof. Alessio Vecchio
File in questo prodotto:
File Dimensione Formato  
prod_416420-doc_146790.pdf

accesso aperto

Descrizione: Transactional REST Information System for Federated Research Infrastructures enabling Virtual Research Environments
Dimensione 5.46 MB
Formato Adobe PDF
5.46 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14243/361953
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact