Project R-4211

Titel

Queryen van gedistribueerde dynamische gegevens (Onderzoek)

Abstract

De mogelijkheid om naadloos gegevens die zich in een aantal verschillende en verspreide databronnen in querry te plaatsen is een belangrijke drijfkracht in de database onderzoek en heeft geleid tot de ontwikkeling van de eerste gedistribueerde database-systemen reeds in de jaren tachtig. Tegenwoordig is onze informatiemaatschappij gekenmerkt door gegevens die inherent zijn verspreid, maar niet per se verblijven in daadwerkelijk met elkaar verbonden databases. Beschouw bijvoorbeeld, de vele, meestal onafhankelijk opererende, dataverzamelingen in de levenswetenschappen, waar verbindingen tussen gegevensbronnen ofwel hard-gecodeerd als expliciete koppelingen of impliciet door de semantiek van de gegevens kunnen zijn. Terwijl elke dergelijke verzameling kan worden opgevraagd via verschillende portalen, zijn er geen centrale portalen die een geïntegreerde interface voor alle gegevens voorzien. Een belangrijke reden voor het ontbreken van deze gecentraliseerde systemen is de aanhoudende groei van het aantal gegevensbronnen op het web als gevolg van het gemak waarmee wetenschappers de gegevens on-line kan aanbieden. De gecombineerde data omvat derhalve een netwerk van gekoppelde databanken waarin gegevensbronnen dynamisch kunnen worden toegevoegd en verwijderd en waarvan de inhoud kan worden gewijzigd, gekopieerd, veranderd of ingetrokken zonder kennisgeving. Het doel van dit voorstel is het bestuderen en ontwikkelen van technieken voor het opvragen van dergelijke dynamische gedistribueerde dataverzamelingen. Onze aanpak is gebaseerd op drie pijlers: (1) de studie van navigatie-query-talen voor gekoppelde gegevens, (2) de studie van distributed computing methoden voor gedistribueerde query-evaluatie, en, (3) het gebruik van herkomst als een bewakingssysteem voor wijzigingen gegevensbronnen.

Periode

01 januari 2013 - 31 december 2016