Project R-5493

Titel

Een formele aanpak voor het ondervragen van grote hoeveelheden data (Onderzoek)

Abstract

De afgelopen jaren is "big data" een modewoord geworden in zowel de onderzoeksgemeenschap alsook technologie en zelfs reguliere media. De term "big data" verwijst meestal naar een context waarin datavolumes worden gemeten met Gigabytes, Terabytes vaak voorkomen, en veel internet bedrijven, wetenschappelijke en financiële instellingen te maken krijgen met Petabytes aan informatie. Door de praktische noodzaak zijn er verschillende systemen ontstaan voor het verwerken van big data, zoals Mapreduce (geïntroduceerd door Google), samen met tal van varianten en uitbreidingen. Hoewel de karakteristieken van de hierboven vermelde systemen verschillend zijn, wijken ze af van traditionele database systemen door het gebruik van parallellisatie en data-distributie als cruciaal element voor het afhandelen van de zeer grote, en groeiende, data-collecties. Voortgang in het database onderzoek heeft geleid tot een diepgaand inzicht in traditionele data modellen en sequentiële ondervragingen, maar er ontbreekt een gelijkaardig begrip voor berekeningen op "big data". Gegeven het aantal concurrerende systemen en hun diversiteit, blijft het onduidelijk welk systeem het best geschikt is voor welk soort van ondervragingen. Dit werk richt zich daarom op de ontwikkeling en studie van computationele modellen voor grote hoeveelheden data om inzicht te verkrijgen in het gebruik van bestaande systemen en om mogelijke verbeteringen te formuleren.

Periode

01 oktober 2014 - 30 september 2016