Project R-10018

Titel

Een declaratieve benadering voor het optimaliseren van massaal parallelle gegevensverwerking (Onderzoek)

Abstract

Binnen de database research is er een vernieuwde interesse voor parallelle dataverwerking. Hoewel parallelle en gedistribueerde systemen al langer bestaan, brengen cloud computing en de opkomst van big data nieuwe uitdagingen met zich mee. Terwijl parallellisme zich vroeger beperkte tot enkele servers worden nu honderden tot tienduizenden computing nodes gebruikt. Queries zijn niet langer beperkt tot simpele keyword zoekopdrachten, maar omvatten complexe join queries over meerdere database tables om data analyse op grote schaal mogelijk te maken. Daarnaast wordt snelheid niet langer gedomineerd door het aantal I/O requests naar extern geheugen zoals in traditionele systemen, maar door de communicatie nodig om data uit te wisselen over het netwerk tijdens een query evaluatie. Dit vereist nieuwe technieken om complexe queries te analyseren en optimaliseren voor parallelle settings. De opkomst van verschillende systemen bracht echter een opsplitsing van gespecialiseerde technieken met zich mee die moeilijk naar andere systemen overgebracht kunnen worden. In dit project wil ik een uniforme aanpak ontwikkelen om queries te optimaliseren voor parallelle systemen. Meer bepaald omvat mijn projectvoorstel de volgende doelstellingen: (1) een declaratief framework voor parallelle dataverwerking ontwikkelen; (2) beslisbaarheidsproblemen onderzoeken ter ondersteuning van statische analyse van queries in dit framework; (3) algemene technieken voor multi-query optimalisaties onderzoeken.

Periode

01 oktober 2019 - 30 september 2021