menu

UHasselt


Nieuws

Universiteit Hasselt - Knowledge in action

< OVERZICHT

UHasselt-onderzoeker ontwikkelt systeem voor snellere en goedkopere berekening Big Data    27 sep 2016

UHasselt-onderzoeker ontwikkelt systeem voor snellere en goedkopere berekening Big Data
27 sep 2016

Voor zijn doctoraatsonderzoek ontwikkelde Jonny Daenen (faculteit Wetenschappen) een systeem – ‘Gumbo’ – waarmee Big Data sneller en goedkoper berekend en geanalyseerd kunnen worden. “Het principe is eenvoudig: je geeft je vraag over bepaalde data in, Gumbo zoekt dan de beste manier om die te evalueren”, zegt dr. Daenen.

Meer dan 90% van alle beschikbare data werd in de afgelopen twee jaar gegenereerd. “Het is onmogelijk om die data manueel te analyseren. Om in die zee van gegevens te zoeken naar interessante patronen heb je automatische software nodig”, zegt Jonny Daenen (UHasselt). “Bij Big Data gebeurt de analyse door meerdere computers. Maar wanneer de hoeveelheid data te groot wordt – denk aan Google of Facebook – dan heb je miljoenen machines nodig. Dat kost natuurlijk veel geld.”

Gumbo
De kersverse doctor in de informatica voerde daarom onderzoek naar goedkopere en snellere berekeningsmethoden voor Big Data. “Mijn aandacht ging daarbij vooral uit naar ‘parallel computing’ – computertechnieken die meerdere databerekeningen tegelijkertijd doen. Hierdoor zijn er minder machines nodig, maar je moet niet langer wachten op het resultaat.”

Het resultaat van dat onderzoek is Gumbo. Jonny Daenen: “Gumbo is gebouwd op het parallel systeem Hadoop. Voor een antwoord op Big Data-vragen zijn er verschillende methoden die je kan gebruiken. Sommige zijn snel, andere goedkoop. Gumbo kan voor een bepaald soort vragen snelle én goedkope antwoorden genereren. Zo detecteert ons systeem eventuele overlappingen in vragen en vermijdt het dus dubbele berekeningen. Zulke overlappingen komen bij Big Data vaak voor.”

Gumbo is vrij online beschikbaar. “Onze hoop is nu dat dit prototype zal worden opgepikt én geïntegreerd in een bestaand systeem om Big Data te analyseren”, aldus dr. Daenen.

Inzichten
“Big Data-systemen schieten als paddenstoelen uit de grond, maar verdwijnen soms ook weer even snel. Daarom is het belangrijk om inzichten te verkrijgen die overdraagbaar zijn over systemen heen”, zegt prof. dr. Frank Neven, promotor van het doctoraatsonderzoek. “Jonny’s doctoraatsonderzoek speelt hier perfect op in door nieuwe evaluatie-algoritmen te ontwikkelen die op allerlei systemen kunnen werken.”


Gumbo downloaden kan via https://github.com/JonnyDaenen/Gumbo