‘Big Data at High Performance’

Computer hardwaresystemen hebben zich ontwikkeld van monolithische machines met een component voor elke taak, tot complexe hardwaresystemen met een breed scala aan heterogene componenten zoals spinning discs, SSD’s, RAM, CPU. Wanneer deze verschillende geheugencomponenten samenwerken om een bepaalde taak te volbrengen verloopt die samenwerking echter verre van efficiënt.

In zijn proefschrift onderzoekt Holger Pirk, die onlangs promoveerde aan het Centrum Wiskunde & Informatica (CWI) in Amsterdam, het beheer van relationele data in dergelijke moderne computersystemen. Hierbij richt hij zich op de vraag hoe prestaties van dataverwerking kunnen worden verbeterd. De resultaten van zijn proefschrift zijn relevant voor bedrijven die een beroep doen op snelle data-analyse voor hun services zoals internetbedrijven en creditcardmaatschappijen.

Pirk legt in zijn onderzoek  een relatie tussen de asymmetrische  eigenschappen van de geheugencomponenten (zoals snel & klein versus langzaam & groot) en de asymmetrie in toegang tot data (opeenvolgend versus random) en onderzoekt  verschillende strategieën om de asymmetrie in datamanagementapplicaties en in de componenten van het geheugen te identificeren en te matchen. Deze strategieën kunnen uiteindelijk worden toegepast om de prestaties van hardwaresystemen te verbeteren.  

Daarnaast richt Pirk zich op de samenhang tussen data-opslag en queryverwerking. Gebaseerd op Just-in-time compilatie als query processing model, ontwikkelde hij een nieuw verwerkingsmodel dat efficiënt gebruik maakt van de asymmetrie in de onderliggende data en de componenten van het geheugen.

Het onderzoek levert een belangrijke bijdrage aan nieuwe oplossingen voor een snellere verwerking en analyse van grote datasets.