Zuid-Afrika en Nederland werken samen aan Big Data doorbraak

Tijdens het bezoek van minister-president Rutte aan Zuid-Afrika is een overeenkomst ondertekend die belangrijke instituten uit beide landen dichter bij elkaar brengt. De Zuid-Afrikaanse-Nederlandse science data samenwerking zorgt ervoor dat we beter kunnen omgaan met de enorme hoeveelheid data die gegenereerd zal worden met de Square Kilometre Array (SKA).

Hierdoor kunnen geheimen rondom de enorme hoeveelheden data, die met de SKA telescoop worden gegenereerd, worden ontrafeld.  De ondertekening van de overeenkomst was onderdeel van het bezoek aan Zuid-Afrika door minister-president Rutte, staatssecretaris van Dam van landbouw en een Nederlandse handelsdelegatie.

SKA Zuid-Afrika en de universiteit van Kaapstad via het onlangs opgerichte Inter-University Institute for Data Intensive Astronomy (IDIA), hebben een Memorandum of Understanding (MoU) ondertekend met Nederlandse partners IBM, Astron en NWO. De samenwerking komt voort uit de reeds bestaande samenwerking tussen Astron, IBM Nederland en het IBM Research Lab in Zürich in het Dome project.

Baanbrekend 

Het MoU betreft een baanbrekend onderzoeksproject naar de voorlopers van SKA regionale science-data centres en werd ondertekend in het ‘House of the Future’ in Johannesburg, een initiatief van de Nederlandse Ambassade in Zuid-Afrika.

Wetenschappelijke data 

De Zuid-Afrika-Nederlandse overeenkomst voor datawetenschap richt zich op het oprichten van nationale en regionale wetenschappelijke datacentra. Dit wordt gedaan om de belangrijkste uitdagingen aan te gaan binnen SKA: hoe beheren, verwerken en maken we de enorme hoeveelheden data beschikbaar die de SKA telescoop zal generen. De nadruk in de komende jaren zal liggen op het archiveren, verspreiden en gebruik van wetenschappelijke data van de Lofar en MeerKat telescopen in Nederland respectievelijk Zuid-Afrika.

De datacentra geven astronomen over de hele wereld toegang tot de grootschalige data-infrastructuur en de bijbehorende high performance computing (HPC) die nodig zijn om de data betekenis te geven. 

Centrale rol voor Nederland

Professor Michael Garrett, Astron’s algemeen en wetenschappelijk directeur zegt:  "Het tekenen van deze overeenkomst is een grote stap – het garandeert dat de enorme datastromen die SKA in Zuid-Afrika zal genereren ten volle benut kunnen worden door de Nederlandse gebruikers. Het is een onderdeel van onze ambitie dat er in Europa een een regionaal wetenschappelijk datacentrum voor SKA komt, en dat Nederland daarin een centrale coördinerende rol speelt"

Alexander Brink van IBM Science Alliances: "Deze uitbreiding op de samenwerking tussen IBM Research en Astron met Zuid-Afrika is een logische stap naar een bredere toepassing van innovaties bij het hanteren van grote hoeveelheden data. Wetenschap op het gebied van data en IT vormt een drie-eenheid met infrastructuur en het maatschappelijk-economisch ecosysteem. Verschillende gebieden in de samenleving, zoals lifesciences, energie en waterbeheer, hebben IT-research nodig en zullen voor essentiële innovaties direct profiteren van doorbraken die uit deze samenwerking voortkomen."

Michael Wise, hoofd van de astronomengroep van Astron: "Het halen van betekenis en kennis uit data is de essentie van wetenschap en ook steeds belangrijker onderdeel van maatschappelijke ontwikkelingen. Nieuwe telescopen zullen veel meer en ook veel complexere data gaan produceren. De uitdaging is om intelligente systemen te ontwikkelen die ons in staat stellen de betekenis te vinden in deze overweldigende hoeveelheid data. Deze samenwerking tussen Astron, SKA Zuid-Afrika, de Universiteit van Kaapstad en IBM biedt ons de kans om de intelligente systemen te ontwikkelen met data van bestaande telescopen zoals Lofar en MeerKat en ons voor te bereiden op SKA."

De data uitdaging voor SKA

SKA (Square Kilometre Array) zal de grootste radiotelescoop ter wereld worden, ongeveer honderd keer groter dan iedere huidige radiotelescoop. Het zal onze begrip van het heelal enorm vergroten. SKA zal in twee fasen worden gebouwd, SKA1 en SKA2, en de bouw begint in 2018. SKA 1 zal twee instrumenten bevatten: SKA 1 Mid (wordt gebouwd in Zuid-Afrika) en SKA1 Low (wordt gebouwd in Australië). Deze instrumenten zullen het heelal observeren op verschillende frequenties.

Door de ontwikkeling van astronomie wordth et steeds duidelijker dat de oude manieren van het behandelen van data niet meer werken. Voorlopers en grondleggers van de SKA telescoop hebben een tijdperk ingeluid van data-intensieve astronomie. Eén van de grondleggers, de Lofar (Low Frequency Array gebouwd door Astron) telescoop, beschikt over een dataverzameling van meer dan 20 petabytes. Ter verduidelijking, het kost ongeveer 2000 jaar om 1 petabyte aan MP3’s af te spelen. 

Met de Zuid-Afrikaanse MeerKAT telescoopen de Nederlandse Apertif telescoop die beide na verwachting in 2016 operationeel zullen zijn, zal de schaal waarop deze data wordt verzameld enorm toenemen. De grote schaal van de datasets en de eisen die astronomen stellen voor het uitvoeren van complexe wetenschappelijke analyses, welke vaak computer-intensief zijn, eisen innovatieve benaderingen. Data op deze schaal brengen unieke uitdagingen met zich mee, niet alleen voor het ordenen van de verzamelde data, maar ook voor hoe wetenschappers hun wetenschap kunnen uitvoeren.

Bij alle voorlopers en grondleggers van de SKA telescoop, wordt de data ter plaatse verzameld, dicht bij de instrumenten zelf. Echter, om zo veel mogelijk betekenis te geven aan de data, moet het eerste niveau van de data beschikbaar zijn voor een grotere wetenschappelijke gemeenschap. Vandaar de noodzaak om innovatieve manieren te ontwikkelen om toegang te krijgen, te beheren en de gegevens te verwerken. Dit is wat de Zuid-Afrika-Nederlandse regionale wetenschap en datacenters (RSDCs) hopen te realiseren.

Hoe kunnen RSDC’s helpen – inclusief meer technische details

Met de eerdere traditionele radio-instrumenten, werd de meerderheid van deze verdere analyses uitgevoerd door een individuele wetenschapper of een wetenschappelijk team. Dit is echter onbegonnen werk met de enorme hoeveelheden data die de SKA telescoop zal generen. Een manier om dit probleem op te lossen is om nationale en regionale op te richten zodat de gebruikers toegang krijgen tot de grote schaal, High Performance Computers (HPC). Hierdoor kunnen zij hun SKA wetenschap uitvoeren.

De belangrijkste doelen van de regionale wetenschap en datacenters (RSDCs)

  • Ervoor zorgen dat de door de instrumenten verzamelde data goed zijn samengesteld en op een gemakkelijk toegankelijke manier beschikbaar gesteld worden voor wetenschappelijke processen.
  • Om lange termijn archieven van wetenschappelijke data behouden.
  • Voldoende extra reken- en opslagcapaciteit aanbieden aan onderzoekers, zodat zij in staat zijn om de gegevens opnieuw te verwerken, op maat gemaakte analyses uit te voeren en om resultaten te visualiseren, zonder dat zij alle data eerst op hun eigen computerfaciliteiten hoeven te zetten.
  • Het aanbieden van excellente ondersteuning aan gebruikers met hun specifieke analyses.
  • Het ontwikkelen en onderhouden van nieuwe functionaliteiten en tools om wetenschappelijke exploitatie toe te laten nemen.
  • Aanbieden van mechanismen voor veiligheid.

Samenwerkende organisaties 

Op 3 september 2015 is de Inter-University voor data intensieve astronomie (IDIA) geïntroduceerd. Deze samenwerking tussen The University of Cape Town, The University of the Western Cape en The North-West University gaat de cruciale capaciteit ontwikkelen voor Big Data Management en analyse, een spin-off van het SKA project. De IDIA-samenwerking verbindt onderzoekers in astronomie, informatica, statistiek en eResearch technologieën, om zo data science capaciteit te creëren voor een leiderschapsrol in de MeerKAT SKA voorloperprojecten, andere voorlopers en verkennende programma’s en SKA belangrijke wetenschap.

Astron, het Nederlandse instituut voor radioastronomie is een onderdeel van de Nederlandse organisatie voor Wetenschappelijk Onderzoek (NWO). Astron heeft twee bekende observatoria in Nederland – de Westerbork Synthese Radio Telescoop en lofar, de Low Frequency Array.

SKA Zuid-Afrika

Het SKA project is een internationale inspanning om ‘s-werelds grootste radiotelescoop te bouwen met een vierkante kilometer oppervlak (een miljoen vierkante meter verzamel gebied). De eerste constructiefase van SKA vindt plaats in Zuid-Afrika en in Australië. In Zuid-Afrika is de SKA locatie in de Karoo, in de buurt van Carnarvon in de noordelijke Kaapprovincie. SKA Zuid-Afrika bouwt de MeerKAT, een 64-atenne array radiotelescoop die dient als een verkennend instrument voor SKA en wordt geïntrigeerd in SKA fase 1.

Het Dome-project onderzoekt benaderingen in Exa-schaal computing/ gegevensverwerking (verwijst naar de capaciteit gegevensverwerking van systemen die ten minste een miljard miljard berekeningen per seconde maken). Gevestigd in het Astron & IBM Centre for Exascale Technology in Drenthe, Nederland. Het onderzoek richt zich op de specificaties van SKA. SKA Zuid-Afrika werd lid van het Dome-project in december 2012.

IBM-NL en Astron werken al sinds 2012 samen in een vijfjarige samenwerking van in totaal 32,9 miljoen euro voor onderzoek naar Exa-schaal computersystemen die nodig zijn voor SKA-onderzoek.