CWI ontwikkelt databasetechnologie voor Europees onderzoeksproject

Een Europees Network of Excellence gaat overheden en andere organisaties helpen om grote hoeveelheden databestanden die beschikbaar zijn op het web aan elkaar te linken. Dit geeft gebruikers toegang tot meer informatie en de mogelijkheid deze informatie beter te interpreteren . Het netwerk heet PlanetData en bestaat uit negen onderzoeksinstituten* uit verschillende Europese landen, waaronder het Centrum Wiskunde & Informatica (CWI) in Amsterdam.

Eén van de belangrijkste doelstellingen van het project is het bouwen van een community.  Organisaties die over grote hoeveelheden bruikbare data beschikken en deze via het web aan elkaar willen koppelen,  kunnen zich hierbij aansluiten.  Het CWI richt zich in het onderzoeksproject op het ontwerp van een  grootschalige streaming datamanagement systeem.

Slimme toepassingen: E-government

Klik op een plattegrond en zie waarheen het overheidsgeld gaat in jouw buurt. Volg het Kamerlid op wie je gestemd hebt en zie welke vergaderingen hij bijwoont, welke werkbezoeken hij aflegt en welke standpunten hij verkondigt. Het zijn voorbeelden van hoe transparant en controleerbaar een overheid wordt die direct gegevens openbaar maakt. Dat maakt overheden naast transparant ook efficiënter: zij kunnen eenvoudig bij elkaars gegevens en burgers met vragen hoeven minder vaak contact te zoeken met een ambtenaar. Maar ook vernieuwende commerciële dienstverlening komt binnen bereik als bestanden openbaar en uitwisselbaar zijn. Denk bijvoorbeeld aan het gebruik van een combinatie van bedrijfsgegevens met verkeersinformatie en GPS-technieken. De Europese Commissie schat dat hergebruik van overheidsinformatie extra economische activiteit ter waarde van 27 miljard euro** kan opleveren.

Technische moeilijkheden te overwinnen

Er zijn nog veel technische moeilijkheden te overwinnen voordat petabytes gestructureerde en ongestructureerde data afkomstig uit  bijvoorbeeld  datacentra,  sensornetwerken, wetenschappelijke databases of Twitter, op een efficiënte manier toegankelijk kunnen worden  gemaakt. Een belangrijke eigenschap van deze data is dat ze onafgebroken binnenkomen. Voor sommige van deze stromen kan de frequentie variëren. Voor het onderzoeksproject gaat de onderzoeksgroep Database Architectures het CWI een streaming database ontwikkelen. In dit nieuwe systeem kan de gebruiker niet alleen zoeken in bestaande data , maar ook in streaming data.

Privacy-aspecten

Behalve op het overwinnen van technische problemen zullen de onderzoekers zich ook richten op privacy-aspecten: hoe kunnen waarborgen worden ingebouwd die ervoor zorgen dat vertrouwelijke informatie niet weglekt, zonder dat openbare informatie onnodig wordt afgeschermd? Doel van PlanetData is om er vanuit de wetenschap aan bij te dragen dat steeds meer grote gegevensbestanden op een verantwoorde manier op het web worden gepubliceerd en dat zij daar vindbaar en bruikbaar zijn.

PlanetData

In PlanetData hebben Europese experts hun krachten gebundeld. Zij zullen bruggen slaan tussen verschillende wetenschappelijke disciplines zoals logica, informatica en taalfilosofie en gaan daarnaast partnerschappen aan met overheden en bedrijven. De bijeenkomsten van de experts binnen PlanetData worden gefinancierd door het Zevende Kaderprogramma van de Europese Commissie. De onderzoeksgroep Database Architectures van het CWI werkt voortdurend aan het verbeteren van databasearchitectuur en datamanagementsystemen. Onder leiding van Martin Kersten werd onder meer het open source datamanagementsysteem MonetDB ontwikkeld dat wereldwijd wordt gebruikt.

* Semantic Technology Institute (STI) ,Oostenrijk ; Centrum Wiskunde & Informatica (CWI), Nederland;  École polytechnique fédérale de Lausanne (EPFL), Zwitserland; Foundation for Research and Technology ¬Hellas (FORTH) , Griekenland; Freie Universität Berlin (FUB),  Duitsland ; Jozef Stefan Institute (IJS), Slovenia;  Karlsruhe Institute of Technology (KIT), Duitsland; Universidad Politecnica Madrid (UPM), Spanje.

** Study on Measuring European Public Sector Information Resources (MEPSIR), juni 2006