Open access, open source, open science. Het is allemaal ‘open’ wat de klok slaat, maar in de praktijk komt er nog niet voldoende van terecht. De wetenschappelijke data en vooral de bijbehorende code om die data te analyseren wordt nog onvoldoende gedeeld. En de ecologie is daarbij geen uitzondering.
“We moeten dringend en op een internationale schaal de reproduceerbaarheid van ecologisch onderzoek vergroten,” legt hoofdauteur Antica Culina van het Nederlands Instituut voor Ecologie (NIOO-KNAW) uit. ”De code is een essentieel onderdeel van het onderzoek. Door het delen van deze code kunnen anderen de resultaten ten volle begrijpen, analyseren en evalueren. En ze kunnen de code vervolgens ook gebruiken in hun eigen werk om zo wetenschappelijke vooruitgang te versnellen.”
delen hun code (en data) achter het onderzoek,
helemaal als je naar de details kijkt. Bron: Szymek Drobniak
Zowel de onderliggende waarnemingen als de computercode om die te onderzoeken zijn nodig om wetenschappelijke resultaten te checken en opnieuw te kunnen gebruiken. Dit kan wel eens in het bijzonder van belang zijn voor de ecologie, vanwege de ingewikkelde modellen die hier gebruikt worden.
Hoeveel wetenschappelijke tijdschriften moedigen het delen van data en code eigenlijk aan? En hoeveel onderzoekers delen het dan werkelijk? Samen met een aantal collega’s van de universiteiten van Bielefeld (Duitsland), Oxford en Exeter (Verenigd Koninkrijk) begon Culina te tellen.
De cijfers van het onderzoeksteam spreken boekdelen. Culina: “Onze resultaten laten samen met eerdere bevindingen zien dat minder dan 20% van het ecologische onderzoek met de computer te reproduceren is uit de oorspronkelijke data.”
Bij een steekproef van een paar honderd wetenschappelijke artikelen over ecologie was er bij 79% data beschikbaar en bij 27% code. Gecombineerd levert dit maar ongeveer 20% van de artikelen op die echt te ‘herhalen’ zijn. De echte aantallen liggen waarschijnlijk nog lager, omdat de onderzoekers alleen naar artikelen hebben gekeken uit wetenschappelijke tijdschriften die het delen van code aanmoedigen of verplichten.
Maar het verhaal gaat nog verder. Een groot deel van de overgebleven literatuur met zowel de bijbehorende code als data gebruikt namelijk software die niet gratis is (26%), noemt de gebruikte software-versie niet (46%) en waarschijnlijk – gebaseerd op eerder onderzoek van Roche en collega’s – zijn veel van de datasets (56%) niet compleet.
“Maar er vallen ook positieve ontwikkelingen te melden,” vult Culina aan. “Meer en meer wetenschappelijke tijdschriften hebben het beleid om code te delen, het grootste deel van de gepubliceerde code is geschreven in software die door iedereen die dat wil gebruikt kan worden en steeds meer code komt in betrouwbare ‘repositories’ te staan.”
De onderzoekers gebruikten:
Ze vonden dat:
Het team internationale onderzoekers hoopt dat deze resultaten tijdschriften, organisaties, financiers en onderzoekers overhalen om wat te doen aan deze “alarmerende situatie”. Ze geven daar ook meteen bruikbare tips bij hoe we dit aan kunnen pakken. Of zoals Culina het zegt: “We roepen echt op tot een drastische toename van beschikbare code. En we vragen wetenschappelijke tijdschriften, auteurs en reviewers allemaal om bij te dragen aan deze hoognodige verandering.”
Geen zorgen: “Het is eigenlijk heel simpel om de code te delen. Wetenschap floreert bij samenwerking en openheid, dus laten we ook de ecologie helpen om te floreren!”
Het Nederlands Instituut voor Ecologie (NIOO-KNAW) is met ruim 300 medewerkers en studenten een van de grootste onderzoeksinstituten van de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW). Het is gespecialiseerd in de ecologie van het water en het land: hoe werkt de natuur? Sinds 2011 is het gevestigd in een duurzaam gebouwd onderzoekspand in Wageningen. De historie van het onderzoek gaat meer dan 65 jaar terug en loopt door ons hele land, en ver daarbuiten.
Voor meer informatie:
Illustratie: infographic over hoeveel wetenschappelijke artikelen ook de bijbehorende code delen. Bron: Szymek Drobniak.
Wetenschappelijk artikel: Low availability of code in ecology: A call for urgent action. Antica Culina, Ilona van den Berg, Simon Evans, Alfredo Sanchez-Tojar, PLOS Biology 18(7): e3000763. https://doi.org/10.1371/journal.pbio.3000763 (open access, natuurlijk…)