Winnaars Dutch Data Prize 2022

december 1, 2022

De winnaars van de Dutch Data Prize 2022 zijn bekend. Uit 51 nominaties blonken drie datasets het meeste uit op het gebied van vindbaarheid, toegankelijkheid, interoperabiliteit en herbruikbaarheid (FAIR). De award werd voor de zevende keer uitgereikt in de categorieën Life Sciences & Health, Natural & Engineering Sciences en Social Sciences & Humanities tijdens de FAIR Data Day op 29 november in de Jaarbeurs te Utrecht.

“Het delen van gegevens helpt de vooruitgang in de wetenschap te versnellen. Gegevens van het ene onderzoeksproject kunnen worden gebruikt om een ander onderzoeksproject vooruit te helpen. Maar alleen je gegevens openstellen is niet genoeg. FAIR data betekent nadenken over de behoeften van degenen die baat kunnen hebben bij de gegevens. Het moedigt betrokkenheid en samenwerking aan…”, zo begint Caroline Visser (NWO) haar speech in de rol van juryvoorzitter tijdens de uitreiking van de Dutch Data Prizes. 

“Vandaag huldigen wij onderzoekers die bijdragen leveren aan hun eigen vakgebied, maar belangrijker nog, die maatregelen nemen om ervoor te zorgen dat de onderzoeksgegevens die zij produceren op grote schaal door anderen kunnen worden hergebruikt.” Visser spreekt namens de gehele jury als zij aangeeft dat ze met veel plezier alle inzendingen hebben bekeken en geëvalueerd. 

DNA barcodes en nieuwe schimmelsoorten 

In de categorie Life Sciences & Health ging de award naar DNA barcodes for fungal identification. Deze dataset viel op door zijn impact, originaliteit en interdisciplinaire relevantie. De dataset bevat meer dan 24.000 DNA-sequenties van 7.300 aanvaarde filamenteuze schimmelsoorten. Schimmels en de identificatie ervan, zijn zeer belangrijk voor de biodiversiteit. Naar schatting vertegenwoordigen schimmels 40% van onze nationale biodiversiteit. Deze dataset is daarom ook relevant voor disciplines en onderwerpen als geneeskunde, voedselzekerheid en materiaalwetenschappen. 

Duong Vu, onderzoeker en maker van de dataset: “Het is voor ons een grote eer om de Dutch Data Prize 2022 te winnen. Onze dataset is het resultaat van een tienjarig DNA barcoding project bij het Westerdijk Fungal Biodiversity Institute, waarbij veel wetenschappers werkten aan verschillende aspecten van het project, waaronder het conserveren van de schimmel stammen van onze collectie, het genereren van DNA barcodes voor de stammen, het ontwikkelen van een systeem om de grote hoeveelheid barcodedata op een FAIR manier te beheren en het valideren van de barcodedata. Het winnen van de prijs geeft ons veel motivatie. Tot op zekere hoogte heb ik het gevoel dat het harde werk van veel mensen loont. Hopelijk worden er in de nabije toekomst meer schimmel-DNA-barcodes vrijgegeven. Ik wil van deze gelegenheid gebruik maken om al mijn collega’s te bedanken die bij het project betrokken zijn en de financieringsorganisaties die ons werk steunen.”

Duong Vu, researcher Westerdijk Fungal Biodiversity Institute

Schilderijen in fragmenten snijden en analyseren

Materials in Paintings (MIP): An interdisciplinary dataset for perception, art history, and computer vision is als dataset stevig geworteld in de computerwetenschap. Voor computer vision and machine learning is het een rijke bron. De set is herbruikbaar over verschillende domeinen en de toepasbaarheid op de kunsten- en geesteswetenschappen maken de dataset bijzonder. In de categorie Natural & Engineering Sciences werd MIP daarom met de award beloond. 

MIP is een geannoteerde dataset van 19.000 schilderijen van de afgelopen 500 jaar. Deze schilderijen werden in meer dan 200.000 fragmenten gesneden. De afgebeelde materialen in elk van deze fragmenten werden geclassificeerd met behulp van algoritmen voor machine learning. Het snijden gebeurde natuurlijk op digitale beelden en niet op de echte! Alle afbeeldingen kunnen worden gedownload in open formaten, zowel als een uitgebreide dataset die beschikbaar is via 4TU.ResearchData als via een interactief portaal waarmee gebruikers door de afzonderlijke schilderijen kunnen bladeren. 

Jan van der Heul, datacurator 4TU.ResearchData en nominator van de dataset MIP

“Ik vond het jammer dat ik er niet persoonlijk bij kon zijn, omdat ik zelf op de universiteit van Kyoto werk, maar ik heb genoten van de updates van mijn teamleden ter plaatse. Ik ben het 4TU-team in Delft persoonlijk erg dankbaar voor de nominatie van ons werk! Ik ben blij te horen dat de jury net zo enthousiast is over ons werk als wij en ik ben vereerd om de winnaar van de Dutch Data prijs te zijn. Het maken van de dataset is veel werk geweest en het is geweldig om zulke positieve reacties te krijgen. 

We willen het prijzengeld besteden aan het organiseren/sponsoren van een conferentie om FAIR data practice in ons vakgebied verder te verspreiden”, aldus Mitchell van Zuylen, een van de dataset eigenaren. 

4.000 kinderen gevolgd van zwangerschap tot adolescentie

YOUth

YOUth is een uitstekend voorbeeld van hoe gegevens kunnen worden gedeeld op een FAIR manier, in overeenstemming met de GDPR, via een transparant proces. Het management team van de Youth cohortstudie is een sterk team van onderzoekers die open science ondersteunen. Daarom is het de winnaar van de Dutch Data Prize in de categorie Social Sciences & Humanities.  

YOUth is een grootschalige, longitudinale cohortstudie die bijna 4.000 kinderen (en hun ouders) in de regio Utrecht volgt, vanaf de zwangerschap tot aan de adolescentie. De YOUth-gegevens zijn beschikbaar voor GDPR-conform gebruik in onderzoek via veilige, beheerde toegang. De dataset gaat vergezeld van zeer gedetailleerde informatie, inclusief visualisaties en video’s over het opvragen van de gegevens. Het team achter deze dataset stimuleert en faciliteert echt uitgebreid en passend gebruik van de gegevens, waardoor het voor andere onderzoekers eenvoudig is om kennis te nemen van de dataset en de gegevens op te vragen voor onderzoeksdoeleinden.

“We zijn supertrots op het winnen van de prijs. Het is een fantastische erkenning van alle tijd en energie die we als team in het creëren en FAIR maken van de dataset investeren. We hebben dit vanuit Utrecht University en het UMCU samen gedaan, met al onze meetassistenten, beleidsmedewerkers, de front office, de datamanagers, communicatieadviseurs, technici, teamleiders, de universiteitsbibliotheek, IT services, onze onderzoekers, het management team en onze deelnemers. Als het ons lukt met onze grote hoeveelheden complexe, gevoelige data, dan moet het voor veel andere onderzoeken ook mogelijk zijn om data FAIR te maken”, aldus Coosje Veldkamp, projectmanager YOUth. 

Coosje Veldkamp (tweede van links), projectmanager YOUth en teamleden.

Herbruikbare onderzoeksdata loont

Om de twee jaar wordt de Dutch Data Prize uitgereikt aan een individu of een team dat goed herbruikbare onderzoeksdata en deze in een repository beschikbaar stelt. De prijs is een waardevolle erkenning voor de bijdragen van onderzoekers aan hun eigen vakgebied en aan het principe van FAIR data. Naast de award is er prijzengeld om data meer FAIR te maken en hergebruik van data aan te moedigen. De winnaars kunnen hiermee bijvoorbeeld een symposium organiseren of hun data online beter toegankelijk maken. 

De Dutch Data Prize wordt sinds 2010 uitgereikt. Dit zijn de eerdere winnaars