Duurzame archivering

Vertegenwoordigt u een onderzoeksinstelling of onderzoeksfinancier, of bent u zelf onderzoeker? En gunt u onderzoeksdata een langer leven, zodat we meer vragen uit samenleving en wetenschap kunnen beantwoorden? Dan zijn de duurzame dataservices van Research Data Netherlands mogelijk relevant. Research Data Netherlands biedt langetermijnopslag in Trustworthy Digital Repositories (TDR) en zorgt dat uw onderzoeksdata vindbaar blijft via Persistent Identifiers. Zo kunt u bestaande data hergebruiken en uw eigen data veilig en langdurig archiveren.

Langetermijnopslag en -toegang

Als instelling, onderzoekscommunity of onderzoeker kunt u (selecties van) uw onderzoeksdata voor de lange termijn archiveren in een Trustworthy Digital Repository. De RDNL-partners bieden deze gestandaardiseerde en goed gedocumenteerde opslag, zodat de vindbaarheid en de herbruikbaarheid van de data zijn gewaarborgd. Financiers eisen steeds vaker dat u uw onderzoeksdata in een Trustworthy Digital Repository deponeert, maar hieronder staan nog drie andere use cases voor duurzame archivering.

USE CASE 1

USE CASE 1

voor instellingen, front-offices, research support office

Een universiteit wil de onderzoeksdata van haar onderzoekers die nu in een lokaal datamanagementsysteem zijn opgeslagen, preserveren voor de lange termijn. Via een koppeling van het institutionele systeem naar een langetermijnarchief worden data en metadata rechtstreeks overgezet, zodat de onderzoeker de data niet nogmaals hoeft te deponeren. De instelling is verantwoordelijk voor de naleving van de deponeer-eisen van het duurzame archief (zoals preferred formats, metadata). Vervolgens kan de universiteit de Persistent Identifier die het duurzame archief toekent, in het institutionele systeem opnemen. 

Zie 'Data archiveren bij de RDNL-partners' en 'Betrouwbaarheid bij de RDNL-partners'.

USE CASE 2

USE CASE 2

voor onderzoekers die hun gegevens goed willen archiveren

Een onderzoeker zoekt veilige opslag voor zijn data om deze beschikbaar te maken voor hergebruik en verificatie. Bovendien wil de onderzoeksfinancier in de eindrapportage een Persistent Identifier van de data hebben, om eraan te kunnen refereren.

De onderzoeker informeert eerst bij zijn front-office (research support office) of er binnen de eigen instelling dan wel het vakgebied afspraken zijn met duurzame archieven. 

Kan uw front-office u niet verder helpen, zie dan 'Data archiveren bij de RDNL-partners' en 'Betrouwbaarheid bij de RDNL-partners'.

USE CASE 3

USE CASE 3

voor onderzoekers die geschikte data zoeken

Een onderzoeker wil haar bevindingen vergelijken met die van anderen. Binnen haar eigen vakgroep kan ze voortbouwen op onderzoek van collega's, maar hoe zit het daarbuiten? Via het onderzoeksportal NARCIS.nl komt ze terecht bij een data-archief binnen RDNL dat data op haar vakgebied heeft. Een deel ervan is direct open toegankelijk; voor andere data krijgt ze op verzoek toestemming van de oorspronkelijke onderzoekers om de data te gebruiken, op voorwaarde dat ze haar bewerking van de data eveneens duurzaam toegankelijk maakt.

Zie: 'Bestaande data bij de RDNL-partners gebruiken'.

Gedetailleerde informatie over de diensten van de partners

1. Bestaande data bij de RDNL-partners gebruiken

Datagebruik in andere systemen 

Toelichting

Open Science, Open Access en Open Data worden steeds belangrijker. RDNL ondersteunt dit vanzelfsprekend, en erkent tegelijkertijd dat sommige data niet met iedereen gedeeld kunnen worden; hiervoor bestaan bijvoorbeeld een tijdelijk embargo en Restricted Access. 

4TU.ResearchData-archief

Alle data zijn Open Access. Daarnaast is een embargo met een maximum van twee jaar mogelijk. 

DANS EASY

Er zijn verschillende opties beschikbaar, waaronder Open Access CC0 Waiver. Daarnaast is een embargo met een maximum van twee jaar mogelijk.  

SURFsara TDR

Alle data zijn standaard Open Access, maar de toegang kan beperkt worden tot specifieke gebruikers of groepen. Embargo's zijn door gebruikers zelf in te stellen.

Licenties voor datagebruik

Toelichting

De onderzoeker of instelling kiest bij het deponeren van een dataset voor Open of Restricted Access e.d. Deze keuze bepaalt wat een gebruiker met de dataset mag doen, en een gebruikslicentie maakt dit expliciet.  

4TU.ResearchData-archief

Meer over licenties voor datagebruik bij het archief van 4TU.ResearchData. 

DANS EASY

Meer over licenties voor datagebruik bij DANS EASY. 

SURFsara TDR

Licentie wordt bij het deponeren van de data gekozen door de gebruiker.

Voornaamste vakgebieden

Toelichting

Archieven verschillen in de vakgebieden waarop zij zich (primair) richten. Dit hoeft overigens geen belemmering te zijn om 'disciplinevreemde' data te deponeren, bijvoorbeeld als het een bestandsformaat betreft waarmee het betreffende archief veel ervaring heeft. 

4TU.ResearchData-archief

Exacte en technische wetenschappen 

DANS EASY

Sociale en geesteswetenschappen

SURFsara TDR

Generiek

Datagebruik in andere systemen 

Toelichting

Voor onderzoekers die data uit een archief willen analyseren of bewerken in een applicatie, is het praktisch als het archief met die applicatie te koppelen valt. 

4TU.ResearchData-archief

Voor bepaalde datatypen (bijv. NetCDF) bieden we toegang via het OpenDAP protocol waarmee directe toegang vanuit programmeertalen (waaronder Python) mogelijk is. 

DANS EASY

EASY biedt geen rechtstreekse koppelingen aan naar specifieke applicaties. Wel wordt waar mogelijk doorverwezen naar externe partijen die deze functionaliteit bieden (bijvoorbeeld CentERdata voor panel- en surveydata).  

SURFsara TDR

Voor de toegang tot de data worden verschillende transportprotocollen ondersteund die geschikt zijn voor toepassingen onder zowel Linux-, OSX- als Windows-omgevingen. Daarnaast is er uitstekende toegang naar andere SURFsara-faciliteiten waaronder HPC Cloud, Supercomputer en Grid.

2. Data archiveren bij de RDNL-partners

Licenties bij datadeponering

Toelichting

Wie een dataset deponeert (archiveert), sluit een licentie met een archief, waarin bijvoorbeeld staat wat het archief met de data mag en moet doen, en welke rechten de deponeerder op de data houdt.  

4TU.ResearchData-archief

Over licenties bij datadeponering bij het archief van 4TU.ResearchData.

DANS EASY 

Over licenties bij datadeponering bij DANS EASY.

SURFsara TDR

De deponeerlicentie bij het deponeren van de dataset dient geaccepteerd te worden. De deponeerder blijft eigenaar van de data.

Data bij een archief deponeren (ingest)

Toelichting

Archieven bieden de onderzoeker of instelling verschillende manieren om data te deponeren, bijvoorbeeld afhankelijk van de omvang van de data of op basis van een deponeringsovereenkomst. Voor 'deponeren' wordt ook de term 'ingest' gebruikt.

4TU.ResearchData-archief

- Webtoegang voor individuele deponeerders

- Bulk (via data engineer)

DANS EASY

- Webtoegang voor individuele deponeerders

- API voor instellingen of communities (SWORD-interface, op contractbasis)

- Bulk (op contractbasis)

SURFsara TDR

- Webtoegang voor individuele deponeerders

- API voor instellingen of communities (op contractbasis)

- Bulk (data ingest service, op contractbasis)

- Accessing and placing data: via internet, using SSH, (HPN)SCP, SFTP, rsync, GridFTP; via iRODS federations

Bestandsformaten voor archivering (preferred formats)

Toelichting

Om de ambitie van langdurige toegang tot data waar te kunnen maken, concentreren duurzame archieven hun diensten en expertise vaak op een - brede - selectie van bestandsformaten: de zogenoemde voorkeursformaten. 

Deponeerders wordt sterk aangeraden alle data in een voorkeursformaat te deponeren.

4TU.ResearchData-archief

Over bestandsformaten bij het archief van 4TU.ResearchData.

DANS EASY

Over bestandsformaten bij DANS EASY (pdf).

SURFsara TDR

Geen voorkeur voor data- of bestandsformaat. Bij gebruik van bepaalde servicecomponenten kunnen hier wel restricties op zitten.

Gebruikte standaard voor de beschrijvende metadata

Toelichting

Informatie waarmee de deponeerder een dataset beschrijft, helpt om de dataset te vinden en om een eerste indruk te krijgen van de bruikbaarheid voor vervolgonderzoek. Archieven hanteren vaak een standaardschema voor zulke beschrijvende metadata, zo ook de RDNL-archieven.

4TU.ResearchData-archief

Dublin Core aangevuld met specifieke metadata-elementen. Exportformaten: oai-ore resource maps (rdf), datacite xml. 

DANS EASY

Dublin Core aangevuld met specifieke metadata-elementen. Meer over metadata bij DANS EASY

SURFsara TDR

Dublin Core

Toegekende Persistent Identifier(s)

Toelichting

In een duurzaam archief krijgt elke dataset een unieke, duurzame identifier, zoals een boek een ISBN krijgt. De Persistent Identifier (PID) is nodig om ook in de verre toekomst datasets te vinden en te citeren. Er bestaan verschillende 'smaken' PID's.

4TU.ResearchData-archief

DOI (Digital Object Identifier)

DANS EASY

DOI (Digital Object Identifier), URN:NBN 

SURFsara TDR

EPIC

Metadata in zoekportals

Toelichting

Archieven stellen metadata en de Persistent Identifier niet alleen beschikbaar in hun eigen catalogus, maar ook via zoekmachines en portals. Voor deze uitwisseling gebruiken ze de OAI-PMH-standaard. Onderzoekers en instellingen hoeven hier niets voor te doen (maar kunnen ook niet kiezen welke zoekmachines e.d. de metadata komen 'harvesten').

4TU.ResearchData-archief

Ja, OAI-PMH 

DANS EASY

Ja, OAI-PMH

SURFsara TDR

Ja, OAI-PMH

3. Betrouwbaarheid bij de RDNL-partners

Preservation strategy

Toelichting

Duurzame archieven hanteren verschillende technieken om de data toegankelijk te houden. De bits en bytes moeten intact blijven, harde schijven en tapes moeten worden vervangen, en soms moet een bestandsformaat geconverteerd worden naar een nieuw formaat (file format migration). 

4TU.ResearchData-archief 

File format migration. Meer over preservation strategy bij het 4TU.ResearchData.

DANS EASY

File format migration. Meer over preservation strategy bij DANS (pdf). 

SURFsara TDR

Bit preservation; curatie is mogelijk in een later ontwikkelingsstadium van de dienst.

Toegangscontrole, autorisatie

Toelichting

Bij de deponering is vastgelegd wie toegang tot (welk deel van) de data hebben, bijvoorbeeld individuen of bepaalde groepen. Het archief regelt dat alleen geautoriseerde personen en/of groepen toegang krijgen. Toegang hebben tot data is iets anders dan gebruik mogen maken van de data; gebruik wordt geregeld via licenties. De beschrijvende metadata zijn altijd voor iedereen zichtbaar.

4TU.ResearchData-archief

Datasets die zijn geüpload via het webformulier zijn toegankelijk na gebruikersregistratie (standaardmethode). Datasets die zijn gearchiveerd met tussenkomst van een data librarian (vanwege speciaal bestandsformaat of bestandsgrootte) zijn toegankelijk zonder gebruikersregistratie.

DANS EASY 

De datasets met een CC0 Waiver-licentie zijn zonder registratie toegankelijk voor iedereen. Voor toegang tot de overige datasets geldt ten minste een gebruikersregistratie in EASY.

SURFsara TDR

Standaard zijn datasets toegankelijk voor iedereen, de gebruiker kan dit instellen bij deponering of naderhand; bij downloaden is registratie vereist.

Certificering

Toelichting

Er bestaan verschillende certificeringen voor 'Trustworthy Digital Repositories'. De duurzame archieven van RDNL hebben minimaal het Data Seal of Approval. Daarnaast bestaan er bijvoorbeeld certificeringen voor informatiebeveiliging. 

4TU.ResearchData-archief

Data Seal of Approval (DSA)

DANS EASY

Data Seal of Approval (DSA), World Data System (WDS-ICSU)

Bewaartermijn van de data

Toelichting

De langetermijnarchieven van de RDNL-partners houden de data en metadata ook toegankelijk na de minimale bewaartermijn van tien jaar (Nederlandse Gedragscode voor Wetenchapsbeoefening). 

4TU.ResearchData-archief

Long-term preservation met garantie voor minimaal vijftien jaar

DANS EASY

Long-term preservation

SURFsara TDR

Long-term preservation

4. Meer informatie over de RDNL-partners

Contact en meer informatie

Voor de kosten die mogelijk aan een dienst verbonden zijn, hanteren de partners elk een eigen model. 

We helpen u graag als u meer wilt weten over een van onze diensten. Op de websites vindt u veel informatie, maar neem ook gerust contact met ons op.

Een samenvatting van deze pagina is beschikbaar als PDF-bestand.

SURFsara TDR

Contact via info@surfsara.nl