Granska en datahanteringsplan

Bild på en dataskärm med ett textdokument ur fokus

Det är värdefullt att forskarna tidigt i forskningsprojektet, förslagsvis redan innan projektet har börjat, tänker igenom hur data ska hanteras under projektets gång, både för att se till att data hanteras säkert, lagligt och etiskt och för att skapa goda förutsättningar för att dela data enligt FAIR-principerna. Denna information dokumenteras i en datahanteringsplan (engelska data management plan, DMP).

Vad en datahanteringsplan är och vilken information i den som borde uppdateras under olika faser i forskningsprojektet beskrivs på sidan Datahanteringsplaner på Researchdata.se. Innehållet i en datahanteringsplan påverkas av vilket verktyg eller vilken mall forskaren använder, den forskning som ska utföras och eventuella krav från finansiären eller lärosätet. SND:s Checklista för datahanteringsplan ger en bra översikt över vilken information som kan finnas med i en datahanteringsplan, oavsett vilket verktyg forskaren använder. 

[bild?]

Hur du bäst stöttar forskare i arbetet med deras datahanteringsplaner beror på hur rutinerna ser ut i din organisation. Kanske har du möjlighet att sätta dig med forskaren och tillsammans gå igenom det DMP-verktyg eller den mall som används. I vilket fall är det troligt att du någon gång under forskningsprocessen får ett utkast att gå igenom och därmed ges möjlighet att komma med förslag till förbättringar. Du kan då också hjälpa till med information om vem forskaren behöver kontakta för att få svar på mer komplicerade frågor. Denna process kallar vi här för granskning.  

I de flesta fall skapas datahanteringsplaner genom att forskaren anger information som svar på uppmaningar i en mall eller ett digitalt verktyg. Ofta finns förklaringar till vilken typ av information som förväntas i de olika svarsfälten. 

På denna sida har vi samlat tips på sådant du kan titta efter när du läser ett utkast till en datahanteringsplan. Upplägget följer SND:s checklista för datahanteringsplan, men speglar det innehåll som brukar efterfrågas i datahanteringsplaner generellt.

Innehåll på denna sida:

Huvudmannaskap

Det är viktigt att redan från början veta vilken organisation som är forskningshuvudman för insamlade data. Se efter om forskaren har dubbelanställning, till exempel både på ett sjukhus och ett lärosäte, vilken av organisationerna som är huvudman, och för vilken organisation forskningen bedrivs. Om det är sjukhuset som har huvudansvar gäller deras regelverk, till exempel patientdatalagen. Ett sätt att förtydliga frågan om huvudmannaskap är att fråga var data ska arkiveras. 

Huvudman bör om möjligt anges med beständig identifierare (ROR).

Skydda forskningsdata

Datasäkerhet och datalagring

Kontrollera att forskaren planerar att använda de system för säker datalagring som din organisation erbjuder. Håller den lagringslösning som forskaren valt en lämplig nivå för den informationsklassning som gäller för materialet? Om inte (och framför allt om det rör sig om skyddsvärda data) bör du ställa följdfrågor, till exempel var data kommer att lagras, inom eller utanför EU. Informera om riskerna med valda lösningar, samt centrala krav och riktlinjer. Det kan vara klokt att hänvisa till IT-avdelningen eller en liknande enhet med mer kunskap om lagringsfrågor. 

Om det handlar om ett samarbetsprojekt bör du fråga hur data kommer att delas inom projektet. Ska data lagras på flera platser eller ska samarbetspartners ha fjärråtkomst? Säkerställ att forskargruppen har en plan för hur de kommer att arbeta med gemensamma arbetsfiler. Uppmana forskarna att ta kontakt med lärosätets jurist för att teckna ett forskningsavtal.

Juridiska och etiska aspekter

Om forskningen innebär insamling av data med personuppgifter uppstår en rad krav och skyldigheter. Se till att forskaren är medveten om dataskyddsförordningen och praxis för god forskningssed, samt organisationens regler för behandling av personuppgifter. Hänvisa gärna till SND:s Praktisk handbok för data med personuppgifter.

Om forskningen behöver etikprövas ska detta nämnas i datahanteringsplanen, tillsammans med information om vem som är ansvarig för att ansöka om etikprövning. 

Uppmärksamma forskaren på att dataanalys bör göras på pseudonymiserade data, i den utsträckning detta är möjligt, men att pseudonymiserade data inte är samma sak som anonymiserade data. Hur kommer en eventuell kodnyckel att hanteras? Du bör också vara uppmärksam på forskningsdata med indirekta identifierare och risken för bakvägsidentifiering.

Samla in/producera forskningsdata

Det är vanligtvis inte ett problem för forskaren att beskriva hur data kommer att samlas in, snarare finns en tendens att forskaren ger för mycket information. Stäm av att informationen faktiskt besvarar de angivna frågorna: hur kommer data att skapas eller samlas in? Det räcker att ange om data samlas in genom intervjuer, enkäter, data från sjukvården, registerdata, experiment och så vidare. 

Dokumentera och organisera forskningsdata

Data ska dokumenteras och beskrivas med metadata. Ofta vet forskarna inte vad metadata betyder i denna kontext. Ge exempel på vilka metadata som behövs för ett dataset enligt FAIR-principerna. Ett tips är att söka fram jämförbara dataset på Researchdata.se, och se efter vilka fält som används i beskrivningen av dessa. I vissa datahanteringsplaner efterfrågas information om metadatastandarder, vilket kan ge upphov till förvirring. I så fall kan termen “kontrollerade vokabulärer” vara mer bekant och lättare att tillämpa.

Typer av data och filformat

Om du har kunskap om de filformat som vanligtvis används inom ett visst forskningsområde har du sannolikt en känsla för om det angivna formatet är lämpligt för de typer av data som kommer att samlas in. Vid tveksamhet kan du fråga varför forskaren eller forskargruppen valt just detta format. 

Kom ihåg att öppna filformat är bäst för delning och långtidsbevarande. Om projektet använder andra format kan du fråga om forskaren/forskargruppen har tänkt på konsekvenserna i en senare fas av forskningsprojektet när data förbereds för att göras tillgängliga.  

Strukturerad datahantering

Kontrollera att det finns en plan för versionering av data under arbetets gång. Skapas det någon masterfil? Ska filerna ordnas i mappar och hur? 

Tillgänglighet och långtidslagring

Finns det en plan för tillgängliggörande av data? Upplys forskaren om att kravet på att data ska delas i enlighet med FAIR-principerna lättast uppfylls genom att dela dataset och beskrivande dokumentation via ett repositorium. Vid behov kan data delas med begränsad åtkomst men det bästa är om data kan göras öppet tillgängliga.  

Upplys forskaren om att ett repositorium automatiskt ger de dataset som delas en beständig identifierare (PID). Om data delas via SND:s dokumentationssystem DORIS tilldelas de en PID av typen DOI. 

Se till att det finns en plan för långtidslagring av data. Påminn forskaren att det inte är tillräckligt att dela dataset via ett repositorium för att uppfylla arkivlagens krav på arkivering; huvudmannen måste även lagra det fullständiga datamaterialet i sin egen organisation.