Maskinläsbarhet ska underlätta arbete med datahanteringsplaner

Publicerad: 2020-05-28

Syftet med en datahanteringsplan är att beskriva hanteringen av data i ett forskningsprojekt under hela forskningsprocessen, så att olika intressenter kan hitta rätt information när de behöver den. I dagsläget finns en mängd olika mallar runt om i världen för att skapa datahanteringsplaner och behovet av samordning är stort. Ett globalt initiativ för att skapa en gemensam, maskinläsbar standard för datahanteringsplaner är RDA:s arbetsgrupp DMP Common Standards Working Group. Vid RDA Swedens och SND:s webbinarium om utvecklingen av maskinläsbara datahanteringsplaner presenterades resultaten från arbetsgruppen tillsammans med exempel på det arbete som sker vid svenska lärosäten.

Illustration som visar arbetsflödet när en datahanteringsplan skapas.
Bilden visar vilka intressenter som kan vara involverade i olika skeden när
en datahanteringsplan skapas. Illustration: Tomasz Miksa.

Ett viktigt skäl till att skapa en global, maskinläsbar standard för datahanteringsplaner är att en sådan ökar möjligheten att automatiskt utbyta information mellan olika verktyg och system som används inom forskningen. Detta skulle innebära att den arbetsinsats och den administration som planerna ofta associeras med skulle minska.

Svårt att få överblick i dagsläget

–  Många av de existerande mallarna och systemen för datahanteringsplaner har brister. De måste fyllas i manuellt, de kan vara vaga i vilka uppgifter de efterfrågar och de betraktas ofta som byråkratiska av forskarna. Det är svårt för en enskild forskare att få en överblick över vilka verktyg som finns och att veta vilket specifikt verktyg som ska användas, sa Tomasz Miksa från RDA:s arbetsgrupp för datahanteringsplaner.

Ett viktigt fokus för arbetsgruppen har varit att beskriva ett automatiskt arbetsflöde i skapandet av datahanteringsplanen. Det betyder bland annat att innehållet i planen genereras inte bara av forskaren själv och de system forskaren använder utan också via det infrastrukturstöd som finns för datahantering vid ett lärosäte till exempel (se bilden). På så sätt minskar både den arbetsbörda som ligger på den enskilda forskaren och risken att inaktuell eller felaktig information läggs in.

Arbetsgruppen har också analyserat vilken typ av information som en maskinläsbar datahanteringsplan kan innehålla. Analysen visar att en automatiserad datahanteringsplan ger möjligheter att samla en större mängd och en mer detaljerad information än de traditionella, manuellt skapade planerna. (I arbetsgruppens rekommendation går det att läsa mer om vilken typ av uppgifter det kan handla om.)    

Erfarenheter från svenska lärosäten

Även i Sverige pågår ett intensivt arbete med att utveckla mallar och digitala verktyg för datahanteringsplaner, bland annat i en nationell grupp som leds av Vetenskapsrådet. Förhoppningen är att ett nationellt digitalt verktyg för datahanteringsplaner ska vara klart under 2020. Under webbinariet presenterades också några av de digitala verktyg för datahanteringsplaner som nu används lokalt på lärosätena. Dessa är ofta baserade på internationella verktyg som DMP Online (Stockholms universitet), Data Stewardship Wizard (SciLifeLab vid Karolinska institutet, KTH, Stockholms universitet och Uppsala universitet) och DMP Roadmap (Lunds universitet).  

Precis som internationellt så kretsar diskussionen i utvecklingsarbetet på nationell nivå kring hur arbetet med datahanteringsplanerna kan göras enklare, mindre tidskrävande och mer automatiserat. Joakim Philipson från Stockholms universitet lyfte fram några exempel, som att verktygen kan innehålla fler ”drop-down”-menyer med färdiga svarsalternativ för att göra informationen mer maskinläsbar och att etablerade standarder för metadata kan användas i verktygen i större utsträckning. Maria Johnsson från Lunds universitet betonade vikten av att redan från början involvera forskare i utvecklingsarbetet:

– Den centrala personen är forskaren. Verktyget måste vara attraktivt att jobba med och vi måste ha kontinuerliga diskussioner med forskare om detta. Vårt system i Lund är väldigt enkelt, det är lätt att tillämpa rutinerna och vi har också lagt stort fokus på användarsupport, berättade hon.

Webbinariet om maskinläsbara datahanteringsplaner kommer att följas upp efter sommaren inom ramen för SND:s verksamhet. Ett sätt att påverka utveckling och rekommendationer både nationellt och internationellt är att delta i någon av de intresse- och arbetsgrupper som finns inom ramen för RDA:

Active Data Management Plans Interest Group
Exposing Data Management Plans Working Group
DMP Common Standards Working Group

Här kan du ta del av alla presentationer plus en videoinspelning från webbinariet.