Granska data
Det är viktigt att forskningsdata som görs tillgängliga via DORIS kan förstås och återanvändas av andra. Forskningsdata som förmedlas via DORIS ska därför ha genomgått en noggrann kontroll.
Metadata och data som beskrivs via SND:s dokumentationsystem DORIS behöver granskas innan de kan publiceras. Databeskrivningar hanteras i DORIS av både forskare och granskare. I dagsläget gör SND också en kontroll av varje inkommen databeskrivning och data före publicering, men det steget kommer efter hand att tas bort.
Kontroll av filer och leverans
- Viruskontroll: Levererade filer innehåller inte virus.
- Kontroll av läsbarhet: Levererade filer går att öppna och läsa.
- Kontroll att leveransen är komplett: Leveransen innehåller alla data som är tänkta att förmedlas tillsammans med den dokumentation som behövs för att data ska kunna återanvändas.
- Kontroll att filerna är i ett lämpligt format för återanvändning och tillgängliggörande. Filer som inte har lämpligt format kan vid behov kompletteras med filer som konverterats till ett format som lämpar sig bättre för delning och/eller långtidsbevarande.
Det material som ska delas och/eller beskrivas ska vara forskningsdata. Med forskningsdata avses digitalt material som kan ligga till grund för en vetenskaplig analys oavsett forskningsområde. Även data som inte primärt har samlats in för forskning kan alltså delas via DORIS om materialet kan komma att användas för vetenskaplig analys, till exempel långsiktiga miljöövervakningsdata, eller olika typer av myndighetsdata.
Om materialet inte anses vara forskningsdata ska forskaren kontaktas och hänvisas till ett annat repositorium. Figurer och tabeller som innehåller kompletterande information för forskningsartiklar betraktas inte som forskningsdata i termer av kompletta dataset, eftersom supplementary material vanligen utgör enbart en del av de sammantagna data. I vissa fall består ett dataset enbart av ett par mindre kolumner och då är det ändå bättre att synliggöra detta i en databeskrivning än att inte dela någonting alls.
Ladda ner data
Hur filerna nås beror på vilken lagringslösning din organisation använder gentemot DORIS.
Om lärosätet inte har en egen lärosätesspecifik lagring kopplad till DORIS lagras filerna tills vidare på SND:s lagringsyta, SND CARE, och du kan då ladda ner filerna direkt genom DORIS. Om data lagras lokalt gäller era egna rutiner för åtkomst.
Storleksgränsen för datamaterial som laddas upp i formuläret är i dagsläget 2 GB per uppladdad fil. Större filer laddas upp till SND CARE via ett STFP-konto. Om en forskare behöver hjälp med ett SFTP-konto kan du (eller forskaren själv) kontakta incoming@snd.se för att få hjälp med detta.
I de fall där det rör sig om större datamängder kan det behövas maskinell kontroll för att säkerställa att leveransen är komplett, och i sådana fall används verktyg som hanterar filkontrollsummor.
Observera att forskare som delat data i ett annat repositorium, en portal eller på en hemsida där data tilldelats en DOI, inte behöver ladda upp datafilerna igen i DORIS. Då skapar forskaren istället en databeskrivning som via DOI länkar vidare till publicerade data, och anger endast metadata som gör data sökbara på Researchdata.se. Din roll som granskare består då främst i att granska metadata, men i de fall du har åtkomst till data kan du med fördel granska dessa också och framför allt se efter om dokumentationen behöver kompletteras med mer information i DORIS.
Gör en viruskontroll
Använd ett antivirusprogram för att automatiskt söka igenom de filer som skickats in. Om du misstänker att filerna innehåller virus måste dessa filer tas bort eller ersättas, vilket görs i samråd med forskaren som skickat in dem.
Observera att många kombinationer av data och/eller programkod kan ge falska indikationer i antivirusprogram. Kontakta gärna din lokala IT-avdelning för att få hjälp med programvara för viruskontroll.
Filer från SND CARE har redan kontrollerats för virus.
Kontrollera läsbarhet och filformat
Kontrollera data för att säkerställa att det går att förstå inskickade data och att de kan återanvändas. Varje datamaterial är unikt, och bedömningen ser därför olika ut från fall till fall.
Finns alla nödvändiga filer?
Ibland kan det vara svårt att utifrån befintliga metadata i formuläret avgöra om alla nödvändiga filer har skickats in. Ett dataset kan innehålla flera datafiler och om detaljer om vad som ingår i datasetet saknas vid överlämnandet behöver forskaren kontaktas för ett förtydligande om de olika dataseten och tillhörande dokumentation.
Ofta lämnar forskare bara över en del av det datamaterial som produceras under ett forskningsprojekt. Så länge materialet går att återanvända kan du fortsätta processen med att publicera det, men forskaren kan uppmuntras att publicera mer än vad som krävs av till exempel en tidskrift för att underlätta för sekundäranvändare och möjliggöra för nya forskningsfrågor. Har forskaren laddat upp alla data som hör till projektet/studien eller tänker forskaren ladda upp flera dataset i framtiden?
Är filerna i ett lämplig format?
Om studien innehåller väldigt många filer kan du göra ett urval, men se gärna till att öppna några filer av varje filtyp. Kontrollera också filformatet. Riksarkivet föreslår ett antal kriterier för arkivbeständiga format (extern länk) och filformat som uppfyller dessa kriterier kan också anses vara lämpliga för långtidsbevarande.
Kontrollera också att filerna är rensade från ovidkommande information (till exempel formateringar och exempelvariabler som inte används eller som saknar betydelse för forskningsresultatet). Exempel på sådan formatering är färgmarkeringar, formler, makron, infogat material som bilder eller textrutor i en Excelfil. Om markeringar behöver finnas kvar i datafilen, exempelvis färgmarkeringar i textdata, är det viktigt att det finns en förklaring till vad de har för funktion.
Hur ser strukturen för fil- och mappnamn och eventuell databas ut?
Förutom att filerna behöver kunna öppnas behöver man också kunna förstå vad filerna innehåller och enkelt kunna navigera i mappstrukturen eller databasen om en sådan finns. Filer och mappar bör vara namngivna på ett konsekvent och begripligt sätt. Detta är särskilt viktigt i omfattande datamaterial med många filer. Filnamn, innehåll och relationer mellan filer kan behöva förklaras i ett kompletterande textdokument.
Oftast brukar filnamnen vara de som forskaren har använt. Det man i allmänhet behöver kontrollera är att filnamnen är någorlunda självförklarande och att det finns en konsekvens i namngivningen. Det kan vara bra att tänka på att filnamnen syns i katalogposten.
Var varsam med att ändra i filnamn utan att stämma av med forskaren. Det kan finnas hänvisningar till filer i tillhörande dokumentation, i strukturerade metadata, samt inne i datafilerna. Notera också att programkod går sönder så fort relaterade datafilers filnamn ändras. Alla ändringar som görs bör därför stämmas av med forskaren och vid behov dokumenteras i anteckningsfältet i DORIS. OBS! Variabelnamn och liknande inne i datafiler bör absolut inte ändras om inte forskaren har varit delaktig i beslut om detta.
Finns det tillräckligt med metadata för att kunna publicera och återanvända materialet?
Minimikraven gällande metadata för publicering via DORIS uppfylls automatiskt om alla obligatoriska fält i databeskrivningen är ifyllda, men det är upp till dig som granskare att avgöra om det behövs mer metadata. Ibland kan du komplettera med metadata från tillhörande dokumentation, men kom ihåg att det som kan innebära en stor arbetsinsats för dig kanske inte är särskilt svårt eller tidskrävande för forskaren, eller vice versa.
Finns det tillräcklig dokumentation?
Vad som är tillräcklig dokumentation varierar från fall till fall och kan skilja sig åt mellan olika ämnesområden och typer av data. Dokumentationen är ofta nödvändig för att en sekundäranvändare ska kunna förstå forskningsmaterialet.