Metadata och ämnesprofiler i DORIS

SND har som mål att data som delas via våra tjänster ska vara enkla att hitta och beskrivna på ett sådant sätt att de uppfyller FAIR-principerna i så stor utsträckning som möjligt.

För att data ska vara möjliga att hitta behöver de beskrivas på ett standardiserat sätt som både människor och maskiner förstår. Detta görs med hjälp av metadata, det vill säga ”data om data”, och man talar om olika så kallade metadatastandarder. En metadatastandard är en uppsättning regler som bestämmer hur man formulerar och strukturerar metadata för ett visst ämnesområde. Genom att använda en etablerad standard för metadata när man beskriver forskningsdata blir databeskrivningen läsbar och begriplig för både människa och maskiner, vilket är centralt för att uppfylla FAIR-principerna. Maskinläsbarheten gör också att metadata kan integreras i olika system, exempelvis söksystem eller system som automatiskt överför information från ett ställe till ett annat. 

SND använder i möjligaste mån internationellt etablerade standarder som också används av andra forskningsinfrastrukturer. Metadatastrukturen i DORIS bygger till exempel till stor del på metadatastandarden DDI Lifecycle 3.3 och organisationen DataCites metadatarekommendationer.

Metadataprofiler i DORIS

Eftersom SND vill underlätta för forskare från olika discipliner att beskriva och dela data har vi utvecklat ämnesspecifika metadataprofiler. Målet är att DORIS ska ha ämnesanpassade profiler som matchar ämnesområdena på toppnivån i OECD Fields of Research and Development classification (FORD) och SCB:s Standard för svensk indelning av forskningsämnen. 

Aktuella metadataprofiler i DORIS:

Utveckling av en metadataprofil för Humaniora och konst pågår.

Utöver de ämnesspecifika profilerna erbjuder SND även en allmän profil som kan användas för data som inte naturligt faller in under någon av de övriga profilerna. 

För den som vill läsa mer finns dokumentationen för metadataprofilerna på Zenodo.

SND:s ämnesspecifika profiler är framtagna utifrån domänspecifika metadatastandarder och krav hos internationella forskningsinfrastrukturer. Den samhällsvetenskapliga profilen uppfyller till exempel CESSDA:s krav på metadata, profilen för språkresurser är interoperabel med det metadataschema som CLARIN använder och profilen för geo- och miljövetenskaper uppfyller krav från både ISO 19115 och INSPIRE

Ämnesord och nyckelord i DORIS 

För att underlätta maskinläsbarhet och förståelse används ofta områdesspecifika standardiserade listor med termer och begrepp, så kallade kontrollerade vokabulärer, för exempelvis ämnesord, nyckelord och alternativ i menyer. I DORIS används bland annat kontrollerade listor från standarderna DDI, Dublin Core och DataCite. Ytterligare standardiserade listor kan tillkomma, till exempel används GeoNames för geografisk information, ISO-standarden ISO 639 för språkkoder och Standard för svensk indelning av forskningsämnen 2025 för ämnesområden. 

DORIS har stöd för följande nyckelordslistor: 

  • AAT Art & Architecture Thesaurus 
  • AGROVOC Vocabulary for Agricultural Sciences 
  • ALLFO Allmän finländsk ontologi 
  • ELSST The European Language Social Science Thesaurus 
  • EnvThes Environmental Thesaurus 
  • FISH Thesaurus of Monument Types 
  • GCMD (Global Change Master Directory) Vocabulary for Earth Science 
  • GEMET GEneral Multilingual Environmental Thesaurus 
  • ICD-10 International Classification of Diseases 
  • MeSH Medical Subject Headings 
  • NASA Thesaurus NASA STI Thesaurus. 

För vissa metadataelement har SND tagit fram egna nyckelordslistor som baseras på etablerade vokabulärer när det saknats maskinläsbara kontrollerade listor. I DORIS används till exempel vokabulärer från Riksantikvarieämbetet för lämningstyper och undersökningstyper, och för historiska tidsperioder används termer framtagna i samarbete med ARIADNE och publicerade i PeriodO