Metadata
SND:s mål är att data som delas via våra tjänster ska vara enkla att hitta och beskrivna på ett sådant sätt att de uppfyller FAIR-principerna i så stor utsträckning som möjligt.
Metadata som skapas i SND:s system skickas vidare till flera olika tjänster och infrastrukturer. Det är därför viktigt att använda sig av de möjligheter som finns för att strukturerat beskriva data så att rätt information kan nå ut och bli sökbar.
SND:s metadatastruktur bygger på metadatastandarden Data Documentation Initiative (DDI Lifecycle 3.3) och DataCites rekommendationer. Vi använder oss i möjligaste mån av internationella och etablerade kontrollerade vokabulärer och nyckelordslistor (så kallade tesaurusar) som används av andra infrastrukturer (mer information om detta längre ner).
Eftersom vi vill underlätta för forskare från olika discipliner att beskriva och dela data har SND utvecklat ämnesspecifika metadataprofiler. Grunden utgörs av en total metadataprofil, kallad SND Master, som innehåller alla metadataelement och de egenskaper som SND:s system stöder. Relevanta metadataelement hämtas från masterprofilen och presenteras i de olika ämnesprofilerna. Målet är att erbjuda ämnesanpassade profiler som matchar översta nivån i OECD Fields of Research and Development classification (FORD) samt SCB:s Standard för svensk indelning av forskningsämnen.
Dokumentationen för alla SND:s metadataprofiler finns publicerad på Zenodo.
I masterprofilen anges ett antal metadataelement som är gemensamt obligatoriska för alla ämnesprofiler, vilka dessa är specificeras i dokumentationen för SND Master. Respektive profil kan sedan innehålla ytterligare obligatoriska element, vilka anges i dokumentationen för varje profil.
De ämnesspecifika profilerna är framtagna efter domänspecifika metadatastandarder och internationella infrastrukturer. Den samhällsvetenskapliga profilen uppfyller till exempel CESSDA:s krav på metadata, profilen för språkresurser är interoperabel med det metadataschema som CLARIN använder och profilen för geo- och miljövetenskaper uppfyller krav från både ISO 19115 och INSPIRE.
Aktuella metadataprofiler hos SND
- Lantbruksvetenskap (toppnivå hos OECD FORD och SCB)
- Medicin och hälsovetenskap (toppnivå hos OECD FORD och SCB)
- Naturvetenskap (toppnivå hos OECD FORD och SCB)
- Samhällsvetenskap (toppnivå hos OECD FORD och SCB)
- Teknik (toppnivå hos OECD FORD och SCB)
- Historia och arkeologi
- Geovetenskap och miljövetenskap
- Språkresurser
Förutom ämnesspecifika profiler erbjuder SND även en allmän profil som kan användas för data som inte naturligt faller in under någon av de övriga profilerna.
Utveckling av metadataprofiler för Veterinärmedicin samt Humaniora och konst pågår.
Kontrollerade vokabulärer och nyckelordslistor
SND:s system har stöd för följande nyckelordslistor:
- AAT The art & Architecture Thesaurus
- AGROVOC Vocabulary for Agricultural Sciences
- ALLFO Allmän finländsk ontologi
- ELSST The European Language Social Science Thesaurus
- EnvThes Environmental Theasaurus
- FISH Monument Types FISH Thesaurus Monument Types
- GCMD Vocabulary for Earth Science
- GEMET General Multilingual Environmental Thesaurus
- ICD-10 International Classification of Diseases
- MeSH Medical Subject Headings
- NASA Thesaurus NASA STI Thesaurus
Kontrollerade vokabulärer för specifika metadataelement presenteras i dokumentationen för profilerna. Generellt används vokabulärer från standarderna DDI och Dublin Core, samt från CESSDA och DataCite. Ytterligare vokabulärer kan tillkomma, till exempel används GeoNames för geografisk information och ISO-standarden ISO-639 för språkkoder.
I de fall maskinläsbara vokabulärer saknas har SND tagit fram egna listor, baserade på andra etablerade nyckelordslistor. Exempelvis används vokabulärer från Riksantikvarieämbetet för lämningstyper och undersökningstyper, och för historiska tidsperioder används termer framtagna i samarbete med ARIADNE och publicerade i PeriodO.
Format för export av metadata
I forskningsdatakatalogen finns möjlighet att exportera metadata i flera format, för att metadata ska vara tillgängliga för flera olika maskinella processer.
Följande metadataformat finns tillgängliga för samtliga dataset i forskningsdatakatalogen:
- Dublin Core (oai_dc via OAI-PMH), för grundläggande citeringsmetadata
- DataCite XML metadata registreras även hos DataCite
- DCAT-AP-SE 2.0, för att göra dataseten synliga i dataportal.se
- Schema.org JSON-LD, för webcrawlers samt Google Dataset Search
- DDI-C 2.5, exponerar metadata för till exempel datacatalogue.cessda.eu
- DDI-L 3.3
Utöver dessa format så finns metadataformat som endast är tillgängliga för vissa metadataprofiler:
- MetaShare-CMDI för Språkresurser
Registrera data
Utöver ovan nämnda metadataprofiler finns det även en profil för att snabbregistrera data, en minimal metadataprofil som uppfyller DataCites krav för att tilldela ett dataset en DOI. Profilen omfattas inte av SND:s certifiering som Trusted Digital Repository och kan enbart väljas till på organisationsnivå för forskningshuvudmän i SND-nätverket som lagrar data lokalt. Data som beskrivs med denna profil uppfyller FAIR-principerna i begränsad utsträckning och har information om detta i forskningsdatakatalogen.
Är din organisation intresserad av att använda Registrera data, kontakta snd@gu.se