En högaktuell fråga för lärosätena i Sverige är hur långtidslagringen av forskningsdata ska lösas. För SND är frågan viktig för data som ska göras tillgängliga. Lagringen är varje enskilt lärosätes ansvar, men det finns ett stort intresse för samordning, något som framkom vid det välbesökta möte som SND och KTH arrangerade nyligen.
125 personer deltog i mötet för att diskutera lagringstjänster, API (Application Programming Interface), dataflöden, integration etc. Syftet med dagen var att besvara några av de frågor som finns gällande lagring av forskningsdata i relation till arbetet med att göra data tillgängliga. SND ansvarar inte för själva lagringslösningarna, men det system som lärosätena och SND bygger tillsammans för att göra forskningsdata tillgängliga är beroende av ett samarbete även kring lagringen.
Säker lagring viktigt för delning
En viktig förutsättning för en tillförlitlig delning av forskningsdata är att dessa lagras på ett säkert sätt som uppfyller kraven för certifiering samt sökbarhet enligt FAIR-principerna (Findable, Accessible, Interoperable, Reusable). Tre olika typer av lösningar är aktuella för lärosätena just nu: SUNET, SNIC och lokala alternativ av olika slag. Oavsett vilken modell ett lärosäte väljer är målet att alla ska kunna göra sina data tillgängliga i SND:s katalog via det öppna API som SUNET och SND håller på att utveckla. Ett API är ett slags protokoll som används för att program (även kallade applikationer) enkelt ska kunna kommunicera med varandra.
Johan Fihn Marberg och Sara Svensson från SND beskrev det framtida arbetsflödet för forsknings- och metadata och tydliggjorde några av de önskemål som finns gällande API:et och lagringslösningarna. Några av punkterna är att:
- lagringen är skild från SND:s infrastruktur
- SND endast har access till metadata inom lagringslösningen
- SND ska kunna få information om en forskares filer genom forskarens SWAMID
- forskare ska i DORIS (SND:s nya sammanhållna system för att göra forskningsdata tillgängliga) kunna välja och peka på de datafiler som beskrivs
- det ska vara möjligt att skapa ett förmedlingspaket med datafiler och tillhörande dokumentationsfiler för sekundärforskning
- forskningsdata ska kunna vara direkt nedladdningsbara eller beställningsbara från SND-katalogen.
SNIC och SUNET presenterade sina lösningar
Vid mötet deltog även representanter från SNIC (Hans Karlsson) och SUNET (Anders Nilsson och Leif Johansson) för att presentera de lagringslösningar som erbjuds via dessa organisationer. SNIC har för närvarande hand om storskalig lagring och storskaliga beräkningar av data i analysfasen, det vill säga under den tid ett forskningsprojekt pågår. Enligt Hans Karlsson är man dock redo att även ta på sig en roll när det gäller långtidslagring av forskningsdata, under förutsättning att det finns finansiering. Anders Nilsson berättade om de lösningar för långtidslagring som SUNET erbjuder samt omfattning och kostnader för dessa.
Även om ett flertal frågetecken rätades ut under konferensen återstår mycket att arbeta med när det gäller samordningen av lösningar för långtidslagring av forskningsdata. Diskussionen kommer att fortgå i olika forum, inte minst i anslutning till utvecklingsarbetet med API och DORIS.