Rekommenderade filformat

Alla digitala filformat riskerar att bli föråldrade. Om det händer kommer framtida mjukvaror inte kunna läsa eller visa informationen i filerna korrekt. För att minska risken för att en fil blir oläsbar bör filformat väljas som med stor sannolikhet går att använda även i framtiden. Format som är lämpliga för tillgängliggörande och långtidsbevarande bör vara:

  • vanligt förekommande
  • väl dokumenterade, det vill säga att det går att hitta en teknisk specifikation som berättar hur formatet lagrar information
  • öppna/icke-proprietära.

I vissa fall kan data vara i ett format som inte är det mest öppna formatet, men som är en standard inom ett specifikt forskningsområde, det vill säga ett format som används och stöds av majoriteten av dem som verkar inom fältet. I dessa fall kan det vara bra att publicera data både i format som är vanligt förekommande inom området och om möjligt även i format som är mer lämpliga för långtidslagring.

I fråga om långtidslagring av data gäller samma frågor som inför publicering av data. För att minska risken att en fil blir oläsbar bör du välja ett filformat som med stor sannolikhet kan användas även i framtiden. Det är också en fördel om formaten kan läsas av många olika datorprogram. 

Riksarkivet föreslår ett antal kriterier för arkivbeständiga format, som också kan anses vara lämpliga för långtidsbevarande.

Rekommenderade filformat i DORIS

SND har utvärderat och sammanställt en lista med format som är lämpliga för forskningsdata som ska göras tillgängliga via en forskningsdatakatalog. Föreslagna format delas upp i två kategorier: för delning och för långtidslagring i arkiv eller liknande

De format som föreslås under rubriken för delning har en utbredd användning och är kompatibla med programvara med öppen källkod. I denna lista finns även proprietära filformat som uppfyller dessa kriterier.

Tabellen föreslår också filformat för långtidslagring i arkiv eller liknande. Att bevara data i dessa format möjliggör analys med annan programvara på längre sikt, även om de inte kan återge allt som är sparat i originalformaten.

OBS! Data kan delas i flera filformat, exempelvis ett filformat som är lämpligt för delning och som gör det möjligt för andra forskare att återanvända data direkt, och ett för långtidslagring. Vid konvertering av filer är det viktigt att originalfilerna bevaras och följer med till långtidslagringen.

För mer information, se sidorna om filformat på Researchdata.se. I tabellen nedan ges också länkar till aktuella sidor på Reserachdata.se, där sådana finns.

Om du granskar data som är skrivna i andra format än de i tabellen, kontakta SND-kontoret för att få råd om hur du kan tänka i fråga om delning och långtidsbevarande.

Föreslagna format

- för delning

- för långtidslagring

Text

  • ASCII (.txt), Unicode (.txt) 
  • MS Word (.docx) 
  • OpenDocument Text (.odt) 
  • PDF (.pdf), PDF/A (.pdf) 
  • HTML (.html)  
  • Markdown (.md)  
  • XML (.xml) 
  • SGML (.sgml) 
  • Rich Text Format (.rtf) 
  • ASCII (.txt), Unicode (.txt) 
  • MS Word (.docx) 
  • OpenDocument Text (.odt) 
  • PDF/A (.pdf) 
  • HTML (.html)
  • Markdown (.md) 
  • XML (.xml) 

Databaser, kalkylblad och statistikdata

  • Microsoft Excel, formellt Office Open XML Workbook format, (.xlsx),  
  • OpenDocument Spreadsheet (.ods)  
  • Avgränsad text (oftast benämnt .csv eller .tsv)  
  • SQL-syntax i textfil (.sql) 
  • SIARD (.siard) 
  • SQLite (oftast benämnt .db, .db3, .sqlite) 
  • SPSS (.sav, .por) 
  • STATA (.dta) 
  • R (.rdata, .rda) 
  • Microsoft Excel, formellt Office Open XML Workbook format, (.xlxs),  
  • OpenDocument Spreadsheet (.ods)  
  • Avgränsad text (oftast benämnt .csv eller .tsv)  
  • SIARD (.siard) 
  • SQLite (oftast benämnt .sql, .db, .sqlite) 
  • R (.rdata, .rda) 

Bild 

Rasterbilder

  • TIFF (.tif)
  • JPEG2000 (.jp2) PNG (.png) 
  • JPEG (.jpg) 

Vektorbilder

  • Scalable Vector Graphics (.svg) 

Rasterbilder

  • TIFF (.tif)
  • JPEG2000 (.jp2) PNG (.png) 
  • JPEG (.jpg) 

Vektorbilder

  • Scalable Vector Graphics (.svg) 

Video

  • Lossless AVI (.avi) 
  • Matroska (.mkv) 
  • MPEG-1 (.mpg, .mpeg, …) 
  • MPEG-2 (.mpg, .mpeg, …) 
  • MPEG-4 H.264 (.mp4) 
  • MPEG-4 Part 14/MP4 (.mp4) 
  • QuickTime File Format QTFF (.mov)
  • QTFF (.mov)  
  • Lossless AVI (.avi) 
  • Matroska (.mkv) 
  • MPEG-1 (.mpg, .mpeg, …) 
  • MPEG-2 (.mpg, .mpeg, …) 
  • MPEG-4 H.264 (.mp4) 
  • MPEG-4 Part 14/MP4 (.mp4) 

Ljud

  • Waveform Audio (.wav) 
  • Broadcast Wave Format (.bwf) 
  • Audio Interchange File Format (.aif, .aiff) 
  • Free Lossless Audio Codec(.flac) 
  • Matroska (.mka) 
  • MPEG-1, MPEG-2 (.mpg, .mpeg, …) 
  • MPEG-1 Audio Layer III (.mp3) 
  • Advanced Audio Coding (.aac) 
  • Ogg Vorbis (.ogg) 
  • Waveform Audio (.wav) 
  • Broadcast Wave Format (.bwf) 
  • Audio Interchange File Format (.aif, .aiff) 
  • Free Lossless Audio Codec(.flac) 
  • Matroska (.mka) 
  • MPEG-1, MPEG-2 (.mpg, .mpeg, …) 

Spatiala data

  • OGC GeoPackage (.gpkg)  
  • ESRI Shapefile (.shp)  
  • GeoJSON (.geojson)  
  • Keyhole Markup Language (.kml)  
  • GeoTIFF (.tif, .tiff)  
  • ESRI GRID (.adf, .asc, .grd)  
  • Digital Elevation Model (DEM) Format (.dem)  
  • Geographic Markup Language (.gml)  
  • NetCDF (.nc)  
  • MapInfo (.tab, .dat)  
  • MapInfo Interchange Format (.mif, .mid)  
  • CSV (.csv) 
  • OGC GeoPackage (.gpkg)  
  • ESRI Shapefile (.shp)  
  • GeoJSON (.geojson)  
  • Keyhole Markup Language (.kml)  
  • GeoTIFF (.tif, .tiff)  
  • Digital Elevation Model (DEM) Format (.dem)  
  • NetCDF (.nc)  
  • CSV (.csv) 

Fotogrammetri och 3D-data 

  • Wavefront OBJ (.obj)
  • X3D (.x3d) - ASCII-versionen 
  • AutoCAD DXF (.dxf) 
  • COLLADA (.dae) 
  • Stanford PLY (.ply)  
  • Universal 3D Format (.u3d) 
  • VRML (.vrml)  
  • Filmbox File (.fbx)
  • CSV (för punktmoln) 
  • STL (STereoLithography format, för triangulära fasetter) 
  • Wavefront OBJ (.obj) 
  • X3D (.x3d) - ASCII-versionen 

Uppmärkningsspråk

  • HTML (.html)
  • JSON (.json)
  • XML (.xml)

    RDF

    • W3C-standarder