Felfria data

En viktig funktion hos god datahantering är att förhindra att fel smyger sig in i forskningsdata under projektets gång. Fel i data kan skapa onödigt extraarbete för att rätta till, men det är ännu värre om du inte märker att det har uppstått fel i data och att analysen därmed också blir felaktig.

Den värsta sortens fel resulterar i dataförlust. För att undvika detta bör du se till att projektets data säkerhetskopieras löpande och ofta. De flesta lärosäten har system på plats för säkerhetskopiering, men om du är osäker på vad som gäller för de system som du använder så bör du ta kontakt med din IT-avdelning. Ibland kan du upptäcka att du har andra behov än den generella standarden.

Tekniska fel kan även leda till att enstaka värden i en datamängd förvanskas. Lagringsmedier kan med tiden drabbas av så kallad ”bitröta”: materialet i lagringsmediet förändras så att enstaka ettor tolkas som nollor eller vice versa. Resultatet blir att filen inte går att läsa eller att värden förändras. Detta kan ske om man förvarar ett material en längre tid; god kvalitet på lagringsmedier är viktigt och filer bör därför kopieras till nya medier med jämna mellanrum. Undvik dock USB-minnen, CD-skivor och externa hårddiskar som det inte görs regelbundna backuper på. Är du osäker på vilket lagringsmedium som du bör välja så kan du kontakta din IT-avdelning. Använd om möjligt kontrollsummor (checksums) för att upptäcka fel i data.

Den vanligaste källan till att fel uppstår i datamaterial är den mänskliga faktorn. Eftersom forskningsdata kan se ut på så många olika sätt går det inte att säga exakt vad som ska göras för att förhindra att det blir fel i data. Men det finns några generella saker som du kan tänka på för att minska risken att fel uppstår:

  • Planera. Använd tydliga, skriftliga instruktioner och listor för att minska risken att fel uppstår genom ad hoc-lösningar, till exempel vid kodning, tematisering och namngivning av filer och mappar.
  • Lita inte på minnet. Dokumentera alla förändringar som görs i data så att fel kan spåras och rättas till. Dokumentation är viktigt i alla projekt, men det är extra viktigt i projekt med flera projektmedlemmar.
  • Håll ordning. Undvik att fel uppstår genom att du eller någon annan projektmedlem väljer fel fil i något bearbetnings- eller analyssteg. Ha en tydlig och begriplig mappstruktur, konventioner för hur filnamn skapas och en genomtänkt versionering som alla projektmedlemmar följer.
  • Skriv en datahanteringsplan för att på ett ställe samla information om vad som ska dokumenteras och hur; vilka regler som gäller för versionering och namngivning; vilken mappstruktur som ska användas samt annan planering av datahanteringen. Glöm inte att hålla planen uppdaterad! Använd gärna SND:s checklista för datahanteringsplaner.

Följs rekommendationerna är det lättare att undvika fel. Skulle fel ändå smyga sig in i datamaterialet går det att ta fram en tidigare version och rätta till dem.