Välordnade data

Välordnade forskningsdata gör det möjligt att analysera data såväl under projektet som flera år senare. Därför är det viktigt att data är organiserade och dokumenteras bra genom hela forskningsprojektet, från det att du samlar in eller skapar data till det att du är klar med analys och bearbetning. Du vill inte hamna i en situation där du eller en projektkollega inte kan utföra en analys av data för att det inte går att förstå dem.

Det är viktigt att komma ihåg att forskningsmaterial (data) och projektupplägg kan se ut på många olika sätt. Det innebär att ordning betyder olika saker, att olika strukturer är mer eller mindre lämpliga och att olika dokumentation behövs. Därför är det här avsnittet tämligen generellt till sin natur. Grundprincipen är emellertid ordning och reda: välordnade data är data som man lätt förstår och lätt hittar rätt version av.

Strukturer 

När du ordnar projektets data så är det två huvudsakliga strukturer som spelar in: mappstrukturen (katalogstrukturen) som du skapar för att lagra olika dokument och dataversioner i, och den interna strukturen som datafilen, datasetet eller databasen har.

Mappstrukturen ska vara logisk och mapparna ska ha så uppenbara namn som möjligt. Det blir då enkelt att spara filer i rätt mappar och att leta upp filer du behöver. För att underlätta ännu mer så är det bra att ha en readme.txt-fil som beskriver vad som ska ligga i varje mapp eller beskriver innehållet i just den mapp som filen ligger i. Då kan alla som använder strukturen hitta rätt. (Se avsnittet om mappstrukturer för mer information och exempel på en effektiv mappstruktur.)

Versioner 

I projekt där data förekommer i olika versioner är det viktigt att du kan hålla isär versionerna från varandra. Du ska inte behöva tveka över vilken version som innehåller vad eller vad som skiljer versioner åt. Regler för versionering är bra att ta med i en datahanteringsplan även om de känns väldigt enkla för dig i början av projektet. För någon annan, eller för dig ett antal år senare, kan de vara svårtydda och leda till misstag. En bra idé är att skilja versioner åt i olika mappar i strukturen.

Namngivning

Filer behöver ha tydliga namn för att du ska kunna vara säker på att det är tydligt vad de innehåller. Regler för hur filnamn konstrueras i projektet bör skrivas ned i datahanteringsplanen och följas. (Se avsnittet om filnamn för mer information.)

Dokumentation

God dokumentation gör att du kan komma åt och förstå data vid behov. Dessa behov kan uppstå under projektet eller flera år senare. I dokumentationen förklarar du logiken bakom strukturer och namngivning, men också eventuella ad-hoc-beslut som du fattat. Under projektets gång bör du ha/kunna hitta sådan information i exempelvis en datahanteringsplan.

Det som är relevant att dokumentera kan variera beroende på forskningsämne och metoder, men det finns oftast principer och standarder du bör följa.