Resurser

Här har vi samlat länkar till guider, handböcker, forskningsartiklar och videor som kan vara användbara vid forskning på data med personuppgifter. 

Andra guider och handböcker

Grundläggande om anonymisering och pseudonymisering

Denna guide är framtagen av Finnish social science data archive (FSD) och ger en grundläggande genomgång av anonymisering och pseudonymisering. Guiden innehåller flera praktiskt användara riktlinjer för både kvantitativa och kvalitativa data.

Handbok i statistisk röjandekontroll

Denna handbok från Statistiska centralbyrån är främst en vägledning i statistisk röjandekontroll för statistikansvariga myndigheter i deras produktion och redovisning av officiell och annan statistik. Den kan även vara ett stöd för forskare som ska forska på mikrodata, till exempel via SCB:s plattform för mikrodata, MONA. Om man som forskare ska forska på mikrodata räcker det i normalfallet inte med anonymisering eller avidentifiering, utan mikrodata behöver även röjandeskyddas för att kunna lämnas ut. 

Guide till avidentifieringsmetoder

I denna guide, framtagen av en arbetsgrupp inom EU, beskrivs de två övergripande viktigaste metoderna för avidentifiering: randomisering och generalisering. Guiden ger också en fördjupning i specifika randomiserings- och generaliseringsmetoder och en genomgång av deras styrkor och svagheter. 

Guide till krypteringstekniker

Kryptering kan vara en användbar skyddsåtgärd för forskare för att ge ett extra lager av åtkomstkontroll till skyddsvärda data. I den här guiden framtagen vid Gents universitet beskrivs vad kryptering är, när kryptering bör övervägas och hur man kan gå till väga för att kryptera data. 

Handbok för data med personuppgifter

Den här handboken har tagits fram vid Utrechts universitet och kan ses som en nederländsk motsvarighet till SND:s handbok. Den lägger fokus på att dels ge en juridisk kunskapsbas, dels en översikt av användbara metoder och verktyg för forskare som arbetar med data som innehåller personuppgifter. 

Allmän guide till datahantering

Den här guiden är skriven av CESSDA, en europeisk forskningsinfrastruktur som arbetar för att förbättra tillgängligheten till samhällsvetenskapliga forskningsdata. Guiden är en resurs för att stödja i första hand samhällsvetenskapliga forskare med praxis och strategier för effektiv hantering av forskningsdata med fokus på FAIR-principerna. Med andra ord: hur kan forskare göra data hittbara (Findable), tillgängliga (Accessible), interoperabla (Interoperable) och återanvändbara (Reusable)? 

Guide till anonymisering av personuppgifter

Den här guiden från norska Datatilsynet riktar sig brett till personer och organisationer som behöver hjälp med att anonymisera data som innehåller personuppgifter. Guiden går igenom centrala juridiska bestämmelser, pekar på riskfaktorer som är viktiga att beakta och diskuterar styrkor och svagheter hos olika anonymiseringstekniker. 

Video

Praktisk genomgång av verktyget sdcMicro

En genomgång från CESSDA av verktyget sdcMicro i R-Studio. Det kan bland annat användas för att identifiera olika variabler, eller kombinationer av variabler som innebär en risk för bakvägsidentfiering. Man kan också se vilken effekt olika aggregeringar får för risken för bakvägsidentifiering. 

Workshops om anonymisering av kvantitativa och kvalitativa data

Fyra workshops från McGill University som introducerar och fördjupar sig i anonymisering av forskningsdata. De två första workshopparna har fokus på kvantitativ forskning och de två senare har fokus på kvalitativ forskning. 

Workshop 1: Introduktion till dataanonymisering
Workshop 2: Anonymisering av data i teori och praktik
Workshop 3: Delning av kvalitativa data ur ett etiskt perspektiv
Workshop 4: Riktlinjer och resurser för att dela kvalitativa data 

Webbinarium om anonymisering och verktyget Amnesia

Detta webbinarium från OpenAIRE är dels en introduktion till anonymisering av forskningsdata, dels en genomgång av verktyget Amnesia. Med detta verktyg kan man omvandla forskningsdata med personuppgifter för att tillhandahålla så kallad k-anonymitet och km-anonymitet. 

Praktisk genomgång av anonymisering och bedömning av röjanderisk

Tre videor från brittiska National Centre for Research Methods (NCRM) som ger en introduktion till vad anonymisering är och framför allt en praktisk genomgång av anonymisering och bedömning av röjanderisk i forskningsdata. 

Praktisk genomgång av bedömning av röjanderisk i fem steg

Fem korta videor från FN-organet OCHA:s Centre for Humanitarian Data som går igenom olika steg vid bedömning av röjanderisk i forskningsdata. 

Steg 1: Förberedelser inför bedömning av röjanderisk
Steg 2: Välj dina nyckelvariabler
Steg 3: Genomför bedömningen
Steg 4: Analysera resultatet av bedömningen
Steg 5: Hantera data ansvarsfullt 

Forskningsartiklar

Bedömning av röjanderisk i mikrodata

Även om statistiska myndigheter och liknande aktörer gör juridiska och etiska överväganden för att öka graden av konfidentialitet i data som delas med forskare kan det fortfarande finnas röjanderisker. Denna studie ger en översikt över saker att tänka på för att bedöma och förebygga sådana risker, med specifikt fokus på kvantitativa riskmått. 

Taylor, L., Zhou, X.-H., & Rise, P. (2018). A tutorial in assessing disclosure risk in microdata. Statistics in Medicine, 37(25), 3693–3706. https://doi.org/10.1002/sim.7667

Faktorer som påverkar benägenhet att delta i forskning

Genom ett vinjettexperiment undersökte denna studie hur benägna försökspersoner skulle vara att delta i forskningsstudier som varierar i ämneskänslighet och risk att få sin identitet röjd. 

Couper, M. P., Singer, E., Conrad, F. G., & Groves, R. M. (2008). Risk of disclosure, perceptions of risk, and concerns about privacy and confidentiality as factors in survey participation. Journal of Official Statistics, 24(2), 255–275. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3096944/

Anonymisering av ostrukturerade data

Mycket av litteraturen om anonymisering av data har fokuserat på strukturerade data som används i kvantitativ forskning. Den här studien undersöker tillvägagångssätt för att anonymisera ostrukturerade data – till exempel textdokument eller bilder – som ofta används i kvalitativ forskning. Genom två fallstudier illustreras de utmaningar som uppstår när man försöker anonymisera ostrukturerade dataset med hjälp av två olika metoder: den riskbaserade och den strikta metoden. 

Weitzenboeck, E. M., Lison, P., Cyndecka, M., & Langford, M. (2022). The GDPR and unstructured data: is anonymization possible? International Data Privacy Law, (12)3, 184–206. https://doi.org/10.1093/idpl/ipac008

Anonymisering av big data

”Big data” refererar till stora datamängder som kan analyseras för att avslöja mönster, trender och associationer och börjar bli alltmer vanligt inom samhällsvetenskaplig forskning, till exempel studier av beteenden på nätet. Den här studien tar upp olika utmaningar kring att forska på big data, varav en rör anonymisering och återidentifiering. 

Weinhardt, M. (2021). Big data: Some ethical concerns for the social sciences. Social Sciences10(2), 36. https://doi.org/10.3390/socsci10020036

En introduktion till syntetiska data

Syntetiska data är fiktiva data som har genererats på artificiell väg. I stället för att modifiera ett befintligt dataset för att göra det mindre identifierbart genereras ett helt nytt dataset med fiktiva individer och värden. Den här studien ger en introduktion till syntetiska data genom att gå igenom vad syntetiska data är, varför de kan vara användbara och hur man kan gå till väga för att använda dem.

Jordon, J., Szpruch, L., Houssiau, F., Bottarelli, M., Cherubin, G., Maple, C., Cohen, S. N., & Weller, A. (2022). Synthetic Data -- what, why and how? arXiv:2205.03257. https://doi.org/10.48550/arXiv.2205.03257