Statistik över namn efter födelseland 2020
SND-ID: 2021-272-1. Version: 1. DOI: https://doi.org/10.5878/s91g-y391
Ladda ner data
Tillhörande dokumentation
Ladda ner alla filer
Citering
Skapare/primärforskare
Peter M. Dahlgren - Göteborgs universitet, Institutionen för journalistik, medier och kommunikation (JMG)
Forskningshuvudman
Göteborgs universitet - Institutionen för journalistik, medier och kommunikation (JMG)
Beskrivning
Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling.
Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.
namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 202
Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.
namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 2020 från SCB.
SCB-villkor (0,1 MB) beskriver SCB:s allmänna villkor för avtal och överenskommelser vad gäller användandet av datan.
Därtill finns det tre CSV-filer (3,5 MB) där originalfilen har bearbetats till CSV-filer i wide format som underlättar maskinläsning. Vid wide format har originalstrukturen bibehållits med namnen på raderna och länderna i kolumnen. Däremot har länderna ersatts med sina respektive ISO-koder för att undvika problemet med mellanslag och svenska tecken i kolumnnamnen.
Det finns även tre ytterligare CSV-filer (141 MB) där originalfilen har bearbetats till CSV-filer i long format som underlättar maskinläsning. Vid long format återupprepas namnet på varje rad för respektive land och det totala antalet bärare för namnet ifråga. Dessutom finns en landskod i ISO-format med varje land för att enkelt kunna integreras i andra typer av analyser. Visa mindre..
Data innefattar personuppgifter
Nej
Språk
Analysenhet
Population
Sverige
Tidsdimension
Urvalsmetod
Tidsperiod(er) som undersökts
2020-12-31
Antal individer/objekt
231505
Geografisk utbredning
Geografisk plats: Sverige
Geografisk beskrivning: Sveriges befolkning efter födelseland.
Lägsta geografiska enhet
Land
Högsta geografiska enhet
Land
Ansvarig institution/enhet
Institutionen för journalistik, medier och kommunikation (JMG)
Forskningsområde
Samhällsvetenskap (Standard för svensk indelning av forskningsämnen 2011)
Språk och lingvistik (CESSDA Topic Classification)
Minoriteter (CESSDA Topic Classification)
Folkräkningar (CESSDA Topic Classification)
Nyckelord
Dahlgren, P. M. (2021). Svenskar eller utrikesfödda i medierna? – att identifiera födelseland från namn. I: L.
Truedsson (red.) Vitt eller brett? – vilka får ta plats i medier och på redaktioner. Stockholm: Institutet för
mediestudier.
ISBN:
978-91-987098-0-3
Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.