Parallella texter från Migrationsverket

SND-ID: ext0329-1.

Ingår i samling hos SND: Parallella texter från myndigheter

Citering

Skapare/primärforskare

Simon Dahlberg - Institutet för språk och folkminnen, Språkrådet

Institutet för språk och folkminnen, Språkrådet

Forskningshuvudman

Institutet för språk och folkminnen - Språkrådet rorId

Beskrivning

Parallella texter nedladdade med hjälp av "w3m -dump" från ett ubuntu-skal, ifrån Migrationsverkets webbplats.

Texterna har laddats ner med hjälp av kommando 'w3m -dump' ifrån ett ubuntu-skal, varpå resulterande textfiler har skalats av till att innehålla endast den intressanta texten (inga menyer och dylikt).

Data innefattar personuppgifter

Nej

Metod och utfall

Dataformat / datastruktur

Datainsamling
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram

Text corpus

  • Antal språk

    Flerspråkig
  • Språk

    • Svenska (swe)

      Texter: 33

    • Amhariska (amh)

      Texter: 23

    • Arabiska (ara)

      Texter: 33

    • Azerbajdzjanska (aze)

      Texter: 27

    • Central Kurdish (ckb)

      Texter: 29

    • Engelska (eng)

      Texter: 33

    • Persiska (fas)

      Texter: 32

    • Kroatiska (hrv)

      Texter: 23

    • Armeniska (hye)

      Texter: 24

    • Georgiska (kat)

      Texter: 1

    • Northern Kurdish (kmr)

      Texter: 28

    • Mongoliska (mon)

      Texter: 25

    • Dari (prs)

      Texter: 28

    • Pashto (pus)

      Texter: 28

    • Romani (rom)

      Arli (dialekt)

      Texter: 24

    • Ryska (rus)

      Texter: 33

    • Somaliska (som)

      Texter: 29

    • Spanska (spa)

      Texter: 31

    • Albanska (sqi)

      Texter: 27

    • Thailändska (tha)

      Texter: 4

    • Tigrinja (tir)

      Texter: 29

    • Turkiska (tur)

      Texter: 2

    • Uzbekiska (uzb)

      Texter: 25

    • Kinesiska (zho)

      Texter: 3

    • Franska (fra)

      Texter: 31

    Mer..
  • Modalitet

    Skriftspråk
  • Storlek

    Ord: 29008 (swe)

    Texter: 33 (swe)

    Ord: 438614 (TOT)

    Texter: 580 (TOT)

  • Källa

    migrationsverket
    www.migrationsverket.se
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Administrativ information
Ämnesområde och nyckelord

Forskningsområde

Samhällsvetenskap (Standard för svensk indelning av forskningsämnen 2011)

Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)

Publikationer

Kontakt för frågor om data

Denna resurs har följande relationer

Är del av Myndighetsdata

Relaterade forskningsdata i SND:s katalog

Ingår i samling hos SND

CLARIN Virtual Collection Registry

Lägg till i samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Read more about virtual collections on the CLARIN website.