The Uppsala Russian Corpus
SND-ID: ext0071-1.
Åtkomst till data via
Hemsida
Skapare/primärforskare
Lennart Lönngren - Universitetet i Tromsö, Institutionen för språkvetenskap
Uppsala universitet, Institutionen för moderna språk
Forskningshuvudman
Universitetet i Tromsö - Institutionen för språkvetenskap
Beskrivning
Uppsalakorpusen består av runt 600 ryskspråkiga texter med sammanlagt en miljon ord (token), jämnt fördelade på informativ och skönlitterär prosa. De informativa texterna är skrivna 1985-1989 medan de skönlitterära texterna, vars vokabulär inte föråldras lika snabbt, hänför sig till en längre tidsperiod, från 1960-1988. Korpusen omfattar inte poesi eller drama.
Ett omfattande arbete har lagts på att säkerställa att korpusen blir så representativ och varierad som möjligt inom de givna ramarna. De informativa texterna är hämtade från 25 olika ämnesområden: ekonomi, utrikes nyheter/utrikespolitik, ideologi/inrikespolitik, partiangelägenheter, det sovjetiska samhället, sociala frågor, försvar, utbildning, lagstiftning, historia, kultur, lingvistik, medicin/hälsovård, psykologi, miljö/ekologi, jordbruk, ingenjörskonst, informationsteknologi, rymdforskning, energi, biologi, geologi/geografi, fysik, kemi och idrott. Vissa områden som ansågs vara viktigare representeras av en större textmängd.
Den skönlitterära hälften av korpusen omfattar verk av följande 40 författare: Abramov, Ajtmatov, Astaf'ev
Ett omfattande arbete har lagts på att säkerställa att korpusen blir så representativ och varierad som möjligt inom de givna ramarna. De informativa texterna är hämtade från 25 olika ämnesområden: ekonomi, utrikes nyheter/utrikespolitik, ideologi/inrikespolitik, partiangelägenheter, det sovjetiska samhället, sociala frågor, försvar, utbildning, lagstiftning, historia, kultur, lingvistik, medicin/hälsovård, psykologi, miljö/ekologi, jordbruk, ingenjörskonst, informationsteknologi, rymdforskning, energi, biologi, geologi/geografi, fysik, kemi och idrott. Vissa områden som ansågs vara viktigare representeras av en större textmängd.
Den skönlitterära hälften av korpusen omfattar verk av följande 40 författare: Abramov, Ajtmatov, Astaf'ev, Baklanov, Bek, Belov, Bitov, Bondarev, Dubov, Ganin, Gladyshev, Granin, Grekova, Goncharov, Iskander, Kaverin, Kazakov, Kochnev, Kozhevnikova, Nagibin, Lixanov, Lidin, Paustovskij, Pogodin, Pristavkin, Troepol'skij, Rasputin, Shcherbakova, Simonov, Solouxin, Shmelev, Tendrjakov, Tokareva, Tolstaja, Trifonov, Vasil'ev, Vorobl'ev, Zalygin och Zorin. Inte heller här är representationen jämn, utan de kändare författarna representeras av större textmängder.
För mer detaljerad information om korpusen se Lönngren, Lennart (ed.), 1993. Chastotnyj slovar' sovremennogo russkogo jazyka. (Modern rysk frekvensordbok. Med engelskspråkig sammanfattning.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 sidor Uppsala. ISBN 91-554-3134-8.
Syfte:
Syftet är att tillhandahålla en korpus med ryskspråkiga prosatexter. Visa mindre..
Data innefattar personuppgifter
Nej
Tidsperiod(er) som undersökts
1960 – 1988
1985 – 1989
Dataformat / datastruktur
Ansvarig institution/enhet
Institutionen för språkvetenskap
Forskningsområde
Språk och litteratur (Standard för svensk indelning av forskningsämnen 2011)
Språk och lingvistik (CESSDA Topic Classification)
Lönngren, Lennart (ed.), 1993. Частотный словарь современногo русского языка. [Chastotnyj slovar' sovremennogo russkogo jazyka.] (A Frequency Dictionary of Modern Russian. With a Summary in English.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 pp. Uppsala
ISBN:
91-554-3134-8
Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.