Dataset med annoteringar av tekniskt språk från fyra års tillståndsövervakning av pappersmaskinsindustri i norra Sverige

SND-ID: 2023-257. Version: 1. DOI: https://doi.org/10.5878/hafd-ms27

Tillhörande dokumentation

Citering

Skapare/primärforskare

Karl Löwenmark - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Fredrik Sandin - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Marcus Liwicki - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Stephan Schnabel - Svenska Kullagerfabriken orcid

Forskningshuvudman

Luleå tekniska universitet - Institutionen för system- och rymdteknik rorId

Diarienummer hos huvudman

2019-02533

Beskrivning

Detta dataset består av tekniskt-språk-annoteringar från fyra års insamling från två pappersmaskiner i norra Sverige, strukturerat som en Pandas dataframe. Samma data finns också tillgänglig som en semikolonseparerad .csv-fil. Datan består av två kolumner, där den första kolumnen motsvarar annoteringens textinnehåll, och den andra titeln. Annoteringarna är skrivna på svenska, och processade så att alla egennamn ersatts av textsträngen ’egennamn’. Varje rad motsvarar en annotering med titel.

Data behandlas i Python med:
import pandas as pd
annotations_df = pd.read_pickle("Technical_Language_Annotations.pkl")
annotation_contents = annotations_df['noteComment']
annotation_titles = annotations_df['title']

Data innefattar personuppgifter

Ja

Typ av personuppgifter

Signerade annoteringar förekommer i bevarade rådata. Datasetet innehåller därmed pseudonymiserade personuppgifter.

Språk

Metod och utfall

Tidsperiod(er) som undersökts

2018 – 2022

Dataformat / datastruktur

Datainsamling
Språkresurser

Resurstyp

Korpus

Tänkt användning

Språkteknologiskt datorprogram, Mänsklig användning

Text corpus

  • Antal språk

    Enspråkig
  • Språk

    • Svenska (swe)

      Tekniskt språk (jargong)

  • Modalitet

    Skriftspråk
  • Storlek

    Poster: 2385

    Uttryck: 1613

  • Uppmärkning

    • Entitetsomnämnanden

      Automatisk uppmärkning

      Uppmärkta element: Övrigt

  • Källa

    https://doi.org/10.5878/z34p-qj52
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Geografisk beskrivning: Norrland

Administrativ information

Ansvarig institution/enhet

Institutionen för system- och rymdteknik

Medverkande

Håkan Sirkka - Smurfit Kappa

Per-Erik Larsson - Svenska Kullagerfabriken

Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik

Peter Wikström - SCA Munksund

Kjell Lundberg - Smurfit Kappa

... Visa mer..

Håkan Sirkka - Smurfit Kappa

Per-Erik Larsson - Svenska Kullagerfabriken

Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik

Peter Wikström - SCA Munksund

Kjell Lundberg - Smurfit Kappa

Smurfit Kappa

Svenska Kullagerfabriken rorId

SCA Munksund rorId

RISE Research Institutes of Sweden rorId

Visa mindre..

Finansiering

  • Finansiär: Verket för innovationssystem rorId
  • Diarienummer hos finansiär: 2019-02533
  • Projektnamn på ansökan: Kunskapsintegrering för klassificering av maskinskador
  • Information om finansiering: https://www.vinnova.se/p/kunskapsintegrering-for-klassificering-av-maskinskador/
Publikationer

Löwenmark, K., Taal, C., Nivre, J., Liwicki, M., & Sandin, F. (2022). Processing of Condition Monitoring Annotations with BERT and Technical Language Substitution: A Case Study. In Proceedings of the 7th European Conference of the Prognostics and Health Management Society 2022 (pp. 306–314).
DOI: https://doi.org/10.36001/phme.2022.v7i1.3356
URN: urn:nbn:se:ltu:diva-95407
SwePub: oai:DiVA.org:ltu-95407

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Versioner

Version 1. 2023-12-21

Version 1: 2023-12-21

DOI: https://doi.org/10.5878/hafd-ms27

CLARIN Virtual Collection Registry

Lägg till i samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Read more about virtual collections on the CLARIN website.

Publicerad: 2023-12-21
Senast uppdaterad: 2023-12-21