Dataset med tillståndsövervakningsvibrationsdata annoterat med tekniskt språk, från pappersmaskinsindustri i norra Sverige

SND-ID: 2023-246. Version: 1. DOI: https://doi.org/10.5878/z34p-qj52

Det finns en senare version av detta dataset än den du har förfrågat.

Gå till den senaste versionen: 2

Version 2: 2023-12-21

DOI: https://doi.org/10.5878/hxc0-bd07

Metadata korrigerade: Uppdaterat tillgänglighetsstatus till begränsad åtkomst

Citering

Alternativ titel

Annotated condition monitoring data for technical language processing and supervision

Skapare/primärforskare

Karl Löwenmark - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Fredrik Sandin - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Marcus Liwicki - Luleå tekniska universitet, Institutionen för system- och rymdteknik orcid

Stephan Schnabel - Svenska Kullagerfabriken orcid

Forskningshuvudman

Luleå tekniska universitet - Institutionen för system- och rymdteknik rorId

Diarienummer hos huvudman

2019-02533

Beskrivning

Industridataset med labels är bland de mest värdefulla tillgångarna att tillgå inom prognostik- och tillståndsövervaknings-forskning. Att tillverka labellade dataset är både svårt och dyrt, vilket medför att allmänt tillgängliga industridataset är sällsynta, särskilt de med labels. Studier har dock visat att industriannoteringar kan användas för att träna AI-modeller direkt på industridata ( https://doi.org/10.36001/ijphm.2022.v13i2.3137 , https://doi.org/10.36001/phmconf.2023.v15i1.3507 ), men trots att många industridataset innehåller de nödvändiga texterna så är få, om ens några, sådana dataset allmänt tillgängliga.
Därför ger vi ut ett dataset innehållandes annoterade signaldata från två stora (80x10x10m) pappersmaskiner från ett pappersbruk i norra Sverige. Datan består av 21 090 par av signaler och annoteringar från ett års produktion. Annoteringarna är skrivna på svenska av experter på plats, och signalerna består huvudsakligen av accelerometervibrationsmätningar från de två maskinerna.
Datasetet består av ett års annoterade vibrationsensormätningar från två pappersmaskiner, strukturera

... Visa mer..
Industridataset med labels är bland de mest värdefulla tillgångarna att tillgå inom prognostik- och tillståndsövervaknings-forskning. Att tillverka labellade dataset är både svårt och dyrt, vilket medför att allmänt tillgängliga industridataset är sällsynta, särskilt de med labels. Studier har dock visat att industriannoteringar kan användas för att träna AI-modeller direkt på industridata ( https://doi.org/10.36001/ijphm.2022.v13i2.3137 , https://doi.org/10.36001/phmconf.2023.v15i1.3507 ), men trots att många industridataset innehåller de nödvändiga texterna så är få, om ens några, sådana dataset allmänt tillgängliga.
Därför ger vi ut ett dataset innehållandes annoterade signaldata från två stora (80x10x10m) pappersmaskiner från ett pappersbruk i norra Sverige. Datan består av 21 090 par av signaler och annoteringar från ett års produktion. Annoteringarna är skrivna på svenska av experter på plats, och signalerna består huvudsakligen av accelerometervibrationsmätningar från de två maskinerna.
Datasetet består av ett års annoterade vibrationsensormätningar från två pappersmaskiner, strukturerade som en Pandas dataframe och serialiserade som en pickle-fil (.pkl) samt en JSON-fil (.json). Den första kolumnen (’id’) är ID per sample; den andra kolumnen (’Spectra’) är fast-Fourier-transformerade och envelope-transformerade vibrationssignaler; den tredje kolumnen (’Notes’) är de tillhörande annoteringarna, kartlagda så att varje annotering är kopplad till alla signaler från tio dagar före annoteringsdatumet upp till annoteringsdatumet; och slutligen den fjärde kolumnen (’Embeddings’) är förberäknade text-representationer från Swedish SentenceBERT. Varje rad motsvarar ett vibrationsmätningsprov, även om det inte finns någon åtskillnad i denna data mellan vilken sensor och maskindel varje mätning kommer från. Visa mindre..

Data innefattar personuppgifter

Nej

Språk

Metod och utfall

Dataformat / datastruktur

Datainsamling
  • Insamlingsmetod: Inspelning
  • Beskrivning av insamlingsmetod: Vibrationsdata insamlad med accelerometrar (SKF IMx-system med CMSS-sensorer)
  • Datainsamlare: Luleå tekniska universitet
  • Instrument: SKF CMSS 2207 - https://www.skf.com/ph/productinfo/productid-CMSS%202207
  • Instrument: SKF CMSS 2200 - https://www.skf.com/ph/productinfo/productid-CMSS%202200
  • Datakälla: Fysiska föremål
Geografisk täckning

Geografisk utbredning

Geografisk plats: Sverige

Administrativ information

Ansvarig institution/enhet

Institutionen för system- och rymdteknik

Övriga forskningshuvudmän

Medverkande

Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik

Peter Wikström - SCA Munksund

Per-Erik Larson - Svenska Kullagerfabriken

Håkan Sirkka - Smurfit Kappa

Kjell Lundberg - Smurfit Kappa

... Visa mer..

Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik

Peter Wikström - SCA Munksund

Per-Erik Larson - Svenska Kullagerfabriken

Håkan Sirkka - Smurfit Kappa

Kjell Lundberg - Smurfit Kappa

RISE Research Institutes of Sweden rorId

SCA Munksund rorId

Svenska Kullagerfabriken rorId

Smurfit Kappa

Visa mindre..

Finansiering 1

  • Finansiär: Verket för innovationssystem rorId
  • Diarienummer hos finansiär: 2019-02533_Vinnova
  • Projektnamn på ansökan: Kunskapsintegrering för klassificering av maskinskador
  • Information om finansiering: Knowledge integration for fault severity estimation

Finansiering 2

  • Finansiär: Luleå tekniska universitet rorId
Ämnesområde och nyckelord

Forskningsområde

Sannolikhetsteori och statistik (Standard för svensk indelning av forskningsämnen 2011)

Data- och informationsvetenskap (datateknik) (Standard för svensk indelning av forskningsämnen 2011)

Språkteknologi (språkvetenskaplig databehandling) (Standard för svensk indelning av forskningsämnen 2011)

Annan data- och informationsvetenskap (Standard för svensk indelning av forskningsämnen 2011)

Signalbehandling (Standard för svensk indelning av forskningsämnen 2011)

Annan maskinteknik (Standard för svensk indelning av forskningsämnen 2011)

Pappers-, massa- och fiberteknik (Standard för svensk indelning av forskningsämnen 2011)

Publikationer

Sortera på namn | Sortera efter år

Löwenmark, K., Taal, C., Vurgaft, A., Liwicki, M., Nivre, J., & Sandin, F. (2023). Labelling of annotated condition monitoring data through technical language processing.
URN: urn:nbn:se:ltu:diva-95406
SwePub: oai:DiVA.org:ltu-95406

Löwenmark, K., Taal, C., Schnabel, S., Liwicki, M., & Sandin, F. (n.d.). Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry. In International Journal of Prognostics and Health Management (Vol. 13, Issue 2).
DOI: https://doi.org/10.36001/ijphm.2022.v13i2.3137
URN: urn:nbn:se:ltu:diva-93815
SwePub: oai:DiVA.org:ltu-93815

Löwenmark, K., Sandin, F., & Fink, O. (2023). Technical Language Supervision for Intelligent Fault Diagnosis.
ISBN: 9789180482547
URN: urn:nbn:se:ltu:diva-95414
SwePub: oai:DiVA.org:ltu-95414

Löwenmark, K., Taal, C., Nivre, J., Liwicki, M., & Sandin, F. (n.d.). Processing of Condition Monitoring Annotations with BERT and Technical Language Substitution: A Case Study. In Proceedings of the 7th European Conference of the Prognostics and Health Management Society 2022 (pp. 306–314).
DOI: https://doi.org/10.36001/phme.2022.v7i1.3356
URN: urn:nbn:se:ltu:diva-95407
SwePub: oai:DiVA.org:ltu-95407

Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.

Versioner

Version 2. 2023-12-21

Version 2: 2023-12-21

DOI: https://doi.org/10.5878/hxc0-bd07

Metadata korrigerade: Uppdaterat tillgänglighetsstatus till begränsad åtkomst

Version 1. 2023-11-29

Version 1: 2023-11-29

DOI: https://doi.org/10.5878/z34p-qj52

Kontakt för frågor om data

Karl Löwenmark

karl.lowenmark@ltu.se

Denna resurs har följande relationer

CLARIN Virtual Collection Registry

Lägg till i samling

En virtuell samling är kopplad till ett specifikt forskningsändamål och innehåller länkar till dataresurser i olika digitala arkiv. Samlingen är lätt att skapa, få åtkomst till och citera.

Read more about virtual collections on the CLARIN website.

Publicerad: 2023-11-29
Senast uppdaterad: 2023-12-21