Dataset med tillståndsövervakningsvibrationsdata annoterat med tekniskt språk, från pappersmaskinsindustri i norra Sverige
SND-ID: 2023-246. Version: 2. DOI: https://doi.org/10.5878/hxc0-bd07
Tillhörande dokumentation
Citering
Alternativ titel
Annotated condition monitoring data for technical language processing and supervision
Skapare/primärforskare
Karl Löwenmark - Luleå tekniska universitet, Institutionen för system- och rymdteknik
Fredrik Sandin - Luleå tekniska universitet, Institutionen för system- och rymdteknik
Marcus Liwicki - Luleå tekniska universitet, Institutionen för system- och rymdteknik
Stephan Schnabel - Svenska Kullagerfabriken
Forskningshuvudman
Luleå tekniska universitet - Institutionen för system- och rymdteknik
Diarienummer hos huvudman
2019-02533
Beskrivning
Industridataset med labels är bland de mest värdefulla tillgångarna att tillgå inom prognostik- och tillståndsövervaknings-forskning. Att tillverka labellade dataset är både svårt och dyrt, vilket medför att allmänt tillgängliga industridataset är sällsynta, särskilt de med labels. Studier har dock visat att industriannoteringar kan användas för att träna AI-modeller direkt på industridata ( https://doi.org/10.36001/ijphm.2022.v13i2.3137 , https://doi.org/10.36001/phmconf.2023.v15i1.3507 ), men trots att många industridataset innehåller de nödvändiga texterna så är få, om ens några, sådana dataset allmänt tillgängliga.
Därför ger vi ut ett dataset innehållandes annoterade signaldata från två stora (80x10x10m) pappersmaskiner från ett pappersbruk i norra Sverige. Datan består av 21 090 par av signaler och annoteringar från ett års produktion. Annoteringarna är skrivna på svenska av experter på plats, och signalerna består huvudsakligen av accelerometervibrationsmätningar från de två maskinerna.
Datasetet består av ett års annoterade vibrationsensormätningar från två pappersmaskiner, strukturera
Därför ger vi ut ett dataset innehållandes annoterade signaldata från två stora (80x10x10m) pappersmaskiner från ett pappersbruk i norra Sverige. Datan består av 21 090 par av signaler och annoteringar från ett års produktion. Annoteringarna är skrivna på svenska av experter på plats, och signalerna består huvudsakligen av accelerometervibrationsmätningar från de två maskinerna.
Datasetet består av ett års annoterade vibrationsensormätningar från två pappersmaskiner, strukturerade som en Pandas dataframe och serialiserade som en pickle-fil (.pkl) samt en JSON-fil (.json). Den första kolumnen (’id’) är ID per sample; den andra kolumnen (’Spectra’) är fast-Fourier-transformerade och envelope-transformerade vibrationssignaler; den tredje kolumnen (’Notes’) är de tillhörande annoteringarna, kartlagda så att varje annotering är kopplad till alla signaler från tio dagar före annoteringsdatumet upp till annoteringsdatumet; och slutligen den fjärde kolumnen (’Embeddings’) är förberäknade text-representationer från Swedish SentenceBERT. Varje rad motsvarar ett vibrationsmätningsprov, även om det inte finns någon åtskillnad i denna data mellan vilken sensor och maskindel varje mätning kommer från. Visa mindre..
Data innefattar personuppgifter
Ja
Typ av personuppgifter
Signerade annoteringar förekommer i bevarade rådata. Datasetet innehåller därmed pseudonymiserade personuppgifter.
Geografisk utbredning
Geografisk plats: Sverige
Ansvarig institution/enhet
Institutionen för system- och rymdteknik
Övriga forskningshuvudmän
Medverkande
Peter Wikström - SCA Munksund
Kjell Lundberg - Smurfit Kappa
Per-Erik Larsson - Svenska Kullagerfabriken
Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik
Håkan Sirkka - Smurfit Kappa
... Visa mer..Peter Wikström - SCA Munksund
Kjell Lundberg - Smurfit Kappa
Per-Erik Larsson - Svenska Kullagerfabriken
Pär-Erik Martinsson - Luleå tekniska universitet, Institutionen för system- och rymdteknik
Håkan Sirkka - Smurfit Kappa
RISE Research Institutes of Sweden
Smurfit Kappa
Visa mindre..Forskningsområde
Sannolikhetsteori och statistik (Standard för svensk indelning av forskningsämnen 2011)
Data- och informationsvetenskap (datateknik) (Standard för svensk indelning av forskningsämnen 2011)
Språkteknologi (språkvetenskaplig databehandling) (Standard för svensk indelning av forskningsämnen 2011)
Annan data- och informationsvetenskap (Standard för svensk indelning av forskningsämnen 2011)
Signalbehandling (Standard för svensk indelning av forskningsämnen 2011)
Annan maskinteknik (Standard för svensk indelning av forskningsämnen 2011)
Pappers-, massa- och fiberteknik (Standard för svensk indelning av forskningsämnen 2011)
Sortera på namn | Sortera efter år
Löwenmark, K., Taal, C., Vurgaft, A., Liwicki, M., Nivre, J., & Sandin, F. (2023). Labelling of annotated condition monitoring data through technical language processing.
URN:
urn:nbn:se:ltu:diva-95406
SwePub:
oai:DiVA.org:ltu-95406
Löwenmark, K., Taal, C., Schnabel, S., Liwicki, M., & Sandin, F. (2022). Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry. In International Journal of Prognostics and Health Management (Vol. 13, Issue 2).
DOI:
https://doi.org/10.36001/ijphm.2022.v13i2.3137
URN:
urn:nbn:se:ltu:diva-93815
SwePub:
oai:DiVA.org:ltu-93815
Löwenmark, K. (2023). Technical Language Supervision for Intelligent Fault Diagnosis [Licentiate thesis]. Luleå University of Technology.
ISBN:
9789180482547
URN:
urn:nbn:se:ltu:diva-95414
SwePub:
oai:DiVA.org:ltu-95414
Löwenmark, K., Taal, C., Nivre, J., Liwicki, M., & Sandin, F. (2022). Processing of Condition Monitoring Annotations with BERT and Technical Language Substitution: A Case Study. In Proceedings of the 7th European Conference of the Prognostics and Health Management Society 2022 (pp. 306–314).
DOI:
https://doi.org/10.36001/phme.2022.v7i1.3356
URN:
urn:nbn:se:ltu:diva-95407
SwePub:
oai:DiVA.org:ltu-95407
Om du publicerat något baserat på det här datamaterialet, meddela gärna SND en referens till din(a) publikation(er). Är du ansvarig för katalogposten kan du själv uppdatera metadata/databeskrivningen via DORIS.