2020年8月29日,為期三天的2020工業(yè)互聯(lián)網(wǎng)大會(huì)在云端拉開帷幕。30日晚,因聯(lián)科技算法工程師胡翔受邀在“工業(yè)互聯(lián)網(wǎng)新生代”議題上分享了他在第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽上奪冠的經(jīng)驗(yàn),詳細(xì)介紹轉(zhuǎn)子部件脫落故障預(yù)測的內(nèi)容。
以下是演講內(nèi)容整理。
我是來自西安因聯(lián)信息科技有限公司的算法工程師胡翔,今天給大家分享的是2019年第三屆工業(yè)大數(shù)據(jù)創(chuàng)新競賽的賽題內(nèi)容——轉(zhuǎn)子部件脫落故障預(yù)測,將從以下幾個(gè)方面進(jìn)行闡述:1. 賽題分析;2. 模型驗(yàn)證與模型優(yōu)化;3. 總結(jié)展望。
2019屆大賽賽題“大型高速旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障預(yù)測”屬于工業(yè)領(lǐng)域典型的異常檢測和故障診斷問題。大型高速旋轉(zhuǎn)機(jī)組一旦發(fā)生轉(zhuǎn)子部件脫落問題,將會(huì)帶來巨大的經(jīng)濟(jì)損失以及安全隱患。由于大型高速旋轉(zhuǎn)機(jī)組轉(zhuǎn)子部件脫落故障的早期特征難以捕捉,主辦方希望通過運(yùn)用大數(shù)據(jù)的分析方法來識(shí)別轉(zhuǎn)子部件脫落和故障征兆強(qiáng)度。
初賽時(shí)組委會(huì)提供了5臺(tái)機(jī)組數(shù)據(jù)用于訓(xùn)練,其中包含兩臺(tái)故障機(jī)組,同時(shí)另外提供5臺(tái)機(jī)組數(shù)據(jù)用于測試。而決賽則需要識(shí)別8臺(tái)機(jī)組的故障情況,包括兩個(gè)預(yù)測目標(biāo):一是識(shí)別哪些機(jī)組發(fā)生了轉(zhuǎn)子脫落故障,二是針對存在轉(zhuǎn)子脫落故障的機(jī)組按照故障程度對所有數(shù)據(jù)進(jìn)行排序。
在采樣信息提取方面,每個(gè)機(jī)組提供6到7個(gè)測點(diǎn)的數(shù)據(jù),包括聯(lián)端徑向X、聯(lián)端徑向Y等位移測點(diǎn);同時(shí)機(jī)組還提供5個(gè)不同故障階段即不同故障程度的數(shù)據(jù)。每個(gè)位移測點(diǎn)包含5個(gè)字段,如轉(zhuǎn)子轉(zhuǎn)動(dòng)的周數(shù)、總采樣點(diǎn)數(shù)、波形數(shù)組、采樣頻率、轉(zhuǎn)速等。對每個(gè)測點(diǎn)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)采樣的旋轉(zhuǎn)周數(shù)不變,為32轉(zhuǎn),采樣的總樣本量也不變,為1024個(gè)點(diǎn),因此可得出結(jié)論是等角度采樣而非等時(shí)間采樣,采樣率為32點(diǎn)/轉(zhuǎn)。
在數(shù)據(jù)可視化方面,對位移波形進(jìn)行FFT(Fast Fourier Transformation)變換之后可得階次譜。通過對正常機(jī)組和故障機(jī)組的階次譜進(jìn)行分析發(fā)現(xiàn),在轉(zhuǎn)子脫落故障的不同階段,正常機(jī)組的1X轉(zhuǎn)頻能量無明顯變化,而故障機(jī)組隨著故障的不斷加劇,1X轉(zhuǎn)頻能量不斷增加。
此外,對同一個(gè)測點(diǎn)X向和Y向的振動(dòng)進(jìn)行合成得到軸心軌跡。分析發(fā)現(xiàn),正常機(jī)組的軸心軌跡在不同階段幾乎沒有變化,而故障機(jī)組的軸心軌跡隨著故障加劇變化明顯。
經(jīng)上述分析,我的解題思路主要分為兩點(diǎn),一是識(shí)別轉(zhuǎn)子部件是否存在脫落,二是識(shí)別存在脫落故障機(jī)組的征兆強(qiáng)度。第一個(gè)問題可歸結(jié)為二分類的問題,第二個(gè)問題的思路是通過分類概率大小來識(shí)別脫落故障的征兆強(qiáng)度。
之所以選擇分類概率大小來識(shí)別脫落故障征兆強(qiáng)度,實(shí)際上是我通過對比三個(gè)不同的解題思路后得出的結(jié)論。第一個(gè)思路是通過特征融合的方法,形成單一指標(biāo)指示脫落故障,但這只適合機(jī)理簡單的場景,而大賽賽題屬于典型的機(jī)理復(fù)雜場景;第二個(gè)思路是通過回歸的方法,對訓(xùn)練集數(shù)據(jù)故障賦予不同的“征兆強(qiáng)度標(biāo)簽”,但由于賽題提供的數(shù)據(jù)存在時(shí)間上的中斷,并且該數(shù)據(jù)集的樣本屬于小樣本問題,回歸方法效果不好;第三個(gè)思路是通過分類概率大小作為故障征兆強(qiáng)度的指標(biāo),該思路最符合此次大賽數(shù)據(jù)集特點(diǎn),因此采用第三個(gè)思路。
在采樣信息提取方面,每個(gè)機(jī)組提供6到7個(gè)測點(diǎn)的數(shù)據(jù),包括聯(lián)端徑向X、聯(lián)端徑向Y等位移測點(diǎn);同時(shí)機(jī)組還提供5個(gè)不同故障階段即不同故障程度的數(shù)據(jù)。每個(gè)位移測點(diǎn)包含5個(gè)字段,如轉(zhuǎn)子轉(zhuǎn)動(dòng)的周數(shù)、總采樣點(diǎn)數(shù)、波形數(shù)組、采樣頻率、轉(zhuǎn)速等。對每個(gè)測點(diǎn)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)采樣的旋轉(zhuǎn)周數(shù)不變,為32轉(zhuǎn),采樣的總樣本量也不變,為1024個(gè)點(diǎn),因此可得出結(jié)論是等角度采樣而非等時(shí)間采樣,采樣率為32點(diǎn)/轉(zhuǎn)。
在特征工程方面,提取時(shí)域特征和頻域特征。時(shí)域特征包括位移峰峰值,頻域特征包括1X、2X、3X轉(zhuǎn)頻的幅值,以及1X、2X、3X轉(zhuǎn)頻能量占比。
在建模數(shù)據(jù)的選擇上,考慮到最接近故障發(fā)生的a組數(shù)據(jù)與實(shí)際故障數(shù)據(jù)最為相似,因此,以a組數(shù)據(jù)作為分類正例,而無故障的數(shù)據(jù)作為分類反例組成訓(xùn)練數(shù)據(jù)集進(jìn)行建模。
在模型驗(yàn)證方面,選擇LightGBM作為分類算法模型,然后通過五折交叉驗(yàn)證,同時(shí)在這個(gè)階段需要保證驗(yàn)證集的數(shù)據(jù)來源平衡,最后根據(jù)驗(yàn)證結(jié)果優(yōu)化分類閾值。在預(yù)測階段實(shí)際上是取每一組數(shù)據(jù)集預(yù)測的最終統(tǒng)計(jì)結(jié)果作為最終結(jié)果。
在模型優(yōu)化方面,主要從兩個(gè)方向出發(fā),一是特征優(yōu)化和篩選,二是數(shù)據(jù)清洗。特征篩選包括兩個(gè)點(diǎn),一是特征在故障數(shù)據(jù)上的單調(diào)程度。下圖是1X轉(zhuǎn)頻能量隨著故障的演變劣化的趨勢圖,從圖中可以看出,1X轉(zhuǎn)頻能量隨著故障的劣化具有比較好的單調(diào)性。二是考慮特征在未知數(shù)據(jù)即未知工況上的泛化能力。由于無量綱特征不受工況影響,而有量綱特征受工況影響,因此建模過程中我刪除了大部分有量綱特征,強(qiáng)化了模型的泛化能力。
在數(shù)據(jù)清洗方面,從實(shí)際數(shù)據(jù)分析發(fā)現(xiàn),大機(jī)組的轉(zhuǎn)速存在完全恒定無變化的情況,而從實(shí)際業(yè)務(wù)角度出發(fā),大機(jī)組不可能存在轉(zhuǎn)速完全無波動(dòng)的情況,因此這部分?jǐn)?shù)據(jù)為異常數(shù)據(jù),將其進(jìn)行清洗,不參與建模。
十分開心能獲得第一名的好成績,通過這次競賽經(jīng)歷,我個(gè)人也有一些心得體會(huì)和大家分享。一是在分析問題時(shí)一定要從實(shí)際業(yè)務(wù)層面出發(fā),業(yè)務(wù)理解對特征提取和使用具有決定性影響;二是合適的解題思路關(guān)系到解決方案的泛化能力;三是數(shù)據(jù)的預(yù)處理在整個(gè)過程中是第一步也是至關(guān)重要的一步。
此外,我認(rèn)為在能夠提供連續(xù)的故障程度數(shù)據(jù)的情況下,可嘗試?yán)没貧w方法作為解決方案思路。本次比賽僅考慮了轉(zhuǎn)子部件脫落這一個(gè)故障,但大型高速旋轉(zhuǎn)機(jī)組在現(xiàn)實(shí)中往往存在非常多的故障模式,因此在實(shí)際過程中需重點(diǎn)分析多故障模式及考慮工況主要是轉(zhuǎn)速的影響,這些都是非常值得去深入研究的。
以上就是我的分享內(nèi)容,謝謝大家的聆聽!