基于文本挖掘的道岔故障分類研究
本文關(guān)鍵詞:基于文本挖掘的道岔故障分類研究
更多相關(guān)文章: 道岔 故障 文本挖掘 文本分類 主題模型 支持向量機
【摘要】:隨著鐵路運輸高速發(fā)展,鐵路運輸對鐵路信號系統(tǒng)的要求不斷提高,隨之對鐵路信號系統(tǒng)設(shè)備維護效率要求也越來越高。道岔是鐵路信號系統(tǒng)中的重要基礎(chǔ)設(shè)備,是鐵路保持高效運輸?shù)年P(guān)鍵設(shè)備,也是電務(wù)維護的重點。鐵路電務(wù)工作人員投入大量的精力對道岔進行維護,但道岔仍然是故障的高發(fā)部位。因此,開展對道岔故障的分類研究,提高道岔故障維護效率,具有重要意義。道岔在運營維護過程中,積累了大量的維護數(shù)據(jù),并以文本的方式記錄。這些維護數(shù)據(jù)對道岔故障分析和設(shè)備維護決策有重大的參考價值。通過統(tǒng)計研究廣州鐵路(集團)公司(簡稱廣鐵集團)現(xiàn)場的故障一覽表可發(fā)現(xiàn):故障數(shù)據(jù)錄入缺乏規(guī)范性,導(dǎo)致故障數(shù)據(jù)可利用價值降低;故障表中設(shè)備類別設(shè)置不合理,對故障數(shù)據(jù)的統(tǒng)計和處理帶來一定的難度。鐵路信號設(shè)備維護管理者希望通過制定一些規(guī)章制度解決這類問題,但效果并不理想。針對上述問題,本文進行了如下研究:根據(jù)道岔設(shè)備結(jié)構(gòu)組成與工作原理,結(jié)合道岔故障記錄數(shù)據(jù),將道岔故障設(shè)備類別進行了重新設(shè)置:應(yīng)用文本挖掘的方法,設(shè)計了道岔故障分類器,實現(xiàn)了對道岔故障的自動分類;利用重新設(shè)置的道岔故障設(shè)備類別和設(shè)計的道岔故障分類器,設(shè)計并實現(xiàn)了道岔故障數(shù)據(jù)錄入表單,通過設(shè)計的表單對道岔故障數(shù)據(jù)實時記錄,確保數(shù)據(jù)記錄準確有效。本文具體研究工作及成果如下:(1)分析了道岔的結(jié)構(gòu)組成和工作原理。將道岔的分析與故障一覽表中記錄的道岔故障數(shù)據(jù)相結(jié)合,對道岔故障進行合理的分類。(2)提取了道岔故障數(shù)據(jù)中的專業(yè)術(shù)語,將提取的專業(yè)術(shù)語注入NLPIR漢語分詞系統(tǒng)(又名ICTCLA)的用戶詞典中,對道岔故障文本進行了分詞處理。(3)針對道岔故障數(shù)據(jù)描述的多樣化,應(yīng)用了PLSA主題模型特征提取方法對故障文本進行特征提取。(4)應(yīng)用了支持向量機的方法設(shè)計道岔故障分類器,實現(xiàn)了道岔故障設(shè)備類別自動分類,并將分類效果與其他分類方法進行了對比。對比結(jié)果表明,PLSA主題模型特征提取與支持向量機相結(jié)合的分類效果相對優(yōu)于其他分類方法。(5)根據(jù)道岔故障分類結(jié)果并結(jié)合現(xiàn)場需求,設(shè)計并實現(xiàn)了道岔故障數(shù)據(jù)錄入表單,規(guī)范了道岔故障數(shù)據(jù)錄入。本文通過對道岔的分類研究和道岔故障錄入表單的設(shè)計,增強了數(shù)據(jù)錄入的規(guī)范性,保證了故障數(shù)據(jù)錄入的有效性,提高了道岔維護管理的效率。
【關(guān)鍵詞】:道岔 故障 文本挖掘 文本分類 主題模型 支持向量機
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:U216.425;TP391.1
【目錄】:
- 致謝5-6
- 摘要6-8
- ABSTRACT8-12
- 1 引言12-20
- 1.1 論文選題背景與意義12-14
- 1.2 國內(nèi)外研究現(xiàn)狀14-18
- 1.2.1 設(shè)備維護管理信息化概述14-17
- 1.2.2 文本挖掘簡介17-18
- 1.3 論文主要工作內(nèi)容及組織架構(gòu)18-19
- 1.4 本章小結(jié)19-20
- 2 預(yù)備知識20-33
- 2.1 文本挖掘中的文本分類20-27
- 2.1.1 文本預(yù)處理21
- 2.1.2 特征降維和特征權(quán)重方法21-24
- 2.1.3 分類器設(shè)計算法24-27
- 2.1.4 分類性能評估27
- 2.2 道岔結(jié)構(gòu)組成及維護管理27-32
- 2.2.1 道岔結(jié)構(gòu)組成27-29
- 2.2.2 轉(zhuǎn)轍機29-32
- 2.2.3 道岔維護管理32
- 2.3 本章小結(jié)32-33
- 3 道岔故障分類及文本預(yù)處理33-40
- 3.1 道岔故障文本數(shù)據(jù)簡介33-34
- 3.2 道岔故障分類流程34-35
- 3.3 道岔故障分類文本預(yù)處理35-39
- 3.3.1 道岔故障類別標簽設(shè)定35-37
- 3.3.2 文本分詞37-39
- 3.3.3 去停用詞39
- 3.4 本章小結(jié)39-40
- 4 基于主題模型的道岔故障特征提取40-48
- 4.1 PLSA主題模型特征提取40-42
- 4.1.1 主題模型表示41
- 4.1.2 模型參數(shù)估計41-42
- 4.1.3 新樣本模型表示42
- 4.2 道岔故障描述分析42-44
- 4.3 道岔故障特征提取44-47
- 4.4 本章小結(jié)47-48
- 5 基于支持向量機的道岔故障分類48-60
- 5.1 支持向量機48-50
- 5.2 分類器應(yīng)用50-51
- 5.3 分類結(jié)果評價方法51-53
- 5.4 分類結(jié)果分析53-59
- 5.5 本章小結(jié)59-60
- 6 道岔故障數(shù)據(jù)錄入表單的設(shè)計與實現(xiàn)60-69
- 6.1 道岔故障數(shù)據(jù)錄入表單設(shè)計60-62
- 6.2 道岔故障數(shù)據(jù)錄入表單實現(xiàn)62-68
- 6.2.1 電務(wù)調(diào)度指揮中心系統(tǒng)簡介62-65
- 6.2.2 動態(tài)表單實現(xiàn)65-68
- 6.3 本章小結(jié)68-69
- 7 總結(jié)及展望69-71
- 參考文獻71-73
- 圖索引73-74
- 表索引74-75
- 作者簡歷及攻讀碩士學(xué)位期間取得的研究成果75-77
- 學(xué)位論文數(shù)據(jù)集77
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張燕;寒楓;楚紅濤;;文本挖掘簡述[J];中國電力教育;2006年S3期
2 龔樂君;韋有兵;謝建明;袁志棟;孫嘯;;一種面向基因與疾病關(guān)系的文本挖掘方法[J];東南大學(xué)學(xué)報(自然科學(xué)版);2010年03期
3 胥桂仙,許建潮,連遠鋒,李昱翠;文本挖掘中的特征表示及聚類方法[J];吉林工學(xué)院學(xué)報(自然科學(xué)版);2002年03期
4 林鴻飛,戰(zhàn)學(xué)剛,姚天順;中文文本挖掘的特征導(dǎo)航機制[J];東北大學(xué)學(xué)報;2000年03期
5 胥桂仙,蘇筱蔚,陳淑艷;中文文本挖掘中的無詞典分詞的算法及其應(yīng)用[J];吉林工學(xué)院學(xué)報(自然科學(xué)版);2002年01期
6 李湘云;;ISODATA動態(tài)聚類算法在文本挖掘中的應(yīng)用[J];長春工程學(xué)院學(xué)報(自然科學(xué)版);2007年02期
7 朱薔薔;張桂蕓;劉文龍;;基于MapReduce框架一種文本挖掘算法的設(shè)計與實現(xiàn)[J];鄭州大學(xué)學(xué)報(工學(xué)版);2012年05期
8 張黎黎;;Web文本挖掘在智能分類中的應(yīng)用[J];山東工業(yè)技術(shù);2013年11期
9 張濤;鄧軍;;現(xiàn)代遠程教育個性化Web挖掘研究[J];科學(xué)技術(shù)與工程;2007年05期
10 白翎雁;才書訓(xùn);;Web文本挖掘及相關(guān)技術(shù)研究[J];沈陽工程學(xué)院學(xué)報(自然科學(xué)版);2008年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 陳林;王曉華;李殿峗;文俊浩;;基于自增模式的文本挖掘研究[A];’2004計算機應(yīng)用技術(shù)交流會議論文集[C];2004年
2 王巍;楊武;張樂君;鄭軍;;支持網(wǎng)絡(luò)話題管理的文本挖掘算法分析[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(下冊)[C];2007年
3 王繼成;孫穎;張福炎;;文本挖掘-數(shù)據(jù)挖掘研究的新課題[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
4 高飛;荊繼武;向繼;;文本挖掘系統(tǒng)的可視化方法研究[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會論文集(上冊)[C];2007年
5 朱強生;田英;周延泉;何華燦;;基于非負因子分析的模糊文本挖掘[A];2006通信理論與技術(shù)新進展——第十一屆全國青年通信學(xué)術(shù)會議論文集[C];2006年
6 錢程揚;龍毅;徐震;孫昊;;基于Web文本挖掘的地理位置信息重建技術(shù)[A];中國地理學(xué)會2007年學(xué)術(shù)年會論文摘要集[C];2007年
7 蔣子海;周斌;吳泉源;;基于UIMA AS的文本挖掘系統(tǒng)的性能分析與評估[A];全國計算機安全學(xué)術(shù)交流會論文集·第二十五卷[C];2010年
8 邱曉蕾;張聰超;;基于SVD和部分聚集分類的文本挖掘算法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
9 武洪萍;周國祥;;Web文本挖掘研究[A];計算機技術(shù)與應(yīng)用進展·2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年
10 陳宇;王強;;聚類算法在Web文本挖掘中的應(yīng)用研究[A];2009全國計算機網(wǎng)絡(luò)與通信學(xué)術(shù)會議論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 本報記者 施鵬;非結(jié)構(gòu)信息和文本挖掘[N];21世紀經(jīng)濟報道;2009年
2 周青 編譯;文本挖掘工具實現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)價值[N];計算機世界;2004年
3 ;SAS公司收購Teragram 強化BI領(lǐng)域地位[N];計算機世界;2008年
4 ;用挖掘技術(shù)使學(xué)術(shù)資源利用效益最大化[N];中國計算機報;2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 曹奇敏;網(wǎng)絡(luò)信息文本挖掘若干問題研究[D];北京理工大學(xué);2015年
2 陳虹樞;基于主題模型的專利文本挖掘方法及應(yīng)用研究[D];北京理工大學(xué);2015年
3 李梅;文本挖掘中若干關(guān)鍵技術(shù)研究[D];西北農(nóng)林科技大學(xué);2016年
4 袁鋒;中醫(yī)醫(yī)案文本挖掘的若干關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2016年
5 孫道軍;文本挖掘預(yù)處理相關(guān)基礎(chǔ)技術(shù)分析與應(yīng)用研究[D];北京郵電大學(xué);2008年
6 周雪忠;文本挖掘在中醫(yī)藥中的若干應(yīng)用研究[D];浙江大學(xué);2004年
7 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學(xué);2005年
8 李芳;文本挖掘若干關(guān)鍵技術(shù)研究[D];北京化工大學(xué);2010年
9 文翰;面向信息檢索的Web文本挖掘方法研究[D];華南理工大學(xué);2012年
10 卜東波;聚類/分類理論研究及其在文本挖掘中的應(yīng)用[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2000年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張馨允;基于Spark的Web文本挖掘系統(tǒng)的研究與實現(xiàn)[D];吉林大學(xué);2016年
2 王釗;基于Hadoop的文本挖掘研究與應(yīng)用[D];廣東工業(yè)大學(xué);2016年
3 黃建澍;面向人大代表議案處理的文本挖掘系統(tǒng)的設(shè)計與實現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2016年
4 徐奇釗;基于文本挖掘的文本情緒分類[D];云南財經(jīng)大學(xué);2016年
5 鄒運懷;基于文本挖掘的道岔故障分類研究[D];北京交通大學(xué);2016年
6 王萍;基于Web文本挖掘的電子商務(wù)專業(yè)人才市場需求研究[D];重慶工商大學(xué);2016年
7 盛華;聚類分析在文本挖掘中的應(yīng)用與研究[D];江南大學(xué);2016年
8 劉超;業(yè)界專家的媒體發(fā)言對公司股價影響的分析[D];上海師范大學(xué);2016年
9 吳亞宇;基于文本挖掘的年報情感與上市公司業(yè)績的關(guān)系研究[D];中國地質(zhì)大學(xué)(北京);2016年
10 高希瑞;基于文本挖掘的企業(yè)危機預(yù)警研究[D];華東師范大學(xué);2011年
,本文編號:857414
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/857414.html