基于大數(shù)據(jù)的公交車輛狀態(tài)細(xì)分與故障預(yù)測(cè)研究
發(fā)布時(shí)間:2021-08-04 08:11
隨著公共交通的快速發(fā)展,公交車輛的運(yùn)營(yíng)強(qiáng)度不斷增加,在高強(qiáng)度超負(fù)荷運(yùn)行中公交車輛會(huì)出現(xiàn)各種突發(fā)性問題。公交集團(tuán)公司在運(yùn)營(yíng)維護(hù)過程中產(chǎn)生大量數(shù)據(jù),如何有效利用數(shù)據(jù)資產(chǎn)建立一套公交大數(shù)據(jù)的分析體系,從而指導(dǎo)公交車輛的安全維護(hù)工作是十分重要的。本文首先對(duì)車輛狀態(tài)和故障預(yù)測(cè)進(jìn)行文獻(xiàn)分析,針對(duì)當(dāng)前基于大數(shù)據(jù)的公交車輛健康狀況分析預(yù)測(cè)理論和實(shí)踐還處于起步階段,需要更多的理論探索和實(shí)踐應(yīng)用。本文依據(jù)北京公交集團(tuán)車輛采集的整車數(shù)據(jù)同時(shí)結(jié)合維修保養(yǎng)數(shù)據(jù)和外部天氣影響,使用數(shù)據(jù)挖掘和大數(shù)據(jù)的分析方法選取公交數(shù)據(jù)圍繞車輛故障狀態(tài)進(jìn)行研究,得到車輛狀態(tài)細(xì)分與關(guān)鍵故障的預(yù)測(cè)。其次介紹了公交大數(shù)據(jù)組成和公交數(shù)據(jù)的轉(zhuǎn)存和預(yù)處理流程,從車輛價(jià)值角度,選取近度、頻度和時(shí)間作為公交車輛狀態(tài)分析指標(biāo),運(yùn)用k-means聚類方法對(duì)公交車輛進(jìn)行細(xì)分,分別賦予不同的車輛標(biāo)簽,在后續(xù)車輛的維修保養(yǎng)過程中可以參考這些標(biāo)簽化信息,針對(duì)不同的車輛優(yōu)化保養(yǎng)維修策略,從而為車輛保養(yǎng)維修單位提供一些借鑒和建議。然后針對(duì)公交故障信息類型,通過短文本挖掘技術(shù)對(duì)公交故障信息進(jìn)行特征提取,得到公交車輛關(guān)鍵故障部位,發(fā)動(dòng)機(jī)故障是最顯著的故障特征,其次是...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1聚類分析的基本步驟流程??Figure?2-1?Basic?steps?of?cluster?analysis??
聲數(shù)據(jù)的產(chǎn)生主要有采集的數(shù)據(jù)恒定無變化和數(shù)據(jù)字段0等默認(rèn)一數(shù)據(jù)值,需要將這些噪音數(shù)據(jù)去除。??(3)重復(fù)記錄和無效字段的處理??在數(shù)據(jù)清洗過程中,由于數(shù)據(jù)表眾多,數(shù)據(jù)量比較大,需要借助工具選,在對(duì)公交數(shù)據(jù)進(jìn)行處理過程中借助ETL技術(shù)結(jié)合數(shù)據(jù)清洗工具KE復(fù)值和無效字段進(jìn)行處理。Kettle去除重復(fù)記錄的Unique?rows=除去輸入流中的重復(fù)行,如圖3-1所示(在使用該節(jié)點(diǎn)前要先排序,否連續(xù)的重復(fù)行)在去重操作中的流程如下:??1、從數(shù)據(jù)流里讀取輸入字段。??2、對(duì)數(shù)據(jù)流的字段進(jìn)行模糊算法的匹配并查詢。??3、返回相應(yīng)的匹配結(jié)果。??4、使用過濾記錄的步驟選擇出相似的記錄。??5、查詢校驗(yàn)值是否準(zhǔn)確。??6、最后使用過濾記錄的步驟過濾掉重復(fù)的記錄。??
針對(duì)每一次K的不同取值,我們進(jìn)行30次迭代計(jì)算,并同時(shí)計(jì)算輪廓系數(shù)的大??小,通過每次輪廓系數(shù)疊加的平均值作為最終評(píng)價(jià)標(biāo)準(zhǔn),可以看到K與輪廓系??數(shù)的關(guān)系如圖3-2所示:??輪廓系數(shù)與K的關(guān)系??味2?-?\??驗(yàn)?\??V?v?一??—I?I?I?I?I?I?I ̄ ̄??2?3?4?5?6?7?8??K??圖3-2?K與輪廓系數(shù)的關(guān)系??Figure?3-2?The?relationship?between?K?and?the?contour?factor??當(dāng)K值等于3時(shí),有最大的輪廓系數(shù),這與我們選取聚類的個(gè)數(shù)相吻合。??很好的驗(yàn)證了聚類個(gè)數(shù)的合理性。由于指標(biāo)選取是三維數(shù)據(jù),可視化效果不容易??體現(xiàn),所以通過多維定標(biāo)的方式將緯度將至二維,查看聚類效果,如圖3-3所示。??kmeans聚類?k=3??s??巧?七冬??????*?V.*??以_??-??■?I?I?I?I?I?I?I?\??-5?-3?-10?12??mds[,1]??圖3-3聚類效果圖??Figure?3-3?The?clustering?effect?diagram??30??
本文編號(hào):3321346
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:77 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1聚類分析的基本步驟流程??Figure?2-1?Basic?steps?of?cluster?analysis??
聲數(shù)據(jù)的產(chǎn)生主要有采集的數(shù)據(jù)恒定無變化和數(shù)據(jù)字段0等默認(rèn)一數(shù)據(jù)值,需要將這些噪音數(shù)據(jù)去除。??(3)重復(fù)記錄和無效字段的處理??在數(shù)據(jù)清洗過程中,由于數(shù)據(jù)表眾多,數(shù)據(jù)量比較大,需要借助工具選,在對(duì)公交數(shù)據(jù)進(jìn)行處理過程中借助ETL技術(shù)結(jié)合數(shù)據(jù)清洗工具KE復(fù)值和無效字段進(jìn)行處理。Kettle去除重復(fù)記錄的Unique?rows=除去輸入流中的重復(fù)行,如圖3-1所示(在使用該節(jié)點(diǎn)前要先排序,否連續(xù)的重復(fù)行)在去重操作中的流程如下:??1、從數(shù)據(jù)流里讀取輸入字段。??2、對(duì)數(shù)據(jù)流的字段進(jìn)行模糊算法的匹配并查詢。??3、返回相應(yīng)的匹配結(jié)果。??4、使用過濾記錄的步驟選擇出相似的記錄。??5、查詢校驗(yàn)值是否準(zhǔn)確。??6、最后使用過濾記錄的步驟過濾掉重復(fù)的記錄。??
針對(duì)每一次K的不同取值,我們進(jìn)行30次迭代計(jì)算,并同時(shí)計(jì)算輪廓系數(shù)的大??小,通過每次輪廓系數(shù)疊加的平均值作為最終評(píng)價(jià)標(biāo)準(zhǔn),可以看到K與輪廓系??數(shù)的關(guān)系如圖3-2所示:??輪廓系數(shù)與K的關(guān)系??味2?-?\??驗(yàn)?\??V?v?一??—I?I?I?I?I?I?I ̄ ̄??2?3?4?5?6?7?8??K??圖3-2?K與輪廓系數(shù)的關(guān)系??Figure?3-2?The?relationship?between?K?and?the?contour?factor??當(dāng)K值等于3時(shí),有最大的輪廓系數(shù),這與我們選取聚類的個(gè)數(shù)相吻合。??很好的驗(yàn)證了聚類個(gè)數(shù)的合理性。由于指標(biāo)選取是三維數(shù)據(jù),可視化效果不容易??體現(xiàn),所以通過多維定標(biāo)的方式將緯度將至二維,查看聚類效果,如圖3-3所示。??kmeans聚類?k=3??s??巧?七冬??????*?V.*??以_??-??■?I?I?I?I?I?I?I?\??-5?-3?-10?12??mds[,1]??圖3-3聚類效果圖??Figure?3-3?The?clustering?effect?diagram??30??
本文編號(hào):3321346
本文鏈接:http://sikaile.net/kejilunwen/qiche/3321346.html
最近更新
教材專著