基于數(shù)據(jù)挖掘的某冷軋廠事故隱患預(yù)測(cè)預(yù)警研究
發(fā)布時(shí)間:2021-09-05 11:16
隨著我國(guó)經(jīng)濟(jì)的發(fā)展,企業(yè)的安全問(wèn)題越來(lái)越受到重視,而企業(yè)的安全管理水平也決定著企業(yè)能否健康高效的運(yùn)營(yíng)。鋼鐵行業(yè)作為我國(guó)的支柱產(chǎn)業(yè),在經(jīng)濟(jì)發(fā)展中起著至關(guān)重要的作用,同樣軋鋼企業(yè)在冷軋過(guò)程中工藝復(fù)雜,生產(chǎn)過(guò)程中有著很多危險(xiǎn)因素和不確定性,安全生產(chǎn)事故也時(shí)有發(fā)生。而傳統(tǒng)的安全管理方法是“問(wèn)題出發(fā)型”管理模式,往往只能進(jìn)行定性的分析,缺少簡(jiǎn)單直觀的定量分析手段,這樣在企業(yè)安全管理中就顯得很被動(dòng)。但是隨著信息技術(shù)的不斷發(fā)展,以及近幾年數(shù)據(jù)挖掘技術(shù)在各行各業(yè)的不斷普及與應(yīng)用,也為隱患排查治理和生產(chǎn)安全事故預(yù)防工作提供了新的技術(shù)手段和方法。本文以某冷軋企業(yè)為例,針對(duì)該廠2017年9月-2018年12月的事故隱患數(shù)據(jù)進(jìn)行分析,研究建立該廠安全生產(chǎn)事故隱患預(yù)測(cè)預(yù)警模型,指導(dǎo)企業(yè)能夠具體有效的進(jìn)安全管理與隱患排查治理工作的開(kāi)展,對(duì)提升企業(yè)的安全管理水平有著重要意義。首先利用R語(yǔ)言對(duì)企業(yè)的事故隱患數(shù)據(jù)進(jìn)行文本挖掘分析,在中文分詞后得到隱患詞匯對(duì)應(yīng)詞頻,將詞頻統(tǒng)計(jì)后繪制出可視化的詞云圖,之后為了得到隱患詞匯在每個(gè)月的重要度,運(yùn)用詞頻-逆文檔頻(TF-IDF)將每個(gè)月詞頻轉(zhuǎn)換成權(quán)重。最后運(yùn)用灰色預(yù)測(cè)理論,建立了...
【文章來(lái)源】:首都經(jīng)濟(jì)貿(mào)易大學(xué)北京市
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隱患信息歷史數(shù)據(jù)
第3章文本挖掘163.2.2分詞工具R是一個(gè)用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境,由數(shù)學(xué)運(yùn)算工具、統(tǒng)計(jì)分析工具以及制圖工具構(gòu)成[39]。作為一個(gè)用于統(tǒng)計(jì)的軟件,囊括了多種常用的數(shù)據(jù)挖掘方法,其各類(lèi)模型都已經(jīng)封裝完畢,加載包以及各類(lèi)操作命令調(diào)用快捷方便,還有各類(lèi)功能的安裝包可供使用,同時(shí)在大量數(shù)據(jù)需要處理時(shí),優(yōu)化過(guò)的運(yùn)行速度可以得到保證,因此R語(yǔ)言完全可以勝任各類(lèi)一般性的統(tǒng)計(jì)分析工作,并保證高效快捷的完成。R還有一個(gè)很大的優(yōu)勢(shì),是一款免費(fèi)的開(kāi)源軟件,如果需要,可以隨時(shí)在網(wǎng)站上下載使用。其支持在UNIX、Linux、Windows和MacOS等多種平臺(tái)運(yùn)行,在我們調(diào)用相應(yīng)的函數(shù)進(jìn)行計(jì)算時(shí),還能夠根據(jù)具體的情況來(lái)修改源代碼,從而滿(mǎn)足用戶(hù)分支、循環(huán)、自定義等具體要求。因?yàn)镽是開(kāi)源的,所以其擴(kuò)展包和插件也極其豐富,給數(shù)據(jù)的處理帶來(lái)了多樣化,可以對(duì)數(shù)據(jù)進(jìn)行交互式分析,通過(guò)信息平臺(tái)還能實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)動(dòng)態(tài)顯示,幫助用戶(hù)更加快捷直觀的了解所分析的數(shù)據(jù)?偟膩(lái)說(shuō),R語(yǔ)言兼容性強(qiáng)、功能強(qiáng)大、操作方便,是一款優(yōu)秀的數(shù)據(jù)分析和制圖軟件。而Rstudio是編輯、運(yùn)行R語(yǔ)言的最為理想的工具之一,通常我們都在Rstudio上來(lái)處理數(shù)據(jù),具體如圖3.3所示。圖3.3Rstudio界面在R語(yǔ)言環(huán)境下,我們選用jiebaR作為分詞包[40],jicbaR(“結(jié)巴”)是一款高效的R語(yǔ)言分詞包,是通過(guò)CRAN安裝,非常簡(jiǎn)便。共有7種分詞引擎,分別是混合模型、最大概率法、隱式馬爾科夫模型、索引模型、標(biāo)記模型、Simhash模型和關(guān)鍵詞模型,其
首都經(jīng)濟(jì)貿(mào)易大學(xué)碩士學(xué)位論文17中混合模型是結(jié)合了隱式馬爾科夫模型與最大概率法,是分詞效果最好的模型。其通過(guò)函數(shù)worker()初始化分詞引擎,使用segment()進(jìn)行分詞。3.2.3自定義詞典由于本文采用基于詞典的分詞方法,所以必須有對(duì)應(yīng)的詞典作為基矗詞典對(duì)分詞結(jié)果的好壞起著決定性作用。雖然jiebaR有默認(rèn)的標(biāo)配詞典,但是由于本文處理的數(shù)據(jù)是某冷軋廠的安全隱患數(shù)據(jù),不同行業(yè)文字類(lèi)型也不相同,如果不使用與之匹配的相關(guān)詞典,這就會(huì)很大概率造成分詞的不準(zhǔn)確性。所以建立相關(guān)的隱患詞典是必須要做的任務(wù),也是此次中文分詞的基石。從文本數(shù)據(jù)中篩選出各類(lèi)冷軋廠相關(guān)的隱患詞匯,將其統(tǒng)計(jì)匯總儲(chǔ)存到.txt文件中形成冷軋廠事故隱患詞典,共5211個(gè)詞。如圖3.4所示。圖3.4自定義事故隱患詞典3.2.4中文分詞相關(guān)理論中文分詞是將中文文本進(jìn)行分詞研究,其原理是根據(jù)一定的規(guī)律使連續(xù)的中文字序列切分成有意義的中文詞序列。在英文文本中,每個(gè)單詞之間都會(huì)有空格分隔,因此不存在分詞,而中文文本則是由連續(xù)的詞句構(gòu)成,各個(gè)詞語(yǔ)之間沒(méi)有明顯的分隔符,所以這就需要我們來(lái)通過(guò)中文分詞的方法來(lái)達(dá)到研究的目的。中文分詞的流程圖如圖3.5所示。
【參考文獻(xiàn)】:
期刊論文
[1]船舶艙室的火災(zāi)實(shí)時(shí)安全預(yù)測(cè)[J]. 夏璐璐,李彥. 電子測(cè)量技術(shù). 2018(15)
[2]基于微博文本數(shù)據(jù)分析的社會(huì)群體情感可視計(jì)算方法研究[J]. 劉翠娟,劉箴,柴艷杰,方昊,劉良平. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[3]基于灰色GM(1,1)模型的跨境電子商務(wù)發(fā)展前景預(yù)測(cè)分析[J]. 資道根. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2015(01)
[4]GM(1,1)模型的幾種基本形式及其適用范圍研究[J]. 劉思峰,曾波,劉解放,謝乃明. 系統(tǒng)工程與電子技術(shù). 2014(03)
[5]生產(chǎn)作業(yè)場(chǎng)所事故隱患的內(nèi)在屬性及安全監(jiān)管對(duì)策[J]. 保龍,韓海濤,蔡惠萍,陳艷偉. 產(chǎn)業(yè)與科技論壇. 2013(11)
[6]基于潛在語(yǔ)義分析的微博主題挖掘模型研究[J]. 唐曉波,王洪艷. 圖書(shū)情報(bào)工作. 2012(24)
[7]我國(guó)煤礦安全評(píng)價(jià)現(xiàn)狀分析[J]. 隋國(guó)民. 煤炭工程. 2012(02)
[8]基于改進(jìn)灰色模型的能源消費(fèi)預(yù)測(cè)研究[J]. 穆海林,王文超,寧亞?wèn)|,李剛. 大連理工大學(xué)學(xué)報(bào). 2011(04)
[9]基于灰色GM(1,1)模型的上海城鎮(zhèn)養(yǎng)老保險(xiǎn)人口分布預(yù)測(cè)[J]. 王宇熹,汪泓,肖峻. 系統(tǒng)工程理論與實(shí)踐. 2010(12)
[10]預(yù)警理論方法及其應(yīng)用研究[J]. 潘潔珠,朱強(qiáng),郭玉堂. 合肥師范學(xué)院學(xué)報(bào). 2010(03)
博士論文
[1]灰色建模技術(shù)及其在道路交通事故管理中的應(yīng)用研究[D]. 錢(qián)吳永.南京航空航天大學(xué) 2012
[2]灰色預(yù)測(cè)技術(shù)及其應(yīng)用研究[D]. 崔立志.南京航空航天大學(xué) 2010
碩士論文
[1]基于向量空間模型的文本分類(lèi)及R語(yǔ)言實(shí)現(xiàn)[D]. 姜博聞.山東師范大學(xué) 2018
[2]基于隱患報(bào)告的事故預(yù)測(cè)模型及預(yù)警方法研究[D]. 李彤.中國(guó)地質(zhì)大學(xué)(北京) 2017
[3]基于R語(yǔ)言的金融大數(shù)據(jù)審計(jì)應(yīng)用研究[D]. 武茗馨.南京審計(jì)大學(xué) 2017
[4]基于數(shù)值分析理論的GM(1,1)模型優(yōu)化研究及應(yīng)用[D]. 張麗玲.哈爾濱工程大學(xué) 2017
[5]基于Web數(shù)據(jù)挖掘的鮮花市場(chǎng)研究與應(yīng)用[D]. 鄧遠(yuǎn)飛.昆明理工大學(xué) 2016
[6]光伏企業(yè)安全生產(chǎn)預(yù)警系統(tǒng)建設(shè)與應(yīng)用研究[D]. 劉君敏.江蘇大學(xué) 2016
[7]基于PSO-SVM模型的建筑施工項(xiàng)目安全預(yù)警方法研究[D]. 汪馬成.上海工程技術(shù)大學(xué) 2016
[8]灰色預(yù)測(cè)模型的研究及其應(yīng)用[D]. 宋玲.內(nèi)蒙古農(nóng)業(yè)大學(xué) 2015
[9]中文文本分類(lèi)中的特征選擇和權(quán)重計(jì)算方法研究[D]. 宋惟然.北京工業(yè)大學(xué) 2013
[10]事故致因理論在化工企業(yè)安全評(píng)價(jià)中的應(yīng)用研究[D]. 程華瑞.太原理工大學(xué) 2013
本文編號(hào):3385247
【文章來(lái)源】:首都經(jīng)濟(jì)貿(mào)易大學(xué)北京市
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隱患信息歷史數(shù)據(jù)
第3章文本挖掘163.2.2分詞工具R是一個(gè)用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境,由數(shù)學(xué)運(yùn)算工具、統(tǒng)計(jì)分析工具以及制圖工具構(gòu)成[39]。作為一個(gè)用于統(tǒng)計(jì)的軟件,囊括了多種常用的數(shù)據(jù)挖掘方法,其各類(lèi)模型都已經(jīng)封裝完畢,加載包以及各類(lèi)操作命令調(diào)用快捷方便,還有各類(lèi)功能的安裝包可供使用,同時(shí)在大量數(shù)據(jù)需要處理時(shí),優(yōu)化過(guò)的運(yùn)行速度可以得到保證,因此R語(yǔ)言完全可以勝任各類(lèi)一般性的統(tǒng)計(jì)分析工作,并保證高效快捷的完成。R還有一個(gè)很大的優(yōu)勢(shì),是一款免費(fèi)的開(kāi)源軟件,如果需要,可以隨時(shí)在網(wǎng)站上下載使用。其支持在UNIX、Linux、Windows和MacOS等多種平臺(tái)運(yùn)行,在我們調(diào)用相應(yīng)的函數(shù)進(jìn)行計(jì)算時(shí),還能夠根據(jù)具體的情況來(lái)修改源代碼,從而滿(mǎn)足用戶(hù)分支、循環(huán)、自定義等具體要求。因?yàn)镽是開(kāi)源的,所以其擴(kuò)展包和插件也極其豐富,給數(shù)據(jù)的處理帶來(lái)了多樣化,可以對(duì)數(shù)據(jù)進(jìn)行交互式分析,通過(guò)信息平臺(tái)還能實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)動(dòng)態(tài)顯示,幫助用戶(hù)更加快捷直觀的了解所分析的數(shù)據(jù)?偟膩(lái)說(shuō),R語(yǔ)言兼容性強(qiáng)、功能強(qiáng)大、操作方便,是一款優(yōu)秀的數(shù)據(jù)分析和制圖軟件。而Rstudio是編輯、運(yùn)行R語(yǔ)言的最為理想的工具之一,通常我們都在Rstudio上來(lái)處理數(shù)據(jù),具體如圖3.3所示。圖3.3Rstudio界面在R語(yǔ)言環(huán)境下,我們選用jiebaR作為分詞包[40],jicbaR(“結(jié)巴”)是一款高效的R語(yǔ)言分詞包,是通過(guò)CRAN安裝,非常簡(jiǎn)便。共有7種分詞引擎,分別是混合模型、最大概率法、隱式馬爾科夫模型、索引模型、標(biāo)記模型、Simhash模型和關(guān)鍵詞模型,其
首都經(jīng)濟(jì)貿(mào)易大學(xué)碩士學(xué)位論文17中混合模型是結(jié)合了隱式馬爾科夫模型與最大概率法,是分詞效果最好的模型。其通過(guò)函數(shù)worker()初始化分詞引擎,使用segment()進(jìn)行分詞。3.2.3自定義詞典由于本文采用基于詞典的分詞方法,所以必須有對(duì)應(yīng)的詞典作為基矗詞典對(duì)分詞結(jié)果的好壞起著決定性作用。雖然jiebaR有默認(rèn)的標(biāo)配詞典,但是由于本文處理的數(shù)據(jù)是某冷軋廠的安全隱患數(shù)據(jù),不同行業(yè)文字類(lèi)型也不相同,如果不使用與之匹配的相關(guān)詞典,這就會(huì)很大概率造成分詞的不準(zhǔn)確性。所以建立相關(guān)的隱患詞典是必須要做的任務(wù),也是此次中文分詞的基石。從文本數(shù)據(jù)中篩選出各類(lèi)冷軋廠相關(guān)的隱患詞匯,將其統(tǒng)計(jì)匯總儲(chǔ)存到.txt文件中形成冷軋廠事故隱患詞典,共5211個(gè)詞。如圖3.4所示。圖3.4自定義事故隱患詞典3.2.4中文分詞相關(guān)理論中文分詞是將中文文本進(jìn)行分詞研究,其原理是根據(jù)一定的規(guī)律使連續(xù)的中文字序列切分成有意義的中文詞序列。在英文文本中,每個(gè)單詞之間都會(huì)有空格分隔,因此不存在分詞,而中文文本則是由連續(xù)的詞句構(gòu)成,各個(gè)詞語(yǔ)之間沒(méi)有明顯的分隔符,所以這就需要我們來(lái)通過(guò)中文分詞的方法來(lái)達(dá)到研究的目的。中文分詞的流程圖如圖3.5所示。
【參考文獻(xiàn)】:
期刊論文
[1]船舶艙室的火災(zāi)實(shí)時(shí)安全預(yù)測(cè)[J]. 夏璐璐,李彥. 電子測(cè)量技術(shù). 2018(15)
[2]基于微博文本數(shù)據(jù)分析的社會(huì)群體情感可視計(jì)算方法研究[J]. 劉翠娟,劉箴,柴艷杰,方昊,劉良平. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(01)
[3]基于灰色GM(1,1)模型的跨境電子商務(wù)發(fā)展前景預(yù)測(cè)分析[J]. 資道根. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2015(01)
[4]GM(1,1)模型的幾種基本形式及其適用范圍研究[J]. 劉思峰,曾波,劉解放,謝乃明. 系統(tǒng)工程與電子技術(shù). 2014(03)
[5]生產(chǎn)作業(yè)場(chǎng)所事故隱患的內(nèi)在屬性及安全監(jiān)管對(duì)策[J]. 保龍,韓海濤,蔡惠萍,陳艷偉. 產(chǎn)業(yè)與科技論壇. 2013(11)
[6]基于潛在語(yǔ)義分析的微博主題挖掘模型研究[J]. 唐曉波,王洪艷. 圖書(shū)情報(bào)工作. 2012(24)
[7]我國(guó)煤礦安全評(píng)價(jià)現(xiàn)狀分析[J]. 隋國(guó)民. 煤炭工程. 2012(02)
[8]基于改進(jìn)灰色模型的能源消費(fèi)預(yù)測(cè)研究[J]. 穆海林,王文超,寧亞?wèn)|,李剛. 大連理工大學(xué)學(xué)報(bào). 2011(04)
[9]基于灰色GM(1,1)模型的上海城鎮(zhèn)養(yǎng)老保險(xiǎn)人口分布預(yù)測(cè)[J]. 王宇熹,汪泓,肖峻. 系統(tǒng)工程理論與實(shí)踐. 2010(12)
[10]預(yù)警理論方法及其應(yīng)用研究[J]. 潘潔珠,朱強(qiáng),郭玉堂. 合肥師范學(xué)院學(xué)報(bào). 2010(03)
博士論文
[1]灰色建模技術(shù)及其在道路交通事故管理中的應(yīng)用研究[D]. 錢(qián)吳永.南京航空航天大學(xué) 2012
[2]灰色預(yù)測(cè)技術(shù)及其應(yīng)用研究[D]. 崔立志.南京航空航天大學(xué) 2010
碩士論文
[1]基于向量空間模型的文本分類(lèi)及R語(yǔ)言實(shí)現(xiàn)[D]. 姜博聞.山東師范大學(xué) 2018
[2]基于隱患報(bào)告的事故預(yù)測(cè)模型及預(yù)警方法研究[D]. 李彤.中國(guó)地質(zhì)大學(xué)(北京) 2017
[3]基于R語(yǔ)言的金融大數(shù)據(jù)審計(jì)應(yīng)用研究[D]. 武茗馨.南京審計(jì)大學(xué) 2017
[4]基于數(shù)值分析理論的GM(1,1)模型優(yōu)化研究及應(yīng)用[D]. 張麗玲.哈爾濱工程大學(xué) 2017
[5]基于Web數(shù)據(jù)挖掘的鮮花市場(chǎng)研究與應(yīng)用[D]. 鄧遠(yuǎn)飛.昆明理工大學(xué) 2016
[6]光伏企業(yè)安全生產(chǎn)預(yù)警系統(tǒng)建設(shè)與應(yīng)用研究[D]. 劉君敏.江蘇大學(xué) 2016
[7]基于PSO-SVM模型的建筑施工項(xiàng)目安全預(yù)警方法研究[D]. 汪馬成.上海工程技術(shù)大學(xué) 2016
[8]灰色預(yù)測(cè)模型的研究及其應(yīng)用[D]. 宋玲.內(nèi)蒙古農(nóng)業(yè)大學(xué) 2015
[9]中文文本分類(lèi)中的特征選擇和權(quán)重計(jì)算方法研究[D]. 宋惟然.北京工業(yè)大學(xué) 2013
[10]事故致因理論在化工企業(yè)安全評(píng)價(jià)中的應(yīng)用研究[D]. 程華瑞.太原理工大學(xué) 2013
本文編號(hào):3385247
本文鏈接:http://sikaile.net/kejilunwen/jiagonggongyi/3385247.html
最近更新
教材專(zhuān)著