基于LDA的煤礦事故調(diào)查報(bào)告主題發(fā)現(xiàn)研究
發(fā)布時(shí)間:2024-02-20 21:25
近年來,我國重特大煤礦安全事故頻發(fā),其造成死傷人數(shù)多,經(jīng)濟(jì)損失大,影響極其惡劣,引起廣大社會群眾關(guān)注。事故發(fā)生后,由相關(guān)政府部門牽頭,成立了事故調(diào)查小組,聘請有關(guān)專家一同對事故進(jìn)行調(diào)查,出具權(quán)威、專業(yè)的事故調(diào)查報(bào)告。報(bào)告中包含有大量關(guān)于事故的隱患信息和整改措施建議信息。本文以2012年到目前為止,各省市煤礦安全監(jiān)督局公布的44份重大煤礦事故調(diào)查報(bào)告為數(shù)據(jù)來源,對其進(jìn)行挖掘分析。首先簡介了狄利克雷模型,并說明其與傳統(tǒng)文本挖掘方法區(qū)別,接著對挖掘過程進(jìn)行闡述:數(shù)據(jù)清洗、分詞、過濾停止詞、建立“文檔—詞語”矩陣。并對事故報(bào)告的基本信息通過提取高頻詞匯和逆文檔概率的關(guān)鍵詞進(jìn)行描述,進(jìn)行可視化展示;對事故報(bào)告的隱藏信息,采用狄利克雷主題模型進(jìn)行主題挖掘,發(fā)現(xiàn)事故調(diào)查報(bào)告中大致包含有隱患主題、處罰主題以及整改措施主題三個(gè)主題內(nèi)容。經(jīng)過機(jī)器學(xué)習(xí)后得到的隱患主題,通過主題強(qiáng)度比較,最終分析得到關(guān)于作業(yè)人員與安全管理方面的隱患,在事故中占據(jù)更大比例,需要作業(yè)人員、管理人員和監(jiān)管人員特別注意,在排除隱患時(shí),應(yīng)該優(yōu)先解決作業(yè)人員的不安全行為和完善企業(yè)自身管理;對于處罰主題,在調(diào)查報(bào)告中,對相關(guān)責(zé)任人員的處罰...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 事故調(diào)查報(bào)告的研究現(xiàn)狀
1.2.2 主題模型研究現(xiàn)狀
1.2.3 研究評述
1.3 研究內(nèi)容與方法
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 技術(shù)路線
第2章 相關(guān)概念與理論基礎(chǔ)
2.1 事故調(diào)查與事故調(diào)查報(bào)告
2.1.1 事故調(diào)查
2.1.2 事故調(diào)查報(bào)告
2.2 LDA主題模型
2.2.1 模型簡介
2.2.2 狄利克雷分布
2.2.3 模型算法
2.3 TF-IDF與特征詞
第3章 事故調(diào)查報(bào)告的數(shù)據(jù)預(yù)處理
3.1 處理平臺
3.2 數(shù)據(jù)分詞處理
3.2.1 利用基礎(chǔ)詞典分詞
3.2.2 擴(kuò)充個(gè)人用戶詞典
3.2.3 過濾停止詞
3.3 數(shù)據(jù)語料庫處理
3.3.1 分詞文件匯集為語料庫
3.3.2 轉(zhuǎn)化DTM矩陣
第4章 事故調(diào)查報(bào)告的LDA模型求解
4.1 詞頻及TF-IDF分析
4.1.1 詞頻提取關(guān)鍵詞
4.1.2 TF-IDF提取特征詞
4.2 確定參數(shù)
4.2.1 確定超參數(shù)α和β
4.2.2 確定主題個(gè)數(shù)K
4.3 模型求解
第5章 事故調(diào)查報(bào)告的LDA主題分析
5.1 隱患主題分析
5.1.1 確定隱患主題個(gè)數(shù)
5.1.2 結(jié)果解釋
5.1.3 使用LDAvis進(jìn)行可視化展示
5.2 處理意見主題分析
5.3 防范措施主題分析
總結(jié)與展望
致謝
參考文獻(xiàn)
附錄
本文編號:3904542
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 事故調(diào)查報(bào)告的研究現(xiàn)狀
1.2.2 主題模型研究現(xiàn)狀
1.2.3 研究評述
1.3 研究內(nèi)容與方法
1.3.1 研究內(nèi)容
1.3.2 研究方法
1.3.3 技術(shù)路線
第2章 相關(guān)概念與理論基礎(chǔ)
2.1 事故調(diào)查與事故調(diào)查報(bào)告
2.1.1 事故調(diào)查
2.1.2 事故調(diào)查報(bào)告
2.2 LDA主題模型
2.2.1 模型簡介
2.2.2 狄利克雷分布
2.2.3 模型算法
2.3 TF-IDF與特征詞
第3章 事故調(diào)查報(bào)告的數(shù)據(jù)預(yù)處理
3.1 處理平臺
3.2 數(shù)據(jù)分詞處理
3.2.1 利用基礎(chǔ)詞典分詞
3.2.2 擴(kuò)充個(gè)人用戶詞典
3.2.3 過濾停止詞
3.3 數(shù)據(jù)語料庫處理
3.3.1 分詞文件匯集為語料庫
3.3.2 轉(zhuǎn)化DTM矩陣
第4章 事故調(diào)查報(bào)告的LDA模型求解
4.1 詞頻及TF-IDF分析
4.1.1 詞頻提取關(guān)鍵詞
4.1.2 TF-IDF提取特征詞
4.2 確定參數(shù)
4.2.1 確定超參數(shù)α和β
4.2.2 確定主題個(gè)數(shù)K
4.3 模型求解
第5章 事故調(diào)查報(bào)告的LDA主題分析
5.1 隱患主題分析
5.1.1 確定隱患主題個(gè)數(shù)
5.1.2 結(jié)果解釋
5.1.3 使用LDAvis進(jìn)行可視化展示
5.2 處理意見主題分析
5.3 防范措施主題分析
總結(jié)與展望
致謝
參考文獻(xiàn)
附錄
本文編號:3904542
本文鏈接:http://sikaile.net/kejilunwen/kuangye/3904542.html
最近更新
教材專著