離群點檢測算法的研究及其在電子病歷處方數(shù)據(jù)異常檢測中的應(yīng)用
發(fā)布時間:2023-06-01 19:33
數(shù)據(jù)挖掘是從結(jié)構(gòu)復(fù)雜的大規(guī)模數(shù)據(jù)中挖掘出有規(guī)律性的、突出意義的且不容易被人們所發(fā)現(xiàn)的有價值的可以理解的信息的技術(shù)。而離群點檢測是數(shù)據(jù)挖掘領(lǐng)域中的重要課題之一,隨著現(xiàn)實生活、互聯(lián)網(wǎng)等產(chǎn)生的數(shù)據(jù)越來越多,數(shù)據(jù)結(jié)構(gòu)越來越復(fù)雜,離群點檢測迎來了新的難題。本文通過研究分析目前離群點檢測算法中存在的問題,對離群點檢測算法進行改進,使改進后的離群點檢測更加適用于電子病歷臨床處方異常數(shù)據(jù)的檢測,從而有效地利用醫(yī)院信息化建設(shè)中積累的大量數(shù)據(jù),及時檢測出臨床處方中的異常數(shù)據(jù)。本文的主要研究內(nèi)容如下:(1)對自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法進行改進,在訓(xùn)練過程中的權(quán)值調(diào)整公式中加入獲勝系數(shù)對權(quán)值調(diào)整的影響,加快算法收斂速度,并且減小由輸入順序所帶來的對訓(xùn)練結(jié)果的影響。定義反應(yīng)網(wǎng)絡(luò)收斂程度的參考函數(shù),根據(jù)參考函數(shù)對學(xué)習率函數(shù)進行調(diào)整,并將獲勝系數(shù)引入學(xué)習率函數(shù),使算法能自適應(yīng)的找到當前最適應(yīng)的學(xué)習率,在保證準確率的情況下加快收斂速度。(2)對傳統(tǒng)局部異常因子算法進行改進,將“朋友關(guān)系”模型引入,提出基于反向近鄰密度的局部異常因子算法,重新定義局部異常因子。以解決某些情況下特殊的數(shù)據(jù)分布會導(dǎo)致LOF算法將正常數(shù)據(jù)點誤...
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 課題的研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文的研究內(nèi)容與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
2 相關(guān)技術(shù)概述
2.1 離群點概述
2.1.1 離群點的定義
2.1.2 離群點的種類
2.1.3 離群點檢測算法
2.2 相關(guān)聚類算法概述
2.2.1 聚類算法相關(guān)距離度量與相關(guān)系數(shù)介紹
2.2.2 K-均值聚類算法
2.2.3 DBSCAN密度聚類算法
2.2.4 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法
2.2.5 聚類算法衡量指標
2.3 本章小節(jié)
3 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法研究
3.1 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法的改進
3.1.1 自組織映射神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析
3.1.2 自組織映射神經(jīng)網(wǎng)絡(luò)算法的推導(dǎo)
3.1.3 基于獲勝系數(shù)的自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法
3.2 實驗結(jié)果及分析
3.2.1 實驗數(shù)據(jù)集
3.2.2 實驗結(jié)果分析比較
3.3 本章小結(jié)
4 基于改進的SOM聚類算法的離群點檢測算法
4.1 離群點檢測算法的改進
4.1.1 基于聚簇中心的排序選擇算法降低數(shù)據(jù)量級
4.1.2 “朋友關(guān)系”模型的引入
4.1.3 基于反向近鄰密度的局部異常因子算法
4.2 實驗結(jié)果及分析
4.2.1 實驗數(shù)據(jù)集
4.2.2 實驗結(jié)果分析比較
4.3 本章小結(jié)
5 電子病歷臨床處方異常數(shù)據(jù)檢測
5.1 臨床處方數(shù)據(jù)預(yù)處理
5.1.1 臨床處方數(shù)據(jù)概況
5.1.2 臨床處方數(shù)據(jù)矩陣整理
5.1.3 臨床處方數(shù)據(jù)歸一化處理
5.1.4 臨床處方數(shù)據(jù)降維
5.2 實驗結(jié)果及分析
5.2.1 實驗數(shù)據(jù)集
5.2.2 實驗結(jié)果分析比較
5.3 本章小結(jié)
6 總結(jié)與展望
參考文獻
附錄
A.作者在攻讀學(xué)位期間發(fā)表的論文目錄
C.學(xué)位論文數(shù)據(jù)集
致謝
本文編號:3826911
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 課題的研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文的研究內(nèi)容與創(chuàng)新
1.4 本論文的結(jié)構(gòu)安排
2 相關(guān)技術(shù)概述
2.1 離群點概述
2.1.1 離群點的定義
2.1.2 離群點的種類
2.1.3 離群點檢測算法
2.2 相關(guān)聚類算法概述
2.2.1 聚類算法相關(guān)距離度量與相關(guān)系數(shù)介紹
2.2.2 K-均值聚類算法
2.2.3 DBSCAN密度聚類算法
2.2.4 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法
2.2.5 聚類算法衡量指標
2.3 本章小節(jié)
3 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法研究
3.1 自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法的改進
3.1.1 自組織映射神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分析
3.1.2 自組織映射神經(jīng)網(wǎng)絡(luò)算法的推導(dǎo)
3.1.3 基于獲勝系數(shù)的自組織映射神經(jīng)網(wǎng)絡(luò)聚類算法
3.2 實驗結(jié)果及分析
3.2.1 實驗數(shù)據(jù)集
3.2.2 實驗結(jié)果分析比較
3.3 本章小結(jié)
4 基于改進的SOM聚類算法的離群點檢測算法
4.1 離群點檢測算法的改進
4.1.1 基于聚簇中心的排序選擇算法降低數(shù)據(jù)量級
4.1.2 “朋友關(guān)系”模型的引入
4.1.3 基于反向近鄰密度的局部異常因子算法
4.2 實驗結(jié)果及分析
4.2.1 實驗數(shù)據(jù)集
4.2.2 實驗結(jié)果分析比較
4.3 本章小結(jié)
5 電子病歷臨床處方異常數(shù)據(jù)檢測
5.1 臨床處方數(shù)據(jù)預(yù)處理
5.1.1 臨床處方數(shù)據(jù)概況
5.1.2 臨床處方數(shù)據(jù)矩陣整理
5.1.3 臨床處方數(shù)據(jù)歸一化處理
5.1.4 臨床處方數(shù)據(jù)降維
5.2 實驗結(jié)果及分析
5.2.1 實驗數(shù)據(jù)集
5.2.2 實驗結(jié)果分析比較
5.3 本章小結(jié)
6 總結(jié)與展望
參考文獻
附錄
A.作者在攻讀學(xué)位期間發(fā)表的論文目錄
C.學(xué)位論文數(shù)據(jù)集
致謝
本文編號:3826911
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3826911.html
最近更新
教材專著