基于正規(guī)化回歸模型的醫(yī)療診斷數(shù)據(jù)挖掘應(yīng)用研究
發(fā)布時間:2021-08-24 14:16
數(shù)據(jù)挖掘方法是一種有效的信息抽取和發(fā)現(xiàn)方法,這種方法是把數(shù)據(jù)從醫(yī)院的數(shù)據(jù)庫系統(tǒng)中提取出來,然后對提取出的數(shù)據(jù)進(jìn)行分析評估,找到數(shù)據(jù)中隱藏的價值,為醫(yī)療診斷提供科學(xué)依據(jù)。對于數(shù)據(jù)挖掘算法中的隨機森林算法(Random Forest,RF)具有可以處理非線性、高維度數(shù)據(jù)集的優(yōu)點,因此在很多的領(lǐng)域中得到了廣泛的應(yīng)用。然而,RF算法存在著兩個問題:第一,對該算法提出的改進(jìn)方法都沒有得到理論證明從而不能用于實際應(yīng)用中;第二,對RF算法效率提升的改進(jìn)仍然有很多不足之處。根據(jù)上述存在問題本文分別做出相應(yīng)分析,提出了一種基于最優(yōu)抽樣倍數(shù)和不放回抽樣的隨機森林算法(Optimal Sampling Times and No Release Random Forest Algorithm,OSNR-RF),對提出的優(yōu)化算法的合理性進(jìn)行實驗驗證。論文主要內(nèi)容如下:首先,介紹數(shù)據(jù)挖掘的基本理論知識,說明數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘工作中必不可少的一步,并且詳細(xì)介紹數(shù)據(jù)預(yù)處理方法中的特征選擇算法。同時介紹正規(guī)化回歸模型以及該模型中的嶺回歸(Ridge Regression,RR)模型,正規(guī)化回歸模型具有預(yù)測準(zhǔn)確率高、模...
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
特征子集選擇流程圖
(0) 0i i ,表明ix有著非常顯著的作用,然而定的值為負(fù)而且,根據(jù)古典回歸的原理認(rèn)為ix對 y 的分析的原理認(rèn)為ix對 y 的顯著因素為“負(fù)”影響。我們可以看出1 ( k)和2 ( k)都表現(xiàn)出很不穩(wěn)定的現(xiàn)此種情況主要是因為1x和2x相關(guān)性很大,也就是說從變量選擇的角度看,我們需要對變量二選一,這號不符合常理的情況。從實際情況出發(fā),1 和2 R 分析給出了相應(yīng)的解釋。,我們需要把所有的回歸系數(shù)都反映在一張圖上才到嶺回歸分析中去,要是呈現(xiàn)的嶺跡圖很不穩(wěn)定,估計能否在嶺回歸估計中表現(xiàn)良好。圖 3.1(e)顯此時的最小二乘估計是合理的并且是可行的。如果以通過選擇最優(yōu)的 k 值來進(jìn)行確定。
值的選擇用的嶺參數(shù)的嶺跡分析方法估計的回歸系數(shù)回歸系數(shù)的符號不合理的的嶺回歸系數(shù)具有平方和沒有發(fā)生太大的改變明如圖 3.2 可知都趨向于穩(wěn)定值蘭州交通大學(xué)工程碩士學(xué)位論文參數(shù) k 值選擇方法[38]。的嶺跡分析方法,選取k值的一般原則是:的回歸系數(shù)基本穩(wěn)定;符號不合理的,在用最小二乘估計時其嶺估回歸系數(shù)具有現(xiàn)實意義;平方和沒有發(fā)生太大的改變;可知,k值的選擇取0k處,由圖中我們可以都趨向于穩(wěn)定值,此時取0k k。其嶺估由圖中我們可以
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機森林的PM2.5實時預(yù)報系統(tǒng)[J]. 侯俊雄,李琦,朱亞杰,馮逍,毛曦. 測繪科學(xué). 2017(01)
[2]主成分回歸和嶺回歸在新疆農(nóng)業(yè)經(jīng)濟(jì)的應(yīng)用[J]. 開璇,張莉莉. 遼寧農(nóng)業(yè)職業(yè)技術(shù)學(xué)院學(xué)報. 2017(01)
[3]基于小波變換和隨機森林的森林類型分類研究[J]. 呂杰,汪康寧,李崇貴,馬婷. 西北林學(xué)院學(xué)報. 2016(06)
[4]基于隨機森林分類模型的DDoS攻擊檢測方法[J]. 于鵬程,戚湧,李千目. 計算機應(yīng)用研究. 2017(10)
[5]基于隨機森林深度特征選擇的人體姿態(tài)估計[J]. 朱玨鈺,曹亞微,周書仁,李峰. 計算機工程與應(yīng)用. 2017(02)
[6]大數(shù)據(jù)相關(guān)分析綜述[J]. 梁吉業(yè),馮晨嬌,宋鵬. 計算機學(xué)報. 2016(01)
[7]L1正則化機器學(xué)習(xí)問題求解分析[J]. 孔康,汪群山,梁萬路. 計算機工程. 2011(17)
[8]基于out-of-bag樣本的隨機森林算法的超參數(shù)估計[J]. 李毓,張春霞. 系統(tǒng)工程學(xué)報. 2011(04)
[9]特征選擇算法綜述[J]. 計智偉,胡珉,尹建新. 電子設(shè)計工程. 2011(09)
[10]隨機森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計與信息論壇. 2011(03)
碩士論文
[1]基于甲狀腺疾病的臨床數(shù)據(jù)挖掘與分析研究[D]. 許騰.東華大學(xué) 2016
[2]隨機森林在文本分類中的應(yīng)用[D]. 賀捷.華南理工大學(xué) 2015
[3]基于排序熵的有序決策樹高效算法研究[D]. 陳建凱.河北大學(xué) 2014
本文編號:3360145
【文章來源】:蘭州交通大學(xué)甘肅省
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【部分圖文】:
特征子集選擇流程圖
(0) 0i i ,表明ix有著非常顯著的作用,然而定的值為負(fù)而且,根據(jù)古典回歸的原理認(rèn)為ix對 y 的分析的原理認(rèn)為ix對 y 的顯著因素為“負(fù)”影響。我們可以看出1 ( k)和2 ( k)都表現(xiàn)出很不穩(wěn)定的現(xiàn)此種情況主要是因為1x和2x相關(guān)性很大,也就是說從變量選擇的角度看,我們需要對變量二選一,這號不符合常理的情況。從實際情況出發(fā),1 和2 R 分析給出了相應(yīng)的解釋。,我們需要把所有的回歸系數(shù)都反映在一張圖上才到嶺回歸分析中去,要是呈現(xiàn)的嶺跡圖很不穩(wěn)定,估計能否在嶺回歸估計中表現(xiàn)良好。圖 3.1(e)顯此時的最小二乘估計是合理的并且是可行的。如果以通過選擇最優(yōu)的 k 值來進(jìn)行確定。
值的選擇用的嶺參數(shù)的嶺跡分析方法估計的回歸系數(shù)回歸系數(shù)的符號不合理的的嶺回歸系數(shù)具有平方和沒有發(fā)生太大的改變明如圖 3.2 可知都趨向于穩(wěn)定值蘭州交通大學(xué)工程碩士學(xué)位論文參數(shù) k 值選擇方法[38]。的嶺跡分析方法,選取k值的一般原則是:的回歸系數(shù)基本穩(wěn)定;符號不合理的,在用最小二乘估計時其嶺估回歸系數(shù)具有現(xiàn)實意義;平方和沒有發(fā)生太大的改變;可知,k值的選擇取0k處,由圖中我們可以都趨向于穩(wěn)定值,此時取0k k。其嶺估由圖中我們可以
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機森林的PM2.5實時預(yù)報系統(tǒng)[J]. 侯俊雄,李琦,朱亞杰,馮逍,毛曦. 測繪科學(xué). 2017(01)
[2]主成分回歸和嶺回歸在新疆農(nóng)業(yè)經(jīng)濟(jì)的應(yīng)用[J]. 開璇,張莉莉. 遼寧農(nóng)業(yè)職業(yè)技術(shù)學(xué)院學(xué)報. 2017(01)
[3]基于小波變換和隨機森林的森林類型分類研究[J]. 呂杰,汪康寧,李崇貴,馬婷. 西北林學(xué)院學(xué)報. 2016(06)
[4]基于隨機森林分類模型的DDoS攻擊檢測方法[J]. 于鵬程,戚湧,李千目. 計算機應(yīng)用研究. 2017(10)
[5]基于隨機森林深度特征選擇的人體姿態(tài)估計[J]. 朱玨鈺,曹亞微,周書仁,李峰. 計算機工程與應(yīng)用. 2017(02)
[6]大數(shù)據(jù)相關(guān)分析綜述[J]. 梁吉業(yè),馮晨嬌,宋鵬. 計算機學(xué)報. 2016(01)
[7]L1正則化機器學(xué)習(xí)問題求解分析[J]. 孔康,汪群山,梁萬路. 計算機工程. 2011(17)
[8]基于out-of-bag樣本的隨機森林算法的超參數(shù)估計[J]. 李毓,張春霞. 系統(tǒng)工程學(xué)報. 2011(04)
[9]特征選擇算法綜述[J]. 計智偉,胡珉,尹建新. 電子設(shè)計工程. 2011(09)
[10]隨機森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計與信息論壇. 2011(03)
碩士論文
[1]基于甲狀腺疾病的臨床數(shù)據(jù)挖掘與分析研究[D]. 許騰.東華大學(xué) 2016
[2]隨機森林在文本分類中的應(yīng)用[D]. 賀捷.華南理工大學(xué) 2015
[3]基于排序熵的有序決策樹高效算法研究[D]. 陳建凱.河北大學(xué) 2014
本文編號:3360145
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3360145.html
最近更新
教材專著