基于微陣列質(zhì)譜數(shù)據(jù)的卵巢癌預(yù)測研究
發(fā)布時(shí)間:2021-08-12 21:02
癌癥是人類生命和健康的主要威脅之一,是世界上最致命的疾病。近年來,通過微陣列質(zhì)譜數(shù)據(jù)進(jìn)行癌癥預(yù)測,實(shí)現(xiàn)癌癥早期發(fā)現(xiàn),提高癌癥病患的生存率,成為人們關(guān)注的焦點(diǎn)。本文首先對癌癥預(yù)測的背景意義以及癌癥預(yù)測的研究現(xiàn)狀和方法進(jìn)行闡明和綜述,并對基于機(jī)器學(xué)習(xí)的預(yù)測方法進(jìn)行分析和歸納。在此基礎(chǔ)上,進(jìn)行基于微陣列數(shù)據(jù)的卵巢癌預(yù)測研究,提出基于主成分分析、人工蜂群優(yōu)化和支持向量回歸機(jī)的PCA-ABC-SVR卵巢癌預(yù)測模型。對于模型的訓(xùn)練數(shù)據(jù),針對微陣列數(shù)據(jù)集的特點(diǎn),采用PCA主成分分析法對數(shù)據(jù)進(jìn)行降維處理,并采用ABC人工蜂群優(yōu)化算法進(jìn)行支持向量回歸機(jī)SVR的參數(shù)選取,實(shí)現(xiàn)PCA-ABC-SVR卵巢癌預(yù)測模型的建立。最后,在給定的實(shí)驗(yàn)軟硬件平臺(tái)環(huán)境下,進(jìn)行k值選取、模型對比和優(yōu)化對比三個(gè)仿真實(shí)驗(yàn),通過訓(xùn)練數(shù)據(jù)集實(shí)現(xiàn)所提模型的學(xué)習(xí)和訓(xùn)練。通過實(shí)驗(yàn)結(jié)果的分析,驗(yàn)證了本文所提出的PCA-ABC-SVR模型在卵巢癌預(yù)測方面的可行性和優(yōu)越性。
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)框圖
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-11-式如下:)()()(lhRRemp(2-9)公式中,lhlhlh4log)12(log)(,)(lh叫做置信風(fēng)險(xiǎn);l成為數(shù)據(jù)樣本數(shù);參數(shù)h叫做VC維。目前,當(dāng)進(jìn)行結(jié)構(gòu)風(fēng)險(xiǎn)最小化求解時(shí),兩種可行方案經(jīng)常被應(yīng)用[49]。真實(shí)風(fēng)險(xiǎn)由置信風(fēng)險(xiǎn)以及經(jīng)驗(yàn)風(fēng)險(xiǎn))(empR組成,如公式(2-9)所示。三者同VC維h和訓(xùn)練樣本數(shù)l密切相關(guān)。如圖2-2所示。圖2-2結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理圖Fig.2-2Principlediagramofstructuralriskminimization2.3支持向量回歸機(jī)算法自上世紀(jì)九十年代中期以來,作為一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,支持向量機(jī)研究逐步開展起來。最大間隔法被SVM采用,同時(shí)廣義最大間隔法被采用,之后廣義最優(yōu)分類超平面在高維數(shù)據(jù)空間中通過非線性變換被求取,即凸二次規(guī)劃問題,最終獲得最優(yōu)解,該方案針對于解決非線性可分問題。核函數(shù)的映射將輸入向量轉(zhuǎn)化到高維空間,中間的節(jié)點(diǎn)對應(yīng)一個(gè)支持向量,中間節(jié)點(diǎn)的線性組合被輸出,由此可見,SVM理論的結(jié)構(gòu)與一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似。如圖2-3所示。真實(shí)學(xué)習(xí)風(fēng)險(xiǎn)置信區(qū)間經(jīng)驗(yàn)風(fēng)險(xiǎn)VC維風(fēng)險(xiǎn)
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-12-圖2-3支持向量機(jī)結(jié)構(gòu)圖Fig.2-3SVMstructure回歸和分類兩類問題在于輸出變量的取值范圍上存在差異,其中回歸問題的輸出變量的范圍屬于連續(xù)的實(shí)數(shù),而分類問題的輸出變量為有限個(gè)類別,SVM可以解決回歸和分類這兩類問題。在實(shí)際問題的方案中,根據(jù)使用不同的損失函數(shù),SVR可以分為以下幾種基本類型,即最小二乘SVR、SVRv和SVR等。這就是支持向量回歸是SVM在回歸估計(jì)問題上的拓展型應(yīng)用。在本文中,支持向量回歸機(jī)被選用以解決癌癥預(yù)測的建模過程。下式為不敏感損失函數(shù):iiiiiiiiiyxfyxfyxfxfyxL)(,)()(,0))(,,((2-10)SVR存在線性回歸和非線性回歸兩類情況,這與分類問題是類似的。上式中,對應(yīng)的實(shí)際值和目標(biāo)輸出值分別表示為y和f(x),輸入值表示為x,不敏感系數(shù)表示為。對于線性SVR,采用函數(shù)(2-11)式:bxwxfT)((2-11)其中偏置向量表示為b,權(quán)向量表示為w,目標(biāo)函數(shù)表示為f(x)。ya1y1a2y2。。。。。。a3y3K(x1,x)K(x2,x)。。。。。。K(x3,x)x1x2。。。。。。xi
【參考文獻(xiàn)】:
期刊論文
[1]皮膚鱗狀細(xì)胞癌轉(zhuǎn)錄組學(xué)微陣列分析方法的研究策略及進(jìn)展[J]. 韓向春,鄭力強(qiáng),馮志芳,馬靜. 解放軍醫(yī)學(xué)雜志. 2019(06)
[2]求解柔性作業(yè)車間調(diào)度問題的多策略融合Pareto人工蜂群算法[J]. 趙博選,高建民,付穎斌,趙姣. 系統(tǒng)工程理論與實(shí)踐. 2019(05)
[3]基因治療及細(xì)胞治療發(fā)展態(tài)勢分析[J]. 遲培娟,陳芳,Cynthia Liu,Qiongqiong Zhou,Yi Deng,Yingzhu Li,韓濤,余敏,楊艷萍,王學(xué)昭. 中國生物工程雜志. 2019(05)
[4]基于功能納米材料的液相生物芯片檢測技術(shù)[J]. 武衛(wèi)杰,冷遠(yuǎn)逵,沈夢飛,李萬萬. 化學(xué)進(jìn)展. 2019(Z1)
[5]基因表達(dá)數(shù)據(jù)中的局部模式挖掘研究綜述[J]. 姜濤,李戰(zhàn)懷. 計(jì)算機(jī)研究與發(fā)展. 2018(11)
[6]基于雙層結(jié)構(gòu)的加速K-NN分類方法[J]. 王曉,趙麗. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(04)
[7]Hybrid artificial bee colony algorithm with variable neighborhood search and memory mechanism[J]. FAN Chengli,FU Qiang,LONG Guangzheng,XING Qinghua. Journal of Systems Engineering and Electronics. 2018(02)
[8]支持向量機(jī)模型與應(yīng)用綜述[J]. 劉方園,王水花,張煜東. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(04)
[9]基于改進(jìn)鄰域搜索策略的人工蜂群算法[J]. 魏鋒濤,岳明娟,鄭建明. 控制與決策. 2019(05)
[10]量子粒子群優(yōu)化的人工蜂群算法[J]. 杜康宇,毛力,毛羽,楊弘,肖煒. 傳感器與微系統(tǒng). 2018(03)
博士論文
[1]支持向量機(jī)算法參數(shù)選擇及其在電站鍋爐系統(tǒng)中的應(yīng)用研究[D]. 黃景濤.浙江大學(xué) 2005
碩士論文
[1]基于自組織映射網(wǎng)絡(luò)的多目標(biāo)粒子群優(yōu)化算法[D]. 郭倩倩.鄭州大學(xué) 2018
[2]基于聚類的基因差異共表達(dá)分析[D]. 張萍.黑龍江大學(xué) 2017
[3]支持向量機(jī)在電力系統(tǒng)短期負(fù)荷預(yù)測中的應(yīng)用及改進(jìn)[D]. 李云飛.西南交通大學(xué) 2006
本文編號(hào):3339070
【文章來源】:哈爾濱理工大學(xué)黑龍江省
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)框圖
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-11-式如下:)()()(lhRRemp(2-9)公式中,lhlhlh4log)12(log)(,)(lh叫做置信風(fēng)險(xiǎn);l成為數(shù)據(jù)樣本數(shù);參數(shù)h叫做VC維。目前,當(dāng)進(jìn)行結(jié)構(gòu)風(fēng)險(xiǎn)最小化求解時(shí),兩種可行方案經(jīng)常被應(yīng)用[49]。真實(shí)風(fēng)險(xiǎn)由置信風(fēng)險(xiǎn)以及經(jīng)驗(yàn)風(fēng)險(xiǎn))(empR組成,如公式(2-9)所示。三者同VC維h和訓(xùn)練樣本數(shù)l密切相關(guān)。如圖2-2所示。圖2-2結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理圖Fig.2-2Principlediagramofstructuralriskminimization2.3支持向量回歸機(jī)算法自上世紀(jì)九十年代中期以來,作為一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,支持向量機(jī)研究逐步開展起來。最大間隔法被SVM采用,同時(shí)廣義最大間隔法被采用,之后廣義最優(yōu)分類超平面在高維數(shù)據(jù)空間中通過非線性變換被求取,即凸二次規(guī)劃問題,最終獲得最優(yōu)解,該方案針對于解決非線性可分問題。核函數(shù)的映射將輸入向量轉(zhuǎn)化到高維空間,中間的節(jié)點(diǎn)對應(yīng)一個(gè)支持向量,中間節(jié)點(diǎn)的線性組合被輸出,由此可見,SVM理論的結(jié)構(gòu)與一個(gè)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相似。如圖2-3所示。真實(shí)學(xué)習(xí)風(fēng)險(xiǎn)置信區(qū)間經(jīng)驗(yàn)風(fēng)險(xiǎn)VC維風(fēng)險(xiǎn)
哈爾濱理工大學(xué)工學(xué)碩士學(xué)位論文-12-圖2-3支持向量機(jī)結(jié)構(gòu)圖Fig.2-3SVMstructure回歸和分類兩類問題在于輸出變量的取值范圍上存在差異,其中回歸問題的輸出變量的范圍屬于連續(xù)的實(shí)數(shù),而分類問題的輸出變量為有限個(gè)類別,SVM可以解決回歸和分類這兩類問題。在實(shí)際問題的方案中,根據(jù)使用不同的損失函數(shù),SVR可以分為以下幾種基本類型,即最小二乘SVR、SVRv和SVR等。這就是支持向量回歸是SVM在回歸估計(jì)問題上的拓展型應(yīng)用。在本文中,支持向量回歸機(jī)被選用以解決癌癥預(yù)測的建模過程。下式為不敏感損失函數(shù):iiiiiiiiiyxfyxfyxfxfyxL)(,)()(,0))(,,((2-10)SVR存在線性回歸和非線性回歸兩類情況,這與分類問題是類似的。上式中,對應(yīng)的實(shí)際值和目標(biāo)輸出值分別表示為y和f(x),輸入值表示為x,不敏感系數(shù)表示為。對于線性SVR,采用函數(shù)(2-11)式:bxwxfT)((2-11)其中偏置向量表示為b,權(quán)向量表示為w,目標(biāo)函數(shù)表示為f(x)。ya1y1a2y2。。。。。。a3y3K(x1,x)K(x2,x)。。。。。。K(x3,x)x1x2。。。。。。xi
【參考文獻(xiàn)】:
期刊論文
[1]皮膚鱗狀細(xì)胞癌轉(zhuǎn)錄組學(xué)微陣列分析方法的研究策略及進(jìn)展[J]. 韓向春,鄭力強(qiáng),馮志芳,馬靜. 解放軍醫(yī)學(xué)雜志. 2019(06)
[2]求解柔性作業(yè)車間調(diào)度問題的多策略融合Pareto人工蜂群算法[J]. 趙博選,高建民,付穎斌,趙姣. 系統(tǒng)工程理論與實(shí)踐. 2019(05)
[3]基因治療及細(xì)胞治療發(fā)展態(tài)勢分析[J]. 遲培娟,陳芳,Cynthia Liu,Qiongqiong Zhou,Yi Deng,Yingzhu Li,韓濤,余敏,楊艷萍,王學(xué)昭. 中國生物工程雜志. 2019(05)
[4]基于功能納米材料的液相生物芯片檢測技術(shù)[J]. 武衛(wèi)杰,冷遠(yuǎn)逵,沈夢飛,李萬萬. 化學(xué)進(jìn)展. 2019(Z1)
[5]基因表達(dá)數(shù)據(jù)中的局部模式挖掘研究綜述[J]. 姜濤,李戰(zhàn)懷. 計(jì)算機(jī)研究與發(fā)展. 2018(11)
[6]基于雙層結(jié)構(gòu)的加速K-NN分類方法[J]. 王曉,趙麗. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(04)
[7]Hybrid artificial bee colony algorithm with variable neighborhood search and memory mechanism[J]. FAN Chengli,FU Qiang,LONG Guangzheng,XING Qinghua. Journal of Systems Engineering and Electronics. 2018(02)
[8]支持向量機(jī)模型與應(yīng)用綜述[J]. 劉方園,王水花,張煜東. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(04)
[9]基于改進(jìn)鄰域搜索策略的人工蜂群算法[J]. 魏鋒濤,岳明娟,鄭建明. 控制與決策. 2019(05)
[10]量子粒子群優(yōu)化的人工蜂群算法[J]. 杜康宇,毛力,毛羽,楊弘,肖煒. 傳感器與微系統(tǒng). 2018(03)
博士論文
[1]支持向量機(jī)算法參數(shù)選擇及其在電站鍋爐系統(tǒng)中的應(yīng)用研究[D]. 黃景濤.浙江大學(xué) 2005
碩士論文
[1]基于自組織映射網(wǎng)絡(luò)的多目標(biāo)粒子群優(yōu)化算法[D]. 郭倩倩.鄭州大學(xué) 2018
[2]基于聚類的基因差異共表達(dá)分析[D]. 張萍.黑龍江大學(xué) 2017
[3]支持向量機(jī)在電力系統(tǒng)短期負(fù)荷預(yù)測中的應(yīng)用及改進(jìn)[D]. 李云飛.西南交通大學(xué) 2006
本文編號(hào):3339070
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3339070.html
最近更新
教材專著