基于小樣本高維基因數(shù)據(jù)的頭頸癌局部復(fù)發(fā)預(yù)測
發(fā)布時(shí)間:2021-02-09 23:35
隨著癌癥類型的增多和癌癥患者規(guī)模的增多,針對癌癥的研究不斷深入。同時(shí),由于基因組學(xué)的發(fā)展,基因芯片和基因測序技術(shù)逐漸成熟,運(yùn)用基因表達(dá)譜對癌癥的分類預(yù)測和靶標(biāo)確定的研究也日益增多。頭頸癌目前已成為全球第六大高發(fā)癌癥,它是預(yù)后較差的腫瘤,五年存活率不足50%,具有較強(qiáng)的侵襲性、較高的轉(zhuǎn)移率和較高的術(shù)后復(fù)發(fā)率。目前針對頭頸癌基因?qū)用娴难芯可僦稚?因此針對頭頸癌從基因?qū)用孢M(jìn)行研究對頭頸癌的治療和術(shù)后預(yù)測具有重要意義。由于基因表達(dá)數(shù)據(jù)均具有高維、小樣本的特點(diǎn),而其中大部分都是管家基因,只有極少數(shù)是與癌癥相關(guān)的組織特異性基因,因此在對癌癥發(fā)展機(jī)理進(jìn)行研究和構(gòu)建預(yù)測模型進(jìn)行預(yù)測前需要對基因進(jìn)行篩選。本文針對高維小樣本基因數(shù)據(jù)提出兩種特征選擇方法以完成癌癥特異性基因的選擇。本文的主要研究工作和創(chuàng)新性如下:(1)針對癌癥數(shù)據(jù)普遍存在的樣本分布不均衡現(xiàn)象,在模型訓(xùn)練時(shí)采用分層K折交叉驗(yàn)證,以確保訓(xùn)練集和測試集正負(fù)樣本比例與原始數(shù)據(jù)集保持一致,同時(shí)在分類性能評估上,用平均分類準(zhǔn)確率替代了分類準(zhǔn)確率,其對少數(shù)類樣本和多數(shù)類樣本給予相同的關(guān)注,對少數(shù)類樣本的性能變化更敏感。(2)針對fisher score...
【文章來源】:西安郵電大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
特征選擇過程
西安郵電大學(xué)碩士學(xué)位論文12圖2.2基于特征排序的Filter特征選擇框架基于特征排序的過濾式特征選擇方法,它采用特定的評價(jià)準(zhǔn)則對每個(gè)特征進(jìn)行評價(jià),根據(jù)評價(jià)結(jié)果對特征進(jìn)行降序排列并選取前k個(gè)特征或通過設(shè)置一個(gè)閾值選取大于閾值的特征作為所確定的特征子集,將特征子集作為學(xué)習(xí)器的輸入,根據(jù)學(xué)習(xí)器的分類性能對所選特征子集的好壞進(jìn)行評價(jià);谠摽蚣苓M(jìn)行特征選擇其算法效率高,在短時(shí)間內(nèi)即可篩選出與類別高度相關(guān)的特征。但由于特征間的關(guān)系復(fù)雜,并非簡單的將強(qiáng)相關(guān)特征組合起來就能獲得最好的性能,因?yàn)樵谶@些特征中可能存在大量的冗余,且弱相關(guān)特征經(jīng)過組合也可能發(fā)揮很好的區(qū)分作用。(2)基于搜索策略圖2.3基于搜索策略的Filter特征選擇框架基于搜索策略的Filter特征選擇方法,其每搜索出一個(gè)特征就對已選特征子集進(jìn)行一次評價(jià),通過評價(jià)結(jié)果的好壞決定是否繼續(xù)搜索。最典型的基于搜索策略的Filter特征選擇算法為MRMR算法。(3)基于特征排序+搜索策略圖2.4基于特征排序+搜索策略的Filter特征選擇框架
西安郵電大學(xué)碩士學(xué)位論文12圖2.2基于特征排序的Filter特征選擇框架基于特征排序的過濾式特征選擇方法,它采用特定的評價(jià)準(zhǔn)則對每個(gè)特征進(jìn)行評價(jià),根據(jù)評價(jià)結(jié)果對特征進(jìn)行降序排列并選取前k個(gè)特征或通過設(shè)置一個(gè)閾值選取大于閾值的特征作為所確定的特征子集,將特征子集作為學(xué)習(xí)器的輸入,根據(jù)學(xué)習(xí)器的分類性能對所選特征子集的好壞進(jìn)行評價(jià);谠摽蚣苓M(jìn)行特征選擇其算法效率高,在短時(shí)間內(nèi)即可篩選出與類別高度相關(guān)的特征。但由于特征間的關(guān)系復(fù)雜,并非簡單的將強(qiáng)相關(guān)特征組合起來就能獲得最好的性能,因?yàn)樵谶@些特征中可能存在大量的冗余,且弱相關(guān)特征經(jīng)過組合也可能發(fā)揮很好的區(qū)分作用。(2)基于搜索策略圖2.3基于搜索策略的Filter特征選擇框架基于搜索策略的Filter特征選擇方法,其每搜索出一個(gè)特征就對已選特征子集進(jìn)行一次評價(jià),通過評價(jià)結(jié)果的好壞決定是否繼續(xù)搜索。最典型的基于搜索策略的Filter特征選擇算法為MRMR算法。(3)基于特征排序+搜索策略圖2.4基于特征排序+搜索策略的Filter特征選擇框架
【參考文獻(xiàn)】:
期刊論文
[1]特征選擇方法綜述[J]. 李郅琴,杜建強(qiáng),聶斌,熊旺平,黃燦奕,李歡. 計(jì)算機(jī)工程與應(yīng)用. 2019(24)
[2]相關(guān)性和相似度聯(lián)合的癌癥分類預(yù)測[J]. 張學(xué)扶,曾攀,金敏. 計(jì)算機(jī)科學(xué). 2019(07)
[3]基于BP與GA對非標(biāo)部件結(jié)構(gòu)對比研究[J]. 趙雷,胡淶,張華,陳華,丁寧. 制造技術(shù)與機(jī)床. 2019(07)
[4]基于邏輯回歸的車輛檢測方法研究[J]. 藍(lán)章禮,陳巍,楊揚(yáng). 電子設(shè)計(jì)工程. 2018(20)
[5]利用近似馬爾科夫毯的最大相關(guān)最小冗余特征選擇算法[J]. 張俐,王樅,郭文明. 西安交通大學(xué)學(xué)報(bào). 2018(10)
[6]異常值探測在大數(shù)據(jù)分析中的應(yīng)用研究[J]. 陶盈春,張紅麗,徐健. 情報(bào)科學(xué). 2018(03)
[7]基于條件相關(guān)的特征選擇方法[J]. 劉杰,張平,高萬夫. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2018(03)
[8]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼. 計(jì)算機(jī)應(yīng)用. 2017(09)
[9]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來,朱素霞,何勇軍. 自動化學(xué)報(bào). 2017(05)
[10]基于Fisher準(zhǔn)則和多類相關(guān)矩陣分析的腫瘤基因特征選擇方法[J]. 胡洋,李波. 計(jì)算機(jī)應(yīng)用與軟件. 2016(07)
博士論文
[1]面向蛋白互作預(yù)測的序列數(shù)據(jù)特征識別研究[D]. 桂元苗.中國科學(xué)技術(shù)大學(xué) 2019
[2]多功能二氧化硅載藥體系的構(gòu)建及在抑制腫瘤細(xì)胞活性中的應(yīng)用研究[D]. 王芳.北京科技大學(xué) 2019
[3]文本信息檢索中查詢優(yōu)化與向量化技術(shù)研究[D]. 熊澤宇.國防科技大學(xué) 2018
碩士論文
[1]基于自編碼器的零樣本圖像識別算法研究[D]. 孫廣成.南京郵電大學(xué) 2019
[2]大數(shù)據(jù)一體機(jī)軟件中間件設(shè)計(jì)與研究[D]. 李航.南京郵電大學(xué) 2019
[3]基于MIC的高維數(shù)據(jù)特征選擇及應(yīng)用研究[D]. 郭長勝.山西大學(xué) 2019
[4]基于多目標(biāo)進(jìn)化優(yōu)化的癌癥數(shù)據(jù)特征選擇算法研究[D]. 李森.安徽大學(xué) 2019
[5]基于多目標(biāo)的動態(tài)車間調(diào)度系統(tǒng)的研究與實(shí)現(xiàn)[D]. 成榮榮.寧夏大學(xué) 2019
[6]基于粒子群-極限學(xué)習(xí)機(jī)的高爐鐵水硅含量預(yù)測研究[D]. 黃陳林.安徽工業(yè)大學(xué) 2019
[7]基于深度神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識別研究[D]. 顧孫炎.南京郵電大學(xué) 2018
[8]基于基因表達(dá)譜和miRNA表達(dá)譜的癌癥分類集成預(yù)測方法[D]. 師哲.湖南大學(xué) 2018
[9]微陣列基因表達(dá)數(shù)據(jù)混合特征算法研究[D]. 董文娟.沈陽工業(yè)大學(xué) 2017
[10]基于Fisher Score及遺傳算法的特征選擇方法研究[D]. 周密.暨南大學(xué) 2016
本文編號:3026413
【文章來源】:西安郵電大學(xué)陜西省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
特征選擇過程
西安郵電大學(xué)碩士學(xué)位論文12圖2.2基于特征排序的Filter特征選擇框架基于特征排序的過濾式特征選擇方法,它采用特定的評價(jià)準(zhǔn)則對每個(gè)特征進(jìn)行評價(jià),根據(jù)評價(jià)結(jié)果對特征進(jìn)行降序排列并選取前k個(gè)特征或通過設(shè)置一個(gè)閾值選取大于閾值的特征作為所確定的特征子集,將特征子集作為學(xué)習(xí)器的輸入,根據(jù)學(xué)習(xí)器的分類性能對所選特征子集的好壞進(jìn)行評價(jià);谠摽蚣苓M(jìn)行特征選擇其算法效率高,在短時(shí)間內(nèi)即可篩選出與類別高度相關(guān)的特征。但由于特征間的關(guān)系復(fù)雜,并非簡單的將強(qiáng)相關(guān)特征組合起來就能獲得最好的性能,因?yàn)樵谶@些特征中可能存在大量的冗余,且弱相關(guān)特征經(jīng)過組合也可能發(fā)揮很好的區(qū)分作用。(2)基于搜索策略圖2.3基于搜索策略的Filter特征選擇框架基于搜索策略的Filter特征選擇方法,其每搜索出一個(gè)特征就對已選特征子集進(jìn)行一次評價(jià),通過評價(jià)結(jié)果的好壞決定是否繼續(xù)搜索。最典型的基于搜索策略的Filter特征選擇算法為MRMR算法。(3)基于特征排序+搜索策略圖2.4基于特征排序+搜索策略的Filter特征選擇框架
西安郵電大學(xué)碩士學(xué)位論文12圖2.2基于特征排序的Filter特征選擇框架基于特征排序的過濾式特征選擇方法,它采用特定的評價(jià)準(zhǔn)則對每個(gè)特征進(jìn)行評價(jià),根據(jù)評價(jià)結(jié)果對特征進(jìn)行降序排列并選取前k個(gè)特征或通過設(shè)置一個(gè)閾值選取大于閾值的特征作為所確定的特征子集,將特征子集作為學(xué)習(xí)器的輸入,根據(jù)學(xué)習(xí)器的分類性能對所選特征子集的好壞進(jìn)行評價(jià);谠摽蚣苓M(jìn)行特征選擇其算法效率高,在短時(shí)間內(nèi)即可篩選出與類別高度相關(guān)的特征。但由于特征間的關(guān)系復(fù)雜,并非簡單的將強(qiáng)相關(guān)特征組合起來就能獲得最好的性能,因?yàn)樵谶@些特征中可能存在大量的冗余,且弱相關(guān)特征經(jīng)過組合也可能發(fā)揮很好的區(qū)分作用。(2)基于搜索策略圖2.3基于搜索策略的Filter特征選擇框架基于搜索策略的Filter特征選擇方法,其每搜索出一個(gè)特征就對已選特征子集進(jìn)行一次評價(jià),通過評價(jià)結(jié)果的好壞決定是否繼續(xù)搜索。最典型的基于搜索策略的Filter特征選擇算法為MRMR算法。(3)基于特征排序+搜索策略圖2.4基于特征排序+搜索策略的Filter特征選擇框架
【參考文獻(xiàn)】:
期刊論文
[1]特征選擇方法綜述[J]. 李郅琴,杜建強(qiáng),聶斌,熊旺平,黃燦奕,李歡. 計(jì)算機(jī)工程與應(yīng)用. 2019(24)
[2]相關(guān)性和相似度聯(lián)合的癌癥分類預(yù)測[J]. 張學(xué)扶,曾攀,金敏. 計(jì)算機(jī)科學(xué). 2019(07)
[3]基于BP與GA對非標(biāo)部件結(jié)構(gòu)對比研究[J]. 趙雷,胡淶,張華,陳華,丁寧. 制造技術(shù)與機(jī)床. 2019(07)
[4]基于邏輯回歸的車輛檢測方法研究[J]. 藍(lán)章禮,陳巍,楊揚(yáng). 電子設(shè)計(jì)工程. 2018(20)
[5]利用近似馬爾科夫毯的最大相關(guān)最小冗余特征選擇算法[J]. 張俐,王樅,郭文明. 西安交通大學(xué)學(xué)報(bào). 2018(10)
[6]異常值探測在大數(shù)據(jù)分析中的應(yīng)用研究[J]. 陶盈春,張紅麗,徐健. 情報(bào)科學(xué). 2018(03)
[7]基于條件相關(guān)的特征選擇方法[J]. 劉杰,張平,高萬夫. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2018(03)
[8]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼. 計(jì)算機(jī)應(yīng)用. 2017(09)
[9]基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J]. 孫廣路,宋智超,劉金來,朱素霞,何勇軍. 自動化學(xué)報(bào). 2017(05)
[10]基于Fisher準(zhǔn)則和多類相關(guān)矩陣分析的腫瘤基因特征選擇方法[J]. 胡洋,李波. 計(jì)算機(jī)應(yīng)用與軟件. 2016(07)
博士論文
[1]面向蛋白互作預(yù)測的序列數(shù)據(jù)特征識別研究[D]. 桂元苗.中國科學(xué)技術(shù)大學(xué) 2019
[2]多功能二氧化硅載藥體系的構(gòu)建及在抑制腫瘤細(xì)胞活性中的應(yīng)用研究[D]. 王芳.北京科技大學(xué) 2019
[3]文本信息檢索中查詢優(yōu)化與向量化技術(shù)研究[D]. 熊澤宇.國防科技大學(xué) 2018
碩士論文
[1]基于自編碼器的零樣本圖像識別算法研究[D]. 孫廣成.南京郵電大學(xué) 2019
[2]大數(shù)據(jù)一體機(jī)軟件中間件設(shè)計(jì)與研究[D]. 李航.南京郵電大學(xué) 2019
[3]基于MIC的高維數(shù)據(jù)特征選擇及應(yīng)用研究[D]. 郭長勝.山西大學(xué) 2019
[4]基于多目標(biāo)進(jìn)化優(yōu)化的癌癥數(shù)據(jù)特征選擇算法研究[D]. 李森.安徽大學(xué) 2019
[5]基于多目標(biāo)的動態(tài)車間調(diào)度系統(tǒng)的研究與實(shí)現(xiàn)[D]. 成榮榮.寧夏大學(xué) 2019
[6]基于粒子群-極限學(xué)習(xí)機(jī)的高爐鐵水硅含量預(yù)測研究[D]. 黃陳林.安徽工業(yè)大學(xué) 2019
[7]基于深度神經(jīng)網(wǎng)絡(luò)的中文命名實(shí)體識別研究[D]. 顧孫炎.南京郵電大學(xué) 2018
[8]基于基因表達(dá)譜和miRNA表達(dá)譜的癌癥分類集成預(yù)測方法[D]. 師哲.湖南大學(xué) 2018
[9]微陣列基因表達(dá)數(shù)據(jù)混合特征算法研究[D]. 董文娟.沈陽工業(yè)大學(xué) 2017
[10]基于Fisher Score及遺傳算法的特征選擇方法研究[D]. 周密.暨南大學(xué) 2016
本文編號:3026413
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3026413.html
最近更新
教材專著