腫瘤基因特征選擇方法研究
發(fā)布時(shí)間:2020-12-04 15:21
從腫瘤基因表達(dá)譜中分析和挖掘出樣本的分類特征,對(duì)揭示癌癥產(chǎn)生和病變過程具有重要的生物學(xué)意義;虮磉_(dá)譜數(shù)據(jù)中包含組織細(xì)胞中所有可測基因的表達(dá)水平,但事實(shí)是僅有少量基因才切實(shí)與樣本類別有關(guān)。為此,針對(duì)高維、小樣本的基因表達(dá)譜數(shù)據(jù),探索泛化能力更強(qiáng),更好描述基因表達(dá)譜數(shù)據(jù)的特征選擇模型,從成千上萬個(gè)基因中選出對(duì)樣本分類有效的特征基因,對(duì)腫瘤的分型及臨床醫(yī)療具有重大的探究意義和實(shí)用價(jià)值。針對(duì)當(dāng)前特征基因選擇算法普遍存在訓(xùn)練時(shí)間長和分類精度偏低等不足,本文設(shè)計(jì)了高效的特征基因選擇與分類的相關(guān)算法,選擇較少的特征基因,且保持甚至提高相關(guān)模型的分類精度。主要研究內(nèi)容包括:(1)針對(duì)鄰域粗糙集采用全局鄰域求解近似,存在計(jì)算時(shí)間復(fù)雜度高且很難對(duì)基因表達(dá)譜數(shù)據(jù)精確描述等問題,構(gòu)建了基于主成分分析和改進(jìn)鄰域粗糙集算法的PNRS模型。首先采用主成分分析算法獲得低維的特征基因空間;然后利用改進(jìn)的鄰域粗糙集算法進(jìn)行特征基因選擇,即采用歐氏距離計(jì)算每列屬性鄰域值,選取所有屬性鄰域集合計(jì)算鄰域決策系統(tǒng)的近似;最后利用啟發(fā)式搜索算法選擇特征基因子集。實(shí)驗(yàn)結(jié)果表明,該方法能有效剔除無關(guān)噪聲且獲得較高的正確識(shí)別率。(2)...
【文章來源】:河南師范大學(xué)河南省
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
000年至2011年中國癌癥患病率和致死率的趨勢圖
從DNA微陣列獲取基因表達(dá)數(shù)據(jù)的一般過程
圖 1-2 從 DNA 微陣列獲取基因表達(dá)數(shù)據(jù)的一般過程表達(dá)譜數(shù)據(jù)從數(shù)學(xué)計(jì)算角度來說是 n×m 矩陣。g1,i, g2,i, …, gn,i表示第 ,gj,1, gj,2, …, gj,m表示 1, 2, …, m 個(gè)基因,gi, j表示對(duì)應(yīng)的基因表達(dá)水平樣本的類標(biāo)簽[7]。基因表達(dá)譜數(shù)據(jù)的數(shù)學(xué)表示見圖 1-3。
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA和多鄰域粗糙集的腫瘤特征基因選擇算法[J]. 徐久成,穆輝宇,馮森. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2017(04)
[2]基于對(duì)稱不確定性和SVM遞歸特征消除的信息基因選擇方法[J]. 葉明全,高凌云,伍長榮,萬春圓. 模式識(shí)別與人工智能. 2017(05)
[3]一種基于改進(jìn)的遺傳算法的癌癥特征基因選擇方法[J]. 范方云,孫俊,王夢梅. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(04)
[4]二階矩陣的特征值和特征向量?碱}型例析[J]. 魏佐忠. 數(shù)學(xué)通訊. 2014(Z2)
[5]基于邊界判別投影的數(shù)據(jù)降維[J]. 何進(jìn)榮,丁立新,李照奎,胡慶輝. 軟件學(xué)報(bào). 2014(04)
[6]基于迭代Lasso的腫瘤分類信息基因選擇方法研究[J]. 張靖,胡學(xué)鋼,李培培,張玉紅. 模式識(shí)別與人工智能. 2014(01)
[7]基于核空間距離測度的特征選擇[J]. 蔡哲元,余建國,李先鵬,金震東. 模式識(shí)別與人工智能. 2010(02)
[8]利用協(xié)同分類方法識(shí)別癌癥類型[J]. 盧新國,陳東,杜家宜,周娟. 計(jì)算機(jī)科學(xué). 2010(02)
[9]基于鄰域;痛植诒平臄(shù)值屬性約簡[J]. 胡清華,于達(dá)仁,謝宗霞. 軟件學(xué)報(bào). 2008(03)
[10]生物信息學(xué)中基因芯片的特征選擇技術(shù)綜述[J]. 周昉,何潔月. 計(jì)算機(jī)科學(xué). 2007(12)
碩士論文
[1]基于監(jiān)督學(xué)習(xí)的腫瘤特征基因選擇方法研究[D]. 李濤.河南師范大學(xué) 2016
[2]腫瘤基因表達(dá)譜的數(shù)據(jù)挖掘與識(shí)別分類[D]. 郭志鵬.北京理工大學(xué) 2015
[3]基因表達(dá)數(shù)據(jù)的譜聚類方法研究[D]. 陳方.湖南大學(xué) 2015
[4]基于鄰域互信息的特征基因選擇方法研究[D]. 徐天賀.河南師范大學(xué) 2014
本文編號(hào):2897830
【文章來源】:河南師范大學(xué)河南省
【文章頁數(shù)】:70 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
000年至2011年中國癌癥患病率和致死率的趨勢圖
從DNA微陣列獲取基因表達(dá)數(shù)據(jù)的一般過程
圖 1-2 從 DNA 微陣列獲取基因表達(dá)數(shù)據(jù)的一般過程表達(dá)譜數(shù)據(jù)從數(shù)學(xué)計(jì)算角度來說是 n×m 矩陣。g1,i, g2,i, …, gn,i表示第 ,gj,1, gj,2, …, gj,m表示 1, 2, …, m 個(gè)基因,gi, j表示對(duì)應(yīng)的基因表達(dá)水平樣本的類標(biāo)簽[7]。基因表達(dá)譜數(shù)據(jù)的數(shù)學(xué)表示見圖 1-3。
【參考文獻(xiàn)】:
期刊論文
[1]基于PCA和多鄰域粗糙集的腫瘤特征基因選擇算法[J]. 徐久成,穆輝宇,馮森. 鄭州大學(xué)學(xué)報(bào)(理學(xué)版). 2017(04)
[2]基于對(duì)稱不確定性和SVM遞歸特征消除的信息基因選擇方法[J]. 葉明全,高凌云,伍長榮,萬春圓. 模式識(shí)別與人工智能. 2017(05)
[3]一種基于改進(jìn)的遺傳算法的癌癥特征基因選擇方法[J]. 范方云,孫俊,王夢梅. 江南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(04)
[4]二階矩陣的特征值和特征向量?碱}型例析[J]. 魏佐忠. 數(shù)學(xué)通訊. 2014(Z2)
[5]基于邊界判別投影的數(shù)據(jù)降維[J]. 何進(jìn)榮,丁立新,李照奎,胡慶輝. 軟件學(xué)報(bào). 2014(04)
[6]基于迭代Lasso的腫瘤分類信息基因選擇方法研究[J]. 張靖,胡學(xué)鋼,李培培,張玉紅. 模式識(shí)別與人工智能. 2014(01)
[7]基于核空間距離測度的特征選擇[J]. 蔡哲元,余建國,李先鵬,金震東. 模式識(shí)別與人工智能. 2010(02)
[8]利用協(xié)同分類方法識(shí)別癌癥類型[J]. 盧新國,陳東,杜家宜,周娟. 計(jì)算機(jī)科學(xué). 2010(02)
[9]基于鄰域;痛植诒平臄(shù)值屬性約簡[J]. 胡清華,于達(dá)仁,謝宗霞. 軟件學(xué)報(bào). 2008(03)
[10]生物信息學(xué)中基因芯片的特征選擇技術(shù)綜述[J]. 周昉,何潔月. 計(jì)算機(jī)科學(xué). 2007(12)
碩士論文
[1]基于監(jiān)督學(xué)習(xí)的腫瘤特征基因選擇方法研究[D]. 李濤.河南師范大學(xué) 2016
[2]腫瘤基因表達(dá)譜的數(shù)據(jù)挖掘與識(shí)別分類[D]. 郭志鵬.北京理工大學(xué) 2015
[3]基因表達(dá)數(shù)據(jù)的譜聚類方法研究[D]. 陳方.湖南大學(xué) 2015
[4]基于鄰域互信息的特征基因選擇方法研究[D]. 徐天賀.河南師范大學(xué) 2014
本文編號(hào):2897830
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2897830.html
最近更新
教材專著