流特征選擇算法設(shè)計(jì)及其在基因表達(dá)數(shù)據(jù)上的應(yīng)用
發(fā)布時(shí)間:2021-06-07 09:47
生物信息學(xué)是近年來一門新型的熱點(diǎn)研究學(xué)科。生物信息學(xué)中的基因表達(dá)數(shù)據(jù)具有高維度、高冗余和類別不平衡等特點(diǎn),對(duì)于機(jī)器學(xué)習(xí)算法來說,這類數(shù)據(jù)集是一項(xiàng)困難的挑戰(zhàn)。在機(jī)器學(xué)習(xí)算法模型訓(xùn)練之前,對(duì)這類數(shù)據(jù)的降維處理是必不可少的過程。使用特征選擇方法進(jìn)行降維處理是一種有效的方法。對(duì)基因表達(dá)數(shù)據(jù)的特征選擇及分類等問題的相關(guān)研究,能夠?yàn)榧膊〉脑\斷和治療提供可靠有效的研究方法。近些年許多學(xué)者對(duì)基因表達(dá)數(shù)據(jù)的特征選擇問題進(jìn)行了研究,并取得了很多有價(jià)值的成果,但是仍沒有達(dá)到理想的分析效果,許多研究者依然致力于研究更好的基因表達(dá)數(shù)據(jù)特征選擇算法。以往的研究均基于傳統(tǒng)的靜態(tài)特征選擇算法,此類算法模型較為復(fù)雜,時(shí)間復(fù)雜度較高,已有學(xué)者將流特征選擇技術(shù)應(yīng)用在基因表達(dá)數(shù)據(jù)的特征選擇問題上并取得較好的效果。針對(duì)基因表達(dá)數(shù)據(jù)的特點(diǎn),本文對(duì)基因表達(dá)數(shù)據(jù)的特征選擇問題進(jìn)行了深入研究。本文結(jié)合在線學(xué)習(xí)的相關(guān)算法,建立強(qiáng)魯棒性、易理解的特征選擇模型,提出能夠降低特征空間壓縮率和提高分類識(shí)別率的流特征選擇算法。本文將提出的基于L2,1范數(shù)的流特征選擇算法在12個(gè)高維基因表達(dá)數(shù)據(jù)上進(jìn)行了特征選擇實(shí)驗(yàn),并與其他四個(gè)典型的流特征選擇算法...
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1?DNA芯片的制備流程??基因表達(dá)數(shù)據(jù)的相關(guān)研究發(fā)展地十分迅速,實(shí)驗(yàn)中獲得了大量的基因表達(dá)數(shù)據(jù)集,??
圖2.1最大分類間隔??圖2.1中,實(shí)心點(diǎn)和空心點(diǎn)分別代表二分類問題中的正類別和負(fù)類別樣本,丑是需??
圖3.1與grafting算法實(shí)驗(yàn)結(jié)果對(duì)比(SVM)??
【參考文獻(xiàn)】:
期刊論文
[1]多類別腫瘤分類的特征基因選擇方法研究[J]. 李小波,彭司華. 復(fù)旦學(xué)報(bào)(自然科學(xué)版). 2014(03)
[2]基于粒子群優(yōu)化和判別熵信息的基因選擇算法[J]. 關(guān)健,韓飛,楊善秀. 計(jì)算機(jī)工程. 2013(11)
[3]基于集成類隨機(jī)森林方法的神經(jīng)膠質(zhì)瘤特征基因選擇的研究[J]. 來海鋒,韓斌,厲力華,陳巖,祝磊,代琦. 生物物理學(xué)報(bào). 2010(09)
[4]基于模糊粗糙集的腫瘤分類特征基因選取[J]. 徐菲菲,苗奪謙,魏萊. 計(jì)算機(jī)科學(xué). 2009(03)
[5]急性白血病的基因表達(dá)譜分析與亞型分類特征的鑒別[J]. 李穎新,劉全金,阮曉鋼. 中國生物醫(yī)學(xué)工程學(xué)報(bào). 2005(02)
[6]基于支持向量機(jī)的微陣列基因表達(dá)數(shù)據(jù)分析方法[J]. 劉青,楊小濤. 小型微型計(jì)算機(jī)系統(tǒng). 2005(03)
本文編號(hào):3216355
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1?DNA芯片的制備流程??基因表達(dá)數(shù)據(jù)的相關(guān)研究發(fā)展地十分迅速,實(shí)驗(yàn)中獲得了大量的基因表達(dá)數(shù)據(jù)集,??
圖2.1最大分類間隔??圖2.1中,實(shí)心點(diǎn)和空心點(diǎn)分別代表二分類問題中的正類別和負(fù)類別樣本,丑是需??
圖3.1與grafting算法實(shí)驗(yàn)結(jié)果對(duì)比(SVM)??
【參考文獻(xiàn)】:
期刊論文
[1]多類別腫瘤分類的特征基因選擇方法研究[J]. 李小波,彭司華. 復(fù)旦學(xué)報(bào)(自然科學(xué)版). 2014(03)
[2]基于粒子群優(yōu)化和判別熵信息的基因選擇算法[J]. 關(guān)健,韓飛,楊善秀. 計(jì)算機(jī)工程. 2013(11)
[3]基于集成類隨機(jī)森林方法的神經(jīng)膠質(zhì)瘤特征基因選擇的研究[J]. 來海鋒,韓斌,厲力華,陳巖,祝磊,代琦. 生物物理學(xué)報(bào). 2010(09)
[4]基于模糊粗糙集的腫瘤分類特征基因選取[J]. 徐菲菲,苗奪謙,魏萊. 計(jì)算機(jī)科學(xué). 2009(03)
[5]急性白血病的基因表達(dá)譜分析與亞型分類特征的鑒別[J]. 李穎新,劉全金,阮曉鋼. 中國生物醫(yī)學(xué)工程學(xué)報(bào). 2005(02)
[6]基于支持向量機(jī)的微陣列基因表達(dá)數(shù)據(jù)分析方法[J]. 劉青,楊小濤. 小型微型計(jì)算機(jī)系統(tǒng). 2005(03)
本文編號(hào):3216355
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3216355.html
最近更新
教材專著