天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

面向癌癥基因數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘技術(shù)研究

發(fā)布時間:2021-07-21 22:06
  科學(xué)技術(shù)地進步推動各行各業(yè)快速改革,特別是生物學(xué)方面,全基因測序的成功,使得對癌癥基因表達數(shù)據(jù)的獲取代價急劇下降,為系統(tǒng)的研究癌癥基因組提供了廣闊的平臺。癌癥基因表達數(shù)據(jù)的特性是維度高、樣本量少、信噪比大,如何在這樣的數(shù)據(jù)集中挖掘出有價值的信息,是研究的熱點問題。目前,國內(nèi)外研究學(xué)者們對癌癥基因表達數(shù)據(jù)的研究取得了一些成果,但由于技術(shù)路線不夠成熟,對基因表達數(shù)據(jù)研究不夠透徹,這些成果不能在臨床醫(yī)學(xué)上開放使用,所以對癌癥基因表達數(shù)據(jù)的研究仍然需要大規(guī)模的驗證。在眾多的數(shù)據(jù)挖掘方法中,關(guān)聯(lián)規(guī)則的挖掘是最具實際效益的。Apriori關(guān)聯(lián)規(guī)則挖掘算法是數(shù)據(jù)挖掘中經(jīng)典算法之一,該算法的缺陷也非常明顯,針對高維大數(shù)據(jù),在生成頻繁項集的時候,Apriori算法需要一遍遍反復(fù)掃描數(shù)據(jù)庫,生成的候選項集不僅占用存儲空間,而且有很多無關(guān)項。這樣不僅降低了算法的準確性,且耗費時間。針對這一缺點,本文提出了一種新的基于PmR-NRS混合特征選擇對原數(shù)據(jù)集進行降維處理,主要是通過PmR-NRS方法將數(shù)據(jù)集中特征與類別之間具有最大相關(guān)性而特征相互之間具有最小冗余性的特征提取出來,保留最優(yōu)化的特征子集進行關(guān)聯(lián)規(guī)則的... 

【文章來源】:蘭州交通大學(xué)甘肅省

【文章頁數(shù)】:65 頁

【學(xué)位級別】:碩士

【部分圖文】:

面向癌癥基因數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘技術(shù)研究


高斯分布圖示

性能比較圖,特征選擇,性能比較,算法


圖 3.4 特征選擇算法在 SVM 上的性能比較合表 3.5 和圖 3.4 所示,通過不同特征選擇方法的比較結(jié)果可以看出,采類器驗證四種基因數(shù)據(jù)集的精確度,其中效果最差的是 ReliefF 算法,.77%;而 mRMR 和 NRS 特征選擇算法的效果差不多,平均精確度分別為4%;除去白血病數(shù)據(jù)集,本文提出的 PmR-NRS 混合特征選擇算法的分到 93.84%。由此可見通過本文提出的算法處理過的基因數(shù)據(jù)集,分類精算法要高一些,從而也證明了本文提出的 PmR-NRS 混合特征選擇算法有效性。 ASM 和它的標準偏差來測量四種不同特征選擇算法穩(wěn)定性能(見表 、mRMR 和 NRS 算法中,穩(wěn)定性對于四組基因數(shù)據(jù)集來說效果都是非值大約都在 0.84~0.94 范圍內(nèi)。而且這三種特征選擇方法的標準偏差也癌數(shù)據(jù)集上,它的偏差略大一些。在本文提出的新方法 PmR-NRS 與其之下穩(wěn)定性就差了一些,其平均 ASM 值為 0.69。因為 PmR-NRS 方法法,比其它單一的算法更為復(fù)雜,結(jié)合圖 3.4 我們可以得出,在分類精面,本文提出的新方法可行性還是比較好的。

向量圖,向量


圖 4.1 獨立向量圖示向量1a 和2a ,接下來將向量 投影到向量常大,因此 和 是正交的,它們是獨量 投影到 上。如圖所示: 在1a 上的相似的,是相互依賴的。a1-a*a1a2a*圖 4.2 依賴向量圖示

【參考文獻】:
期刊論文
[1]基于Spark的腫瘤基因混合特征選擇方法[J]. 汪麗麗,鄧麗,余玥,費敏銳.  計算機工程. 2018(11)
[2]影像學(xué)引導(dǎo)肺癌冷凍消融治療專家共識2018版[J]. 魏穎恬,肖越勇.  中國介入影像與治療學(xué). 2018(05)
[3]基于NCBI基因表達綜合數(shù)據(jù)庫篩查胃癌關(guān)鍵基因和信號通路的分析[J]. 張鵬,羅琴,汪婷婷,袁向亮,沈立松.  檢驗醫(yī)學(xué). 2018(03)
[4]基于FP-GROWTH算法的關(guān)聯(lián)規(guī)則挖掘算法研究[J]. 陳寅.  無線互聯(lián)科技. 2017(19)
[5]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼.  計算機應(yīng)用. 2017(09)
[6]基于MapReduce計算模型的并行關(guān)聯(lián)規(guī)則挖掘算法研究綜述[J]. 肖文,胡娟,周曉峰.  計算機應(yīng)用研究. 2018(01)
[7]一種結(jié)合隨機森林和鄰域粗糙集的特征選擇方法[J]. 吳辰文,王偉,李長生,梁靖涵,閆光輝.  小型微型計算機系統(tǒng). 2017(06)
[8]自動確定聚類個數(shù)的模糊聚類算法[J]. 陳海鵬,申鉉京,龍建武,呂穎達.  電子學(xué)報. 2017(03)
[9]基于FP-Tree的多層關(guān)聯(lián)規(guī)則挖掘算法的設(shè)計和實現(xiàn)[J]. 袁冬菊.  科技展望. 2015(31)
[10]基于ReliefF+mRMR特征降維算法的多特征遙感圖像分類[J]. 王露,龔光紅.  中國體視學(xué)與圖像分析. 2014(03)

博士論文
[1]基于基因表達數(shù)據(jù)的腫瘤分類算法研究[D]. 陸慧娟.中國礦業(yè)大學(xué) 2012
[2]基于關(guān)聯(lián)規(guī)則的基因芯片數(shù)據(jù)挖掘與應(yīng)用[D]. 彭斌.第三軍醫(yī)大學(xué) 2008
[3]生物子序列頻數(shù)分布與腫瘤亞型分類模型研究[D]. 王樹林.國防科學(xué)技術(shù)大學(xué) 2007
[4]關(guān)聯(lián)規(guī)則挖掘及其在基因表達數(shù)據(jù)中的應(yīng)用[D]. 繆裕青.中國科學(xué)技術(shù)大學(xué) 2007



本文編號:3295850

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3295850.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e5ce6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com