天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

稀疏低秩表示模型的研究及在癌癥測序數(shù)據(jù)中的應用

發(fā)布時間:2021-09-06 06:41
  二十一世紀以來,癌癥已經(jīng)成為危害人類生命安全的重大疾病之一,是解決全人類健康問題的首要研究對象。在測序技術的快速發(fā)展下,癌癥測序數(shù)據(jù)源源不斷地產(chǎn)生,為癌癥研究提供了豐富的數(shù)據(jù)資源,促進了生物信息學研究領域的發(fā)展。然而,癌癥測序數(shù)據(jù)的高維小樣本特點,以及高冗余和多噪聲的數(shù)據(jù)特性,對數(shù)據(jù)挖掘提出了挑戰(zhàn)。準確、可靠的識別癌癥類型,選擇關鍵致病基因,對疾病的診斷和相關治療方案的制定具有重要意義。稀疏低秩表示模型是針對高維數(shù)據(jù)進行子空間分割的有效模型,在多個領域得到成功應用,同時為癌癥測序數(shù)據(jù)研究提供有效手段。本文針對癌癥測序數(shù)據(jù)特點,以稀疏低秩表示模型為研究基礎,對癌癥樣本聚類、特征選擇問題進行研究和探索,提出了四種新方法,主要研究內(nèi)容如下:(1)稀疏對稱約束的圖正則低秩表示方法:該方法對稀疏低秩表示模型施加圖正則約束和對稱約束,圖正則約束實現(xiàn)了數(shù)據(jù)局部幾何結構的保留,對稱約束減弱了數(shù)據(jù)噪聲對數(shù)據(jù)結構的影響;趯ΨQ約束下的稀疏低秩表示矩陣主方向的角信息進一步構建相似度矩陣,通過譜聚類方法實現(xiàn)多類癌癥樣本聚類。(2)非負稀疏低秩表示優(yōu)化模型:該優(yōu)化模型通過非負約束保證低秩表示矩陣的非負性,將低... 

【文章來源】:曲阜師范大學山東省

【文章頁數(shù)】:75 頁

【學位級別】:碩士

【部分圖文】:

稀疏低秩表示模型的研究及在癌癥測序數(shù)據(jù)中的應用


本文主要章節(jié)

數(shù)據(jù),方法,樣本,矩陣


第3章基于稀疏對稱約束的圖正則低秩表示方法研究11圖3.1理想數(shù)據(jù)下的低秩表示方法當觀測數(shù)據(jù)被噪聲或異常值嚴重破壞時,調(diào)整后的LRR方法要解決下面的凸優(yōu)化問題:mins.t.l+*ZZ+EX=XZE,(3-1)其中l(wèi)表示針對數(shù)據(jù)損害情況進行特征化的正則化策略,例如:l2,1范數(shù)可以處理損壞的樣本數(shù)據(jù)和異常值;l1范數(shù)可以處理數(shù)據(jù)中的隨機錯誤,lF范數(shù)可以處理數(shù)據(jù)的高斯噪聲[46]。上述LRR方法獲得的最低秩表示矩陣Z,可以通過聚類方法對塊對角結構分割實現(xiàn)數(shù)據(jù)聚類。但是,最低秩表示矩陣并不是嚴格對稱。因為噪聲影響導致元素ijz不等于元素jiz,所以第i個樣本相對第j個樣本的相似性權重不等于第j個樣本相對第i個樣本的相似性權重,如圖3.2所示。值得考慮的一個問題是這兩個元素中哪一個更適合用來反映兩個樣本之間的相似性權重。通常情況下,定義一個相似度矩陣()2TW=Z+Ζ,通過譜聚類方法來獲得最終的子空間劃分結果。圖3.2真實數(shù)據(jù)下的低秩表示方法為了使低秩矩陣在數(shù)據(jù)噪聲下可以準確描述樣本空間關系,同時也是為了避免低秩矩陣自我對稱化處理,把對稱約束引入到低秩表示中,對稱約束可以嚴格保證數(shù)據(jù)對相似度的一致性,使得子空間中高度相關的數(shù)據(jù)有一致的表示,如圖3.3所示。在對稱約束下的低秩表示如下式(3-2)所示[47]:mins.t.Tl+*ZZ+EX=XZE,Z=Z。(3-2)

數(shù)據(jù),方法,樣本,矩陣


第3章基于稀疏對稱約束的圖正則低秩表示方法研究11圖3.1理想數(shù)據(jù)下的低秩表示方法當觀測數(shù)據(jù)被噪聲或異常值嚴重破壞時,調(diào)整后的LRR方法要解決下面的凸優(yōu)化問題:mins.t.l+*ZZ+EX=XZE,(3-1)其中l(wèi)表示針對數(shù)據(jù)損害情況進行特征化的正則化策略,例如:l2,1范數(shù)可以處理損壞的樣本數(shù)據(jù)和異常值;l1范數(shù)可以處理數(shù)據(jù)中的隨機錯誤,lF范數(shù)可以處理數(shù)據(jù)的高斯噪聲[46]。上述LRR方法獲得的最低秩表示矩陣Z,可以通過聚類方法對塊對角結構分割實現(xiàn)數(shù)據(jù)聚類。但是,最低秩表示矩陣并不是嚴格對稱。因為噪聲影響導致元素ijz不等于元素jiz,所以第i個樣本相對第j個樣本的相似性權重不等于第j個樣本相對第i個樣本的相似性權重,如圖3.2所示。值得考慮的一個問題是這兩個元素中哪一個更適合用來反映兩個樣本之間的相似性權重。通常情況下,定義一個相似度矩陣()2TW=Z+Ζ,通過譜聚類方法來獲得最終的子空間劃分結果。圖3.2真實數(shù)據(jù)下的低秩表示方法為了使低秩矩陣在數(shù)據(jù)噪聲下可以準確描述樣本空間關系,同時也是為了避免低秩矩陣自我對稱化處理,把對稱約束引入到低秩表示中,對稱約束可以嚴格保證數(shù)據(jù)對相似度的一致性,使得子空間中高度相關的數(shù)據(jù)有一致的表示,如圖3.3所示。在對稱約束下的低秩表示如下式(3-2)所示[47]:mins.t.Tl+*ZZ+EX=XZE,Z=Z。(3-2)

【參考文獻】:
期刊論文
[1]基于多組學數(shù)據(jù)識別癌癥驅(qū)動通路的模型和算法[J]. 蔡齊榮,吳璟莉.  計算機科學. 2019(09)
[2]2018全球癌癥統(tǒng)計報告解讀[J]. 王寧,劉碩,楊雷,張希,袁延楠,李慧超,季加孚.  腫瘤綜合治療電子雜志. 2019(01)
[3]拉普拉斯約束低秩表示的高光譜圖像異常檢測[J]. 王杰超,孫大鵬,張長興,謝鋒,王建宇.  光譜學與光譜分析. 2018(11)
[4]TCGA數(shù)據(jù)庫:海量癌癥數(shù)據(jù)的源泉[J]. 謝龍祥,閆中義,黨藝方,厲永強,董寰,郭向前.  河南大學學報(醫(yī)學版). 2018(03)
[5]超圖可視化方法研究綜述[J]. 張大坤,任淑霞.  計算機科學與探索. 2018(11)
[6]多組學數(shù)據(jù)整合分析的統(tǒng)計方法研究進展[J]. 沈思鵬,張汝陽,魏永越,陳峰.  中華疾病控制雜志. 2018(08)
[7]不平衡數(shù)據(jù)集中分類超平面參數(shù)優(yōu)化方法[J]. 嚴曉明.  計算機系統(tǒng)應用. 2018(07)
[8]大數(shù)據(jù)背景下的生物信息學研究現(xiàn)狀[J]. 王俊,郭麗,吳建盛,湯麗華,胡棟.  南京郵電大學學報(自然科學版). 2017(04)
[9]基于分布式低秩表示的子空間聚類算法[J]. 許凱,吳小俊,尹賀峰.  計算機研究與發(fā)展. 2016(07)
[10]一種結構化低秩表示的子空間聚類算法[J]. 常陳陳,宗群.  計算機仿真. 2016(04)

博士論文
[1]基于基因組數(shù)據(jù)的癌癥亞型發(fā)現(xiàn)聚類研究[D]. 許桃勝.中國科學技術大學 2016
[2]高維數(shù)據(jù)的維數(shù)約簡算法研究[D]. 蘇雅茹.中國科學技術大學 2012

碩士論文
[1]基于LPC及PSI-BLAST譜的蛋白質(zhì)結構類預測方法研究[D]. 周昶捷.上海師范大學 2014



本文編號:3386955

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3386955.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶dd2d1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com