天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

張量分解方法的研究及在生物測(cè)序數(shù)據(jù)上的應(yīng)用

發(fā)布時(shí)間:2021-09-09 14:14
  癌癥(惡性腫瘤)是威脅人類生命健康的最大殺手。隨著新一代測(cè)序技術(shù)、納米技術(shù)和生物芯片技術(shù)的快速發(fā)展,人類獲取了大量的基因組信息并對(duì)此進(jìn)行充分的挖掘,為癌癥的預(yù)防和治療提供理論依據(jù)。生物測(cè)序數(shù)據(jù)存在數(shù)以萬(wàn)計(jì)的基因,然而細(xì)胞病變僅與少量基因的差異表達(dá)(差異表達(dá)基因)有關(guān),此類差異基因在海量數(shù)據(jù)中只占小部分,這為提取與癌癥病變有關(guān)基因的工作帶來(lái)挑戰(zhàn)。矩陣的魯棒主成分分析方法旨在將原始矩陣表示成矩陣的線性組合,并通過(guò)稀疏和低秩約束將噪聲考慮到算法中來(lái),再對(duì)部分分解矩陣進(jìn)行研究,從而解決由高維度引起的數(shù)據(jù)問(wèn)題。然而,這一模型沒(méi)有充分挖掘癌癥多組學(xué)數(shù)據(jù)的空間結(jié)構(gòu)以及多視角信息,影響選擇差異表達(dá)基因的精確度。而基于三階張量分解方法的研究能保留數(shù)據(jù)的立體結(jié)構(gòu)不被破壞,從而能充分挖掘數(shù)據(jù)的隱含信息,這在當(dāng)前引起了廣泛關(guān)注。針對(duì)目前矩陣分解方法無(wú)法保留數(shù)據(jù)空間幾何結(jié)構(gòu)的問(wèn)題,本人在魯棒主成分分析方法的基礎(chǔ)上,利用癌癥基因圖譜中的生物測(cè)序數(shù)據(jù),提出對(duì)算法稀疏性、魯棒性的改進(jìn)。主要分為以下三個(gè)部分:(1)針對(duì)空間幾何結(jié)構(gòu)感知力低的問(wèn)題,提出了張量魯棒主成分分析方法。該方法在矩陣魯棒主成分分析模型的基礎(chǔ)上引入張... 

【文章來(lái)源】:曲阜師范大學(xué)山東省

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

張量分解方法的研究及在生物測(cè)序數(shù)據(jù)上的應(yīng)用


展開(kāi)和折疊運(yùn)算符的示例

張量分解方法的研究及在生物測(cè)序數(shù)據(jù)上的應(yīng)用


t-SVD分解

模型圖,模型,基因,張量


D3S問(wèn)題。使用TRPCA方法將多視圖數(shù)據(jù)建模的目的是挖掘?qū)е掳┌Y發(fā)生的共表達(dá)特征基因。如上所述,將重要基因視為稀疏信號(hào)是合理的,因此將差異表達(dá)特征視為稀疏擾動(dòng)信號(hào),將非差異表達(dá)基因視為低秩張量,因此可以從稀疏擾動(dòng)信號(hào)中識(shí)別出各種癌癥的差異表達(dá)基因。TRPCA的多視圖模型如圖3.3所示,三個(gè)維度分別代表基因特征、樣本和疾病類型。輸入張量的每個(gè)正面切片矩陣代表所有基因在同一種癌癥中全部樣本的表達(dá)水平,因此不同的正面切片代表不同的癌癥類型。圖中純色表示等于或接近零的數(shù)據(jù)點(diǎn),而有色噪聲點(diǎn)表示干擾信號(hào)。圖3.3TRPCA模型TRPCA模型分解原始張量之后,通過(guò)選擇適當(dāng)?shù)膮?shù),可以在稀疏張量中獲得稀疏干擾信號(hào)。本文將重要基因視為稀疏信號(hào),所以差異表達(dá)的基因被視為稀疏擾動(dòng)信號(hào),例如,稀疏張量中的大多數(shù)條目為零值或接近零值,非零的條目可以視為差異表達(dá)基因。接下來(lái)分析稀疏張量的每個(gè)正面切片,首先計(jì)算每個(gè)正面切片數(shù)據(jù)的絕對(duì)值,然后對(duì)各列求和后獲得以下向量:12(,...)mppp=,(3-15)1njijipp==。(3-16)對(duì)每個(gè)切片求和并獲得新的向量,然后新向量按降序排列:12,(,...)mPppp=。(3-17)在降序向量中選擇出前500個(gè)最大值對(duì)應(yīng)的基因,不失一般性,基因的排名越靠前,就越有可能成為差異表達(dá)基因。GeneOntology[27]是分析基因組數(shù)據(jù)的重要工具,可以用來(lái)查詢基因本體信息和富集基因本體術(shù)語(yǔ)。當(dāng)基因名稱輸入到GeneOntology工具時(shí),此工具將生成與該基因相關(guān)的富集詞匯表,該表包含與此基因有關(guān)的富集生物學(xué)解釋。利用P值和輸入基因的數(shù)量衡量實(shí)驗(yàn)的有效性,即使用P值(P-value)和命中計(jì)數(shù)(Hit)比較這些方法的性能。實(shí)驗(yàn)中較小的P值對(duì)應(yīng)基因的富集程度越高,相對(duì)應(yīng)的方法能夠挖掘出?

【參考文獻(xiàn)】:
期刊論文
[1]2015年中國(guó)惡性腫瘤流行情況分析[J]. 鄭榮壽,孫可欣,張思維,曾紅梅,鄒小農(nóng),陳茹,顧秀瑛,魏文強(qiáng),赫捷.  中華腫瘤雜志. 2019 (01)
[2]基于L1-范數(shù)的魯棒稀疏的張量PCA人臉圖像分析[J]. 唐肝翌,盧桂馥.  南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2018(01)
[3]肝外膽管癌組織MMP-2表達(dá)及其臨床意義[J]. 李昌,楊巖,藍(lán)諾,姚明軍,王磊,韓冰,王仰亮,陳海霞.  中華腫瘤防治雜志. 2017(10)
[4]中國(guó)癌癥發(fā)病、死亡現(xiàn)狀與趨勢(shì)分析[J]. 曾倩,崔芳芳,宇傳華,張干深.  中國(guó)衛(wèi)生統(tǒng)計(jì). 2016(02)
[5]一種基于張量PCA的人耳識(shí)別的改進(jìn)方法[J]. 李一波,曹景亮,張海軍.  計(jì)算機(jī)工程與應(yīng)用. 2011(25)
[6]The ratio of MMP-2 to TIMP-2 in hilar cholangiocarcinoma:a semi-quantitative study[J]. Mei Xiao, Nin-Xing Zhou,Zhi-Qiang Huang,Ya-Li Lu, Ling-Hong Chen, Dian-Jun Wang and Wei-Lin Chang Beijing, China Department of Hepatobiliary Surgery, General Air- force of Hospital, Beijing 100036, China and General Hospital of People’ s Liberation Army, Beijing 100853 , China.  Hepatobiliary & Pancreatic Diseases International. 2004(04)
[7]生物信息學(xué):生物實(shí)驗(yàn)數(shù)據(jù)和計(jì)算技術(shù)結(jié)合的新領(lǐng)域[J]. 歐陽(yáng)曙光,賀福初.  科學(xué)通報(bào). 1999(14)

博士論文
[1]面向高維小樣本數(shù)據(jù)的分類特征選擇算法研究[D]. 張靖.合肥工業(yè)大學(xué) 2014

碩士論文
[1]基于基因表達(dá)數(shù)據(jù)的癌癥特征基因選擇方法研究[D]. 李曉丹.北京工業(yè)大學(xué) 2016



本文編號(hào):3392243

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/yysx/3392243.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c1679***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com