基于稀疏矩陣分解的特征基因識別方法研究
本文關(guān)鍵詞:基于稀疏矩陣分解的特征基因識別方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信息技術(shù)的進(jìn)步和數(shù)據(jù)庫的使用,各種各樣的信息呈爆炸式增長,人們很難從海量的數(shù)據(jù)中找到有用的信息。數(shù)據(jù)庫技術(shù)和機(jī)器學(xué)習(xí)的迅速發(fā)展,使得數(shù)據(jù)挖掘作為一種新的數(shù)據(jù)處理技術(shù)登上歷史舞臺。近年來,各種生物基因組研究相繼開展,使得生物學(xué)實驗數(shù)據(jù)的數(shù)量呈爆炸式增長。過去的數(shù)據(jù)分析方法已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足實際研究的需要,稀疏矩陣分解理論作為新一代的數(shù)據(jù)挖掘技術(shù)能夠很好地處理大規(guī);虮磉_(dá)數(shù)據(jù),進(jìn)一步從基因表達(dá)數(shù)據(jù)中識別出包含關(guān)鍵信息的特征基因,從而為生命科學(xué)更好地認(rèn)識生命提供了有效的手段和方法。本文通過綜合分析國內(nèi)外學(xué)者對稀疏矩陣分解理論和特征基因識別算法方面的研究成果,發(fā)現(xiàn)其中存在部分學(xué)術(shù)研究上的缺乏,因此,筆者基于以往的研究成果,通過對數(shù)據(jù)挖掘算法進(jìn)行深入研究,選擇其中的特征提取作為重點研究方向,對稀疏矩陣分解展開研究,并對稀疏矩陣分解算法進(jìn)行改進(jìn),提出了兩種新的特征基因識別算法:基于類別信息的懲罰性矩陣分解算法和基于P范數(shù)的魯棒特征提取算法。基于類別信息的懲罰性矩陣分解根據(jù)基因表達(dá)數(shù)據(jù)中不同的樣本數(shù)得到總散度矩陣,并將總散度矩陣進(jìn)行矩陣分解,重建一個新的數(shù)據(jù)矩陣,然后利用懲罰性矩陣分解對新的數(shù)據(jù)矩陣進(jìn)行處理,得到稀疏特征樣本,最后,根據(jù)稀疏特征樣本中的非零項來識別特征基因;赑范數(shù)的魯棒特征提取算法利用Schattenp范數(shù)作為正則化函數(shù)來得到低秩矩陣,利用pL作為誤差函數(shù)來提高對離群值的魯棒性,因此該算法可以有效地識別特征基因。為了驗證這兩種算法的性能,本文分別在仿真數(shù)據(jù)集和基因表達(dá)數(shù)據(jù)集上進(jìn)行實驗,并同現(xiàn)有的方法相比較。實驗結(jié)果表明,筆者提出的算法是有效可行的。本論文的創(chuàng)新點之一在于通過總散度矩陣引入樣本類別信息,并與PMD進(jìn)行結(jié)合,提出一種新的有監(jiān)督特征提取算法基于類別信息的懲罰性矩陣分解算法(CIPMD)來識別特征基因,并成功將CIPMD應(yīng)用在基因表達(dá)數(shù)據(jù)分析中;創(chuàng)新點之二是基于Schattenp范數(shù)和pL范數(shù),提出基于P范數(shù)的魯棒特征提取算法(PRFE)來識別特征基因。
【關(guān)鍵詞】:稀疏矩陣分解 特征基因 基因表達(dá)數(shù)據(jù) 類別信息 懲罰性矩陣分解 P范數(shù) 魯棒特征提取 低秩
【學(xué)位授予單位】:曲阜師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP311.13;G250
【目錄】:
- 摘要3-4
- Abstract4-8
- 第1章 緒論8-14
- 1.1 研究背景及意義8-9
- 1.1.1 研究背景8-9
- 1.1.2 研究意義9
- 1.2 國內(nèi)外研究綜述9-11
- 1.3 研究思路與方法11-14
- 1.3.1 研究思路11-12
- 1.3.2 研究方法12-14
- 第2章 相關(guān)概念解析14-24
- 2.1 稀疏矩陣分解理論概述14-18
- 2.1.1 矩陣分解理論14-16
- 2.1.2 稀疏表示理論16-18
- 2.2 特征基因識別概述18-24
- 2.2.1 基因表達(dá)數(shù)據(jù)及其特點18-19
- 2.2.2 特征基因識別方法介紹19-24
- 第3章 基于類別信息的懲罰性矩陣分解算法24-40
- 3.1 基于類別信息的懲罰性矩陣分解算法24-26
- 3.1.1 散度矩陣24-25
- 3.1.2 構(gòu)建新矩陣25
- 3.1.3 懲罰性矩陣分解25-26
- 3.2 CIPMD在特征基因識別中的應(yīng)用26-27
- 3.3 實驗結(jié)果與討論27-38
- 3.3.1 仿真實驗結(jié)果與分析27-30
- 3.3.2 基因表達(dá)數(shù)據(jù)實驗結(jié)果與分析30-38
- 3.4 小結(jié)38-40
- 第4章 基于P范數(shù)的魯棒特征提取算法40-59
- 4.1 基于P范數(shù)的魯棒特征提取算法40-45
- 4.1.1 P范數(shù)概念40
- 4.1.2 基于P范數(shù)的魯棒特征提取算法40-41
- 4.1.3 算法的求解41-44
- 4.1.4 算法中p值的選擇44-45
- 4.2 PRFE在特征基因識別中的應(yīng)用45-46
- 4.3 實驗結(jié)果與討論46-57
- 4.3.1 仿真實驗結(jié)果與分析46-49
- 4.3.2 基因表達(dá)數(shù)據(jù)實驗結(jié)果與分析49-57
- 4.4 小結(jié)57-59
- 第5章 結(jié)論與展望59-62
- 5.1 研究結(jié)論59
- 5.2 研究創(chuàng)新點及展望59-62
- 5.2.1 研究的創(chuàng)新點59
- 5.2.2 研究的不足59-60
- 5.2.3 研究的展望60-62
- 參考文獻(xiàn)62-68
- 在讀期間發(fā)表的學(xué)術(shù)論文及研究成果68-70
- 致謝70
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 紀(jì)效霞;陳柯;;有限元中稀疏矩陣的存儲[J];棗莊學(xué)院學(xué)報;2008年05期
2 李長興;;稀疏矩陣的轉(zhuǎn)置[J];計算機(jī)光盤軟件與應(yīng)用;2013年05期
3 史樹民,董相端;稀疏矩陣在統(tǒng)計文件組織中的應(yīng)用[J];計算機(jī)應(yīng)用與軟件;1987年06期
4 張興令,郭敏燕;一個高階稀疏矩陣的壓縮存放法[J];計算機(jī)應(yīng)用與軟件;1987年06期
5 李昱明,董萬鵬,彭穎紅;基于0-1屬性矩陣的矩陣壓縮存貯方法研究[J];計算機(jī)工程與應(yīng)用;2003年02期
6 蔣川群;杜奕;;稀疏矩陣相乘的一個改進(jìn)算法[J];計算機(jī)工程與應(yīng)用;2009年19期
7 任建民,張義門;模擬半導(dǎo)體器件的一種稀疏矩陣及其算法[J];電子科學(xué)學(xué)刊;1989年01期
8 高鳳榮,杜小勇,王珊;一種基于稀疏矩陣劃分的個性化推薦算法[J];微電子學(xué)與計算機(jī);2004年02期
9 褚一平;陳勤;吳鋌;;大型稀疏矩陣線形相關(guān)列的求解算法和實現(xiàn)方法研究[J];石油工業(yè)計算機(jī)應(yīng)用;2004年04期
10 居悌;電路的計算機(jī)輔助設(shè)計——八、稀疏矩陣技術(shù)[J];微電子學(xué)與計算機(jī);1986年08期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 宋琦;陳璞;;稀疏求解—結(jié)構(gòu)修改的一種新的可能性[A];北京力學(xué)會第20屆學(xué)術(shù)年會論文集[C];2014年
2 徐道遠(yuǎn);王寶庭;王向東;馮伯林;;求解大型稀疏矩陣的ICCG法[A];第八屆全國結(jié)構(gòu)工程學(xué)術(shù)會議論文集(第Ⅰ卷)[C];1999年
3 苑維然;陳璞;劉凱欣;;非對稱線性方程組的快速外存解法[A];中國力學(xué)學(xué)會學(xué)術(shù)大會'2005論文摘要集(下)[C];2005年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉健;基于稀疏矩陣分解的特征基因識別方法研究[D];曲阜師范大學(xué);2015年
2 莊立;稀疏矩陣向量乘及自動調(diào)優(yōu)[D];杭州電子科技大學(xué);2011年
3 馮廣祥;大型稀疏矩陣直接求解算法的研究及實現(xiàn)[D];東北大學(xué);2010年
4 丁玲;低秩與稀疏矩陣恢復(fù)問題的若干研究[D];浙江大學(xué);2012年
5 吳超凡;基于UB樹的大型稀疏矩陣存儲研究[D];云南大學(xué);2013年
6 王亞南;基于FPGA的稀疏矩陣分解實現(xiàn)[D];西安電子科技大學(xué);2009年
7 趙加強(qiáng);基于OpenCL的稀疏矩陣向量乘優(yōu)化[D];吉林大學(xué);2012年
8 施浩;基于FPGA的稀疏矩陣向量乘的優(yōu)化研究與實現(xiàn)[D];南京郵電大學(xué);2011年
9 胡耀國;基于GPU的有限元方法研究[D];華中科技大學(xué);2011年
10 梁添;基于GPU的稀疏矩陣運(yùn)算優(yōu)化研究[D];華中科技大學(xué);2012年
本文關(guān)鍵詞:基于稀疏矩陣分解的特征基因識別方法研究,由筆耕文化傳播整理發(fā)布。
本文編號:429588
本文鏈接:http://sikaile.net/tushudanganlunwen/429588.html