蛋白質(zhì)亞細(xì)胞定位中的特征表達(dá)與降維算法研究
發(fā)布時(shí)間:2023-03-11 18:39
隨著后基因組時(shí)代的進(jìn)入,作為蛋白質(zhì)組學(xué)的一項(xiàng)分支,蛋白質(zhì)亞細(xì)胞定位研究的熱度與日俱增。蛋白質(zhì)亞細(xì)胞定位研究中,基于蛋白質(zhì)氨基酸序列的特征表達(dá)在定位預(yù)測(cè)階段扮演著重要角色;很大程度上,它決定了亞細(xì)胞定位結(jié)果的好壞。提取蛋白質(zhì)特征表達(dá)以后,通常會(huì)面臨“小樣本,高維數(shù)”的問(wèn)題;因此,為了降低計(jì)算開(kāi)銷、減少數(shù)據(jù)噪聲及增強(qiáng)小樣本數(shù)據(jù)集的魯棒性,使用降維算法處理高維特征表達(dá)是必要的。基于此,本文對(duì)蛋白質(zhì)亞細(xì)胞定位中的特征表達(dá)與降維算法進(jìn)行了深入研究與分析。本文的主要工作及創(chuàng)新之處概括如下:1.蛋白質(zhì)有4種基本的、分類性能依次遞增的單特征表達(dá):氨基酸組成(AAC)、二肽組成(DipC)、偽氨基酸組成(PseAAC)和位置特異性得分矩陣(PSSM)。為了提高蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)準(zhǔn)確率,構(gòu)造信息量豐富的特征表達(dá)是有效的方法之一。為此,本文新提出了一種先加權(quán)后相加的特征融合模型,通過(guò)融合多種單特征表達(dá)以形成新型復(fù)合特征。實(shí)驗(yàn)結(jié)果表明該復(fù)合特征表達(dá)所包含信息量大于被融和的單特征表達(dá)。其次,本文基于PSSM提出了一種新特征表達(dá)——相關(guān)性位置特異性得分矩陣(CoPSSM),經(jīng)實(shí)驗(yàn)驗(yàn)證,CoPSSM的分類性能優(yōu)于...
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 本文研究背景及意義
1.3 蛋白質(zhì)亞細(xì)胞定位的研究現(xiàn)狀
1.4 本文的研究?jī)?nèi)容與創(chuàng)新點(diǎn)
1.5 本文的組織結(jié)構(gòu)
第二章 蛋白質(zhì)亞細(xì)胞定位的特征表達(dá)分析與分類技術(shù)
2.1 蛋白質(zhì)氨基酸序列的特征表達(dá)方法
2.1.1 基于氨基酸組成(AAC)的特征表達(dá)
2.1.2 基于二肽組成(DipC)的特征表達(dá)
2.1.3 基于偽氨基酸組成(PseAAC)的特征表達(dá)
2.1.4 基于位置特異性得分矩陣(PSSM)的特征表達(dá)
2.1.5 基于偽位置特異性得分矩陣(PsePSSM)的特征表達(dá)
2.2 蛋白質(zhì)亞細(xì)胞定位的分類算法
2.3 蛋白質(zhì)亞細(xì)胞定位分類模型的檢驗(yàn)方法與性能評(píng)估指標(biāo)
2.3.1 分類模型的檢驗(yàn)方法
2.3.2 分類模型性能評(píng)估指標(biāo)
第三章 基于核技巧的非線性降維算法
3.1 核技巧的基本思想
3.2 常用的核函數(shù)
3.3 核主成分分析(Kernel Principal Component Analysis, KPCA)
3.4 核線性判別分析(Kernel Linear Discriminant Analysis,KLDA)
第四章 基于復(fù)合特征表達(dá)與核線性判別分析( KLDA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
4.1 引言
4.2 融合特征表達(dá)模型
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 數(shù)據(jù)集
4.3.2 不同特征表達(dá)的總體預(yù)測(cè)識(shí)別率
4.3.3 基于PseAACPSSM與KLDA的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
4.3.4 基于PseAACPSSM與KLDA的分類性能評(píng)估指標(biāo)分析
4.3.5 對(duì)比實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第五章 基于復(fù)合核函數(shù)二重降維算法的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
5.1 引言
5.2 融合核函數(shù)模型
5.3 實(shí)驗(yàn)結(jié)果及分析
5.3.1 數(shù)據(jù)集
5.3.2 整體預(yù)測(cè)識(shí)別率
5.3.3 各類別預(yù)測(cè)識(shí)別率
5.3.4 對(duì)比實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第六章 基于半監(jiān)督式核主成分分析(KPCA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
6.1 引言
6.2 半監(jiān)督式KPCA模型
6.3 實(shí)驗(yàn)結(jié)果及分析
6.3.1 數(shù)據(jù)集
6.3.2 總體預(yù)測(cè)識(shí)別率
6.3.3 各類別預(yù)測(cè)識(shí)別率
6.3.4 分類性能評(píng)估指標(biāo)分析
6.3.5 對(duì)比實(shí)驗(yàn)結(jié)果分析
6.4 本章小結(jié)
第七章 基于二分貪心遺傳算法(DGGA)搜索核參數(shù)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
7.1 引言
7.2 二分貪心遺傳算法(DGGA)
7.3 實(shí)驗(yàn)結(jié)果及分析
7.3.1 數(shù)據(jù)集
7.3.2 基于DGGA與KLDA整體降維的實(shí)驗(yàn)結(jié)果分析
7.3.3 基于相關(guān)性位置特異性得分矩陣(CoPSSM)與核線性判別分析(KLDA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
7.3.3.1 相關(guān)性位置特異性得分矩陣(CoPSSM)
7.3.3.2 CoPSSM的分類性能分析
7.3.3.3 CoPSSM基于結(jié)合判別準(zhǔn)則的KLDA與DGGA分類性能
7.3.4 對(duì)比實(shí)驗(yàn)結(jié)果分析
7.4 本章小結(jié)
第八章 總結(jié)與展望
8.1 全文工作總結(jié)
8.2 未來(lái)工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文與參與的科研項(xiàng)目
發(fā)表的學(xué)術(shù)論文
參與的科研項(xiàng)目
致謝
本文編號(hào):3760037
【文章頁(yè)數(shù)】:90 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 引言
1.2 本文研究背景及意義
1.3 蛋白質(zhì)亞細(xì)胞定位的研究現(xiàn)狀
1.4 本文的研究?jī)?nèi)容與創(chuàng)新點(diǎn)
1.5 本文的組織結(jié)構(gòu)
第二章 蛋白質(zhì)亞細(xì)胞定位的特征表達(dá)分析與分類技術(shù)
2.1 蛋白質(zhì)氨基酸序列的特征表達(dá)方法
2.1.1 基于氨基酸組成(AAC)的特征表達(dá)
2.1.2 基于二肽組成(DipC)的特征表達(dá)
2.1.3 基于偽氨基酸組成(PseAAC)的特征表達(dá)
2.1.4 基于位置特異性得分矩陣(PSSM)的特征表達(dá)
2.1.5 基于偽位置特異性得分矩陣(PsePSSM)的特征表達(dá)
2.2 蛋白質(zhì)亞細(xì)胞定位的分類算法
2.3 蛋白質(zhì)亞細(xì)胞定位分類模型的檢驗(yàn)方法與性能評(píng)估指標(biāo)
2.3.1 分類模型的檢驗(yàn)方法
2.3.2 分類模型性能評(píng)估指標(biāo)
第三章 基于核技巧的非線性降維算法
3.1 核技巧的基本思想
3.2 常用的核函數(shù)
3.3 核主成分分析(Kernel Principal Component Analysis, KPCA)
3.4 核線性判別分析(Kernel Linear Discriminant Analysis,KLDA)
第四章 基于復(fù)合特征表達(dá)與核線性判別分析( KLDA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
4.1 引言
4.2 融合特征表達(dá)模型
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 數(shù)據(jù)集
4.3.2 不同特征表達(dá)的總體預(yù)測(cè)識(shí)別率
4.3.3 基于PseAACPSSM與KLDA的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
4.3.4 基于PseAACPSSM與KLDA的分類性能評(píng)估指標(biāo)分析
4.3.5 對(duì)比實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第五章 基于復(fù)合核函數(shù)二重降維算法的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
5.1 引言
5.2 融合核函數(shù)模型
5.3 實(shí)驗(yàn)結(jié)果及分析
5.3.1 數(shù)據(jù)集
5.3.2 整體預(yù)測(cè)識(shí)別率
5.3.3 各類別預(yù)測(cè)識(shí)別率
5.3.4 對(duì)比實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第六章 基于半監(jiān)督式核主成分分析(KPCA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
6.1 引言
6.2 半監(jiān)督式KPCA模型
6.3 實(shí)驗(yàn)結(jié)果及分析
6.3.1 數(shù)據(jù)集
6.3.2 總體預(yù)測(cè)識(shí)別率
6.3.3 各類別預(yù)測(cè)識(shí)別率
6.3.4 分類性能評(píng)估指標(biāo)分析
6.3.5 對(duì)比實(shí)驗(yàn)結(jié)果分析
6.4 本章小結(jié)
第七章 基于二分貪心遺傳算法(DGGA)搜索核參數(shù)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
7.1 引言
7.2 二分貪心遺傳算法(DGGA)
7.3 實(shí)驗(yàn)結(jié)果及分析
7.3.1 數(shù)據(jù)集
7.3.2 基于DGGA與KLDA整體降維的實(shí)驗(yàn)結(jié)果分析
7.3.3 基于相關(guān)性位置特異性得分矩陣(CoPSSM)與核線性判別分析(KLDA)的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)
7.3.3.1 相關(guān)性位置特異性得分矩陣(CoPSSM)
7.3.3.2 CoPSSM的分類性能分析
7.3.3.3 CoPSSM基于結(jié)合判別準(zhǔn)則的KLDA與DGGA分類性能
7.3.4 對(duì)比實(shí)驗(yàn)結(jié)果分析
7.4 本章小結(jié)
第八章 總結(jié)與展望
8.1 全文工作總結(jié)
8.2 未來(lái)工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文與參與的科研項(xiàng)目
發(fā)表的學(xué)術(shù)論文
參與的科研項(xiàng)目
致謝
本文編號(hào):3760037
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3760037.html
最近更新
教材專著