天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中若干關(guān)鍵算法的分析比較

發(fā)布時(shí)間:2019-02-21 15:44
【摘要】:隨著測(cè)序技術(shù)的快速發(fā)展,蛋白質(zhì)序列數(shù)量與已測(cè)定結(jié)構(gòu)與功能的蛋白質(zhì)數(shù)量的差距越來(lái)越大,迫切需要通過(guò)理論計(jì)算方法實(shí)現(xiàn)蛋白質(zhì)結(jié)構(gòu)功能的預(yù)測(cè)。目前,許多有效的方法被提出來(lái)研究蛋白質(zhì)序列、結(jié)構(gòu)和功能之間的關(guān)系,但不同方法在解決蛋白質(zhì)結(jié)構(gòu)功能研究中具有偏好性。因此,本文主要圍繞蛋白質(zhì)結(jié)構(gòu)功能研究中方法展開,系統(tǒng)地比較分析了不同的特征提取方法、特征挑選方法和預(yù)測(cè)算法在蛋白質(zhì)結(jié)構(gòu)類、蛋白質(zhì)紊亂、蛋白質(zhì)分子伴侶、蛋白質(zhì)溶解度和RNA結(jié)合蛋白質(zhì)的預(yù)測(cè)中效率。主要研究?jī)?nèi)容如下:1、簡(jiǎn)要介紹了蛋白質(zhì)研究的研究背景及意義、蛋白質(zhì)的組成、結(jié)構(gòu)和物理化學(xué)性質(zhì),并簡(jiǎn)述了常用的數(shù)據(jù)庫(kù)及本文采用的數(shù)據(jù)集,為本文的研究提供了理論和數(shù)據(jù)基礎(chǔ)。2、分析比較了蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中氨基酸約化和特征提取方法。根據(jù)522種氨基酸性質(zhì)將20種氨基酸約化成k類,提取蛋白質(zhì)6類不同信息,結(jié)合支持向量機(jī)比較分析了氨基酸約化與信息提取方法在蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中的效率。結(jié)果表明,在蛋白質(zhì)結(jié)構(gòu)類和蛋白質(zhì)分子伴侶預(yù)測(cè)中,最好采用氨基酸的轉(zhuǎn)向傾向類性質(zhì)約化20種氨基酸,再提取蛋白質(zhì)的順序特征,而蛋白質(zhì)溶解度的預(yù)測(cè)則偏向于蛋白質(zhì)的RCTD特征提取方法。3、分析比較了蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中特征挑選方法。本章選取了基于互信息的特征挑選方法、基于支持向量機(jī)的特征挑選方法等16種,結(jié)合K近鄰預(yù)測(cè)算法比較分析了特征挑選方法在蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中的效率。結(jié)果表明,基于非線性支持向量機(jī)的特征挑選方法在蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)、蛋白質(zhì)溶解度預(yù)測(cè)、蛋白質(zhì)分子伴侶預(yù)測(cè)和蛋白質(zhì)溶解度預(yù)測(cè)中表現(xiàn)最好,經(jīng)過(guò)挑選后特征的準(zhǔn)確率提升了13.16%-71%,尤其是蛋白質(zhì)的k-mer特征和PSSM特征。4、分析比較了蛋白質(zhì)結(jié)構(gòu)功能預(yù)測(cè)中預(yù)測(cè)算法。本章選取了線性判別分析算法、主成分分析判別算法等7種預(yù)測(cè)算法,并比較分析了不同預(yù)測(cè)算法在蛋白質(zhì)結(jié)構(gòu)功能中效率。結(jié)果表明,在蛋白質(zhì)結(jié)構(gòu)類預(yù)測(cè)中,SVM預(yù)測(cè)算法表現(xiàn)最好,尤其與蛋白質(zhì)PRseAAC特征結(jié)合,預(yù)測(cè)準(zhǔn)確率達(dá)到99.15%;選擇PCADA、CART、PLSDA、KNN或者SVM算法可以較準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)的分子伴侶;在蛋白質(zhì)紊亂預(yù)測(cè)中,KNN預(yù)測(cè)算法與蛋白質(zhì)RCTD特征結(jié)合表現(xiàn)最好,準(zhǔn)確率達(dá)到了94.75%;蛋白質(zhì)溶解度預(yù)測(cè)應(yīng)選取PSSM特征,結(jié)合PLSDA和PCADA預(yù)測(cè)算法;而在預(yù)測(cè)RNA結(jié)合的蛋白質(zhì)時(shí),采用GO特征和CART算法的組合或者GO特征和PLSDA算法的組合,都能獲得較好的預(yù)測(cè)準(zhǔn)確率。
[Abstract]:With the rapid development of sequencing technology, the gap between the number of protein sequences and the number of proteins with measured structure and function is increasing. Therefore, it is urgent to realize the prediction of protein structure and function by theoretical calculation. At present, many effective methods have been proposed to study the relationship among protein sequence, structure and function, but different methods have a preference in solving the problem of protein structure and function. Therefore, this paper mainly focuses on the research methods of protein structure and function, and systematically compares and analyzes different feature extraction methods, feature selection methods and prediction algorithms in protein structure class, protein disorder, protein molecular chaperone. Protein solubility and RNA binding protein prediction efficiency. The main research contents are as follows: 1. The background and significance of protein research, the composition, structure and physicochemical properties of protein are briefly introduced, and the commonly used databases and the data sets used in this paper are briefly introduced. 2. The methods of amino acid reduction and feature extraction in the prediction of protein structure and function were analyzed and compared. According to the properties of 522 amino acids, 20 kinds of amino acids were reduced to k class, and 6 kinds of different information of protein were extracted. The efficiency of amino acid reduction and information extraction methods in predicting protein structure and function was compared and analyzed with support vector machine (SVM). The results showed that in the prediction of protein structure and protein molecular chaperone, it was better to use the conversion tendency of amino acids to reduce 20 kinds of amino acids, and then extract the sequence characteristics of proteins. However, the prediction of protein solubility tends to the RCTD feature extraction method of protein. 3. The feature selection method in protein structure and function prediction is analyzed and compared. In this chapter, 16 feature selection methods based on mutual information and support vector machine are selected, and the efficiency of feature selection in protein structure and function prediction is compared with K-nearest neighbor prediction algorithm. The results show that the feature selection method based on nonlinear support vector machine performs best in protein structure prediction, protein solubility prediction, protein molecular chaperone prediction and protein solubility prediction. The accuracy of the selected features is improved by 13.16- 71, especially the k-mer features and PSSM features of proteins. 4. The prediction algorithms in the prediction of protein structure and function are analyzed and compared. In this chapter, seven prediction algorithms, such as linear discriminant analysis (LDA) and principal component analysis (PCA), are selected, and the efficiency of different prediction algorithms in protein structure and function is compared and analyzed. The results show that the SVM prediction algorithm is the best in protein structure class prediction, especially combined with protein PRseAAC features, and the prediction accuracy is 99.15. The molecular chaperones of proteins can be predicted accurately by choosing PCADA,CART,PLSDA,KNN or SVM algorithms, and in the prediction of protein disturbance, the combination of KNN prediction algorithm with protein RCTD features is the best, and the accuracy is 94.75%. In predicting protein solubility, PSSM features should be selected, combined with PLSDA and PCADA prediction algorithms, while the combination of GO feature and CART algorithm or GO feature and PLSDA algorithm can obtain better prediction accuracy when predicting RNA bound proteins.
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q51

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 陳功;周小科;;基于機(jī)器學(xué)習(xí)的miRNA靶基因預(yù)測(cè)算法研究概況[J];軟件導(dǎo)刊;2011年12期

2 江禮俐;唐曉峰;唐國(guó)安;;結(jié)構(gòu)中不可測(cè)區(qū)域振動(dòng)響應(yīng)的預(yù)測(cè)算法[J];上海航天;2006年02期

3 聶書志;葉邦彥;;大規(guī)模數(shù)據(jù)環(huán)境下用電量預(yù)測(cè)算法研究[J];科技通報(bào);2013年02期

4 徐軍,向健華,粱昌洪;最大化背景模型用于檢測(cè)紅外圖像中的弱小目標(biāo)[J];光子學(xué)報(bào);2002年12期

5 李志俊;蔡黎;宋業(yè)新;張潔;;一種灰色拓?fù)涓倪M(jìn)預(yù)測(cè)算法及應(yīng)用研究[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自科版)理工卷;2007年02期

6 徐海松,葉關(guān)榮;計(jì)算機(jī)自動(dòng)配色預(yù)測(cè)算法研究[J];光學(xué)學(xué)報(bào);1996年11期

7 劉平;馬玉韜;孫學(xué)宏;張成;杜勇;;基因預(yù)測(cè)算法中閾值的傅里葉質(zhì)譜分析[J];湖北農(nóng)業(yè)科學(xué);2014年06期

8 王果;駱曉艷;胡志波;陳素;;基于時(shí)序的股票預(yù)測(cè)算法研究[J];江蘇技術(shù)師范學(xué)院學(xué)報(bào);2010年06期

9 潘矜矜;戴憲華;楊小勁;;一種基于卡爾曼濾波修正的LRP信道預(yù)測(cè)算法[J];桂林工學(xué)院學(xué)報(bào);2008年02期

10 王洪,馮嘉禮;基于屬性論方法的股市預(yù)測(cè)算法[J];復(fù)旦學(xué)報(bào)(自然科學(xué)版);2004年05期

相關(guān)會(huì)議論文 前10條

1 朱斌;樊祥;馬東輝;程正東;;窗口大小和權(quán)值模板對(duì)固定權(quán)值背景預(yù)測(cè)算法的影響[A];2006年全國(guó)光電技術(shù)學(xué)術(shù)交流會(huì)會(huì)議文集(D 光電信息處理技術(shù)專題)[C];2006年

2 王峰;姬冰輝;李斗;;一種基于混沌理論的自相似業(yè)務(wù)流預(yù)測(cè)算法研究[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)——通信與信息技術(shù)會(huì)議論文集(上)[C];2006年

3 錢正祥;徐華;張申浩;;數(shù)字信號(hào)序列的向量預(yù)測(cè)算法[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年

4 郭景峰;代軍麗;馬鑫;王娟;;針對(duì)通信社會(huì)網(wǎng)絡(luò)的時(shí)間序列鏈接預(yù)測(cè)算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(A輯)[C];2009年

5 張利萍;李宏光;;改進(jìn)的灰色預(yù)測(cè)算法在工業(yè)應(yīng)用中的評(píng)價(jià)[A];第二屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2004年

6 崔冬;;一種改進(jìn)的LRP信道預(yù)測(cè)算法[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年

7 王佳;殷海兵;周冰倩;;一種適合硬件實(shí)現(xiàn)的低復(fù)雜度MAD預(yù)測(cè)算法[A];浙江省電子學(xué)會(huì)2011學(xué)術(shù)年會(huì)論文集[C];2011年

8 鄭銘浩;劉志紅;巫瑞波;徐峻;;P450各亞型代謝調(diào)控劑預(yù)測(cè)算法[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年

9 張曉丹;王萍;;一種基于特征的H.264的子塊快速幀內(nèi)預(yù)測(cè)算法[A];第七屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2011)論文集【oral】[C];2011年

10 劉志紅;鄭銘浩;嚴(yán)鑫;巫瑞波;徐峻;;基于結(jié)構(gòu)的化合物穩(wěn)定性預(yù)測(cè)算法[A];中國(guó)化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年

相關(guān)博士學(xué)位論文 前2條

1 馬玉韜;基于濾波理論和特征統(tǒng)計(jì)的蛋白質(zhì)編碼區(qū)預(yù)測(cè)算法研究[D];天津大學(xué);2013年

2 玄萍;MicroRNA識(shí)別及其與疾病關(guān)聯(lián)的預(yù)測(cè)算法研究[D];哈爾濱工業(yè)大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 吳智勇;學(xué)術(shù)論文排序預(yù)測(cè)算法研究[D];內(nèi)蒙古大學(xué);2015年

2 張勇攀;針對(duì)殘缺IP網(wǎng)絡(luò)的鏈路預(yù)測(cè)技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年

3 應(yīng)超;博物館移動(dòng)導(dǎo)覽中的遠(yuǎn)程展示技術(shù)研究及系統(tǒng)實(shí)現(xiàn)[D];浙江大學(xué);2015年

4 常艷華;基于數(shù)據(jù)驅(qū)動(dòng)模擬電路故障預(yù)測(cè)算法實(shí)現(xiàn)與軟件開發(fā)[D];電子科技大學(xué);2015年

5 閆青;基于預(yù)測(cè)算法的快速多尺度金字塔時(shí)空特征點(diǎn)計(jì)算算法研究[D];青島科技大學(xué);2016年

6 錢呂見;復(fù)雜網(wǎng)絡(luò)中基于角色傳遞性和對(duì)稱性的鏈接預(yù)測(cè)算法研究[D];蘭州大學(xué);2016年

7 李小科;無(wú)模型自適應(yīng)預(yù)測(cè)算法及其在非線性過(guò)程控制中的應(yīng)用[D];蘭州大學(xué);2016年

8 周攀;基于姿態(tài)傳感器的人體步態(tài)預(yù)測(cè)算法設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2016年

9 周真爭(zhēng);基于社團(tuán)綜合屬性的鏈路預(yù)測(cè)算法研究[D];南京信息工程大學(xué);2016年

10 任程;DSP+FPGA平臺(tái)功耗管理的研究與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2016年



本文編號(hào):2427636

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2427636.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cb5a8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产精品推荐在线一区| 欧美人妻一区二区三区| 亚洲国产精品久久网午夜| 噜噜中文字幕一区二区| 欧美日韩国产福利在线观看| 亚洲国产91精品视频| 欧美日韩精品久久第一页| 欧美精品专区一区二区| 欧美黑人黄色一区二区| 日韩一区二区三区有码| 国产一级特黄在线观看| 国产午夜精品福利免费不| 丰满的人妻一区二区三区| 亚洲一区二区精品免费视频| 五月的丁香婷婷综合网| 最好看的人妻中文字幕| 黄色美女日本的美女日人| 欧美不卡高清一区二区三区| 老司机这里只有精品视频| 国产农村妇女成人精品| 日本女人亚洲国产性高潮视频| 日韩人妻欧美一区二区久久| 狠狠做深爱婷婷久久综合| 精品人妻一区二区三区免费看 | 国产亚洲精品久久99| 国产乱久久亚洲国产精品| 国产成人精品久久二区二区| 日韩精品综合福利在线观看| 日本欧美在线一区二区三区| 欧美区一区二区在线观看| 亚洲国产av在线视频| 亚洲中文字幕在线视频频道| 美国欧洲日本韩国二本道| 99久久国产精品免费| 果冻传媒精选麻豆白晶晶| 亚洲av熟女一区二区三区蜜桃 | 亚洲日本久久国产精品久久| 欧美激情一区二区亚洲专区| 国产亚洲成av人在线观看| 精品久久少妇激情视频| 丰满人妻熟妇乱又乱精品古代|