基于組合分類算法的蛋白質(zhì)過敏原預(yù)測方法研究和平臺開發(fā)
本文關(guān)鍵詞:基于組合分類算法的蛋白質(zhì)過敏原預(yù)測方法研究和平臺開發(fā)
更多相關(guān)文章: 過敏原預(yù)測 氨基酸組成 氨基酸指數(shù) 組合分類方法 網(wǎng)上平臺
【摘要】:近年來,蛋白質(zhì)過敏原預(yù)測作為一個核心問題被深入討論,在免疫學(xué)領(lǐng)域中占據(jù)著十分重要的位置。在傳統(tǒng)的生物醫(yī)學(xué)領(lǐng)域,主要使用生物實(shí)驗(yàn)或者分析臨床病例的方式預(yù)測過敏原。然而生物學(xué)檢測過敏原的方法耗時長、成本高,無法滿足對海量蛋白質(zhì)的預(yù)測的需求。隨著生物學(xué)測序的快速發(fā)展,人們已經(jīng)對大量蛋白質(zhì)進(jìn)行了測序,獲取了它們的序列信息。在這樣的時代背景下,計算生物學(xué)思想逐漸成熟起來。先用計算的方法進(jìn)行過敏原預(yù)測,再佐以生物實(shí)驗(yàn)技術(shù)進(jìn)行檢測和驗(yàn)證是當(dāng)前過敏原預(yù)測的主流方法,將計算預(yù)測方法與生物實(shí)驗(yàn)技術(shù)相結(jié)合極大地加快了過敏原預(yù)測的速度。已有大量的機(jī)構(gòu)和學(xué)者采用計算方法預(yù)測蛋白質(zhì)過敏原。國際食品生物技術(shù)委員會和國際生命科學(xué)變態(tài)反應(yīng)免疫學(xué)研究所提出了用來評價轉(zhuǎn)基因食物中蛋白質(zhì)致敏性的決策樹法,世界衛(wèi)生組織和聯(lián)合國糧農(nóng)組織在此基礎(chǔ)上改進(jìn)了該決策樹,并提出了基于序列相似性的蛋白質(zhì)過敏原預(yù)測方法。即如果一個蛋白質(zhì)序列與某個或某些已知過敏原序列非常相似,那么該蛋白質(zhì)很可能是過敏原。隨后又有學(xué)者提出了基于motif的蛋白質(zhì)過敏原預(yù)測方法,并且得到了更好的預(yù)測結(jié)果。從計算機(jī)領(lǐng)域來考慮蛋白質(zhì)過敏原預(yù)測的問題,會發(fā)現(xiàn)這是一個典型的二分類問題。如果能夠數(shù)值化的衡量蛋白質(zhì)的某些生物化學(xué)特征,就可以使用機(jī)器學(xué)習(xí)的方法對其進(jìn)行分類。廣為采用的數(shù)值特征包括氨基酸組成、二肽組成和B描述符等,都取得了較好的效果。與此同時,支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)等現(xiàn)有的分類方法,也被應(yīng)用于蛋白質(zhì)過敏原預(yù)測中。因此,本文采用主成分分析來提取氨基酸指數(shù)特征中的主要信息,并將其與氨基酸組成結(jié)合起來作為一種新的特征描述符。在大多數(shù)情況下,多數(shù)人表決的判斷結(jié)果往往要比一個人的判斷更為準(zhǔn)確,所以本文嘗試在過敏原預(yù)測中使用組合分類方法,并期待有更好的預(yù)測結(jié)果。為了驗(yàn)證本文的想法,本文設(shè)計了一個對比實(shí)驗(yàn)。本文使用三個特征集合進(jìn)行實(shí)驗(yàn),包括氨基酸組成、氨基酸指數(shù)和兩者相結(jié)合的特征。使用三種分類算法,包括支持向量機(jī)、AdaboostM1和 LogitBoost。每種分類算法分別在每種特征數(shù)據(jù)集下進(jìn)行一次十重交叉驗(yàn)證的實(shí)驗(yàn)。結(jié)果表明,氨基酸組成和氨基酸指數(shù)相結(jié)合的特征比單獨(dú)某一項特征包含了更多的信息,LogitBoost算法的預(yù)測效果相對支持向量機(jī)和AdaboostM1更好。因此,基于組合分類器的過敏原預(yù)測方法是可行的,且優(yōu)于之前的方法。此外,本文建立了一個過敏原預(yù)測網(wǎng)上平臺,為免疫學(xué)和醫(yī)學(xué)研究者提供了過敏原相關(guān)信息的查詢及下載服務(wù),還包括單條或批量蛋白序列的預(yù)測服務(wù)等。
【關(guān)鍵詞】:過敏原預(yù)測 氨基酸組成 氨基酸指數(shù) 組合分類方法 網(wǎng)上平臺
【學(xué)位授予單位】:東北師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.52;R593.1
【目錄】:
- 摘要4-5
- Abstract5-10
- 第一章 緒論10-16
- 1.1 研究背景10-11
- 1.2 研究意義11-12
- 1.3 研究現(xiàn)狀12-15
- 1.3.1 過敏原預(yù)測研究現(xiàn)狀12-14
- 1.3.2 存在問題和挑戰(zhàn)14-15
- 1.4 本文主要工作和組織結(jié)構(gòu)15-16
- 1.4.1 主要工作15
- 1.4.2 章節(jié)安排15-16
- 第二章 蛋白質(zhì)過敏原預(yù)測的理論研究16-24
- 2.1 過敏原預(yù)測基本框架16-19
- 2.1.1 基于序列對比的過敏原預(yù)測16-17
- 2.1.2 基于特征的過敏原預(yù)測方法17-19
- 2.2 過敏原預(yù)測代表方法19-22
- 2.2.1 WHO/FAO方法19
- 2.2.2 Motif-based方法19-20
- 2.2.3 基于指紋描述符的過敏原預(yù)測方法20-22
- 2.2.4 基于支持向量機(jī)的方法22
- 2.3 本章小結(jié)22-24
- 第三章 基于組合分類器的蛋白質(zhì)過敏原預(yù)測方法24-32
- 3.1 實(shí)驗(yàn)數(shù)據(jù)集24-25
- 3.2 特征提取25-26
- 3.3 特征降維26-28
- 3.3.1 主成分分析26-28
- 3.3.2 生成特征28
- 3.4 分類方法28-29
- 3.4.1 組合分類算法28-29
- 3.4.2 Boosting29
- 3.5 交叉驗(yàn)證29-30
- 3.6 預(yù)測算法的評價標(biāo)準(zhǔn)30-31
- 3.7 本章小結(jié)31-32
- 第四章 對比實(shí)驗(yàn)32-36
- 4.1 實(shí)驗(yàn)設(shè)備與環(huán)境32
- 4.2 實(shí)驗(yàn)設(shè)計32
- 4.3 實(shí)驗(yàn)結(jié)果與分析32-34
- 4.3.1 準(zhǔn)確率32-33
- 4.3.2 查全率33-34
- 4.3.3 F1綜合評定指標(biāo)34
- 4.4 附加實(shí)驗(yàn)34-35
- 4.5 本章小結(jié)35-36
- 第五章 蛋白質(zhì)過敏原預(yù)測服務(wù)平臺分析與設(shè)計36-50
- 5.1 可行性研究36
- 5.2 需求分析36-37
- 5.3 概要設(shè)計37
- 5.4 詳細(xì)設(shè)計37-40
- 5.4.1 過敏原信息查詢模塊37-39
- 5.4.2 過敏原預(yù)測模塊39-40
- 5.5 編碼實(shí)現(xiàn)40-43
- 5.5.1 Maven Web APP40-41
- 5.5.2 數(shù)據(jù)庫長連接41
- 5.5.3 Spring MVC框架41-42
- 5.5.4 上傳/下載文件42-43
- 5.5.5 DisplayTag43
- 5.6 系統(tǒng)測試43-49
- 5.6.1 軟硬件環(huán)境測試43
- 5.6.2 性能測試43-44
- 5.6.3 功能測試44-49
- 5.7 本章小結(jié)49-50
- 第六章 總結(jié)與展望50-52
- 6.1 總結(jié)50
- 6.2 展望50-52
- 參考文獻(xiàn)52-54
- 致謝54
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;國外氨基酸在醫(yī)藥方面的發(fā)展動態(tài)[J];醫(yī)藥工業(yè);1976年02期
2 張慧云;樊蘭芝;;氨基酸輸液[J];中原醫(yī)刊;1992年01期
3 余敦壽;氨基酸在醫(yī)藥及食品產(chǎn)業(yè)的發(fā)展趨勢[J];中國食品衛(wèi)生雜志;1999年05期
4 楊靖華,汪云松,王琳,趙靜峰,李祖強(qiáng);苦果中氨基酸的含量[J];云南民族學(xué)院學(xué)報(自然科學(xué)版);1999年03期
5 曾文;;氨基酸VS健康[J];現(xiàn)代健康人;2003年09期
6 紀(jì)慶芳;;氨基酸醫(yī)藥應(yīng)用簡介[J];氨基酸通訊;1980年01期
7 畢蔚如;;簡談氨基酸輸液[J];安徽醫(yī)學(xué);1986年01期
8 何東;;正常人也需補(bǔ)充氨基酸嗎[J];求醫(yī)問藥;2012年05期
9 李文碩;實(shí)施聯(lián)合氨基酸輸液[J];天津護(hù)理;2003年01期
10 馬壽成;;氨基酸并非多多益善[J];家庭科技;2010年04期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 丁明;李偉;張玉梅;王小莉;趙艾;趙曉慧;王培玉;申海生;;中國北方地區(qū)婦女飲食與母乳中氨基酸組成的相關(guān)性分析[A];營養(yǎng)與慢性病——中國營養(yǎng)學(xué)會第七屆理事會青年工作委員會第一次學(xué)術(shù)交流會議論文集[C];2010年
2 李紀(jì)標(biāo);史永紅;;河北山羊絨纖維結(jié)構(gòu)及氨基酸組成的研究[A];第十次全國電子顯微學(xué)會議論文集(Ⅰ)[C];1998年
3 向怡卉;蘇秀榕;;海參體壁及消化道的氨基酸和脂肪酸分析[A];浙江省生物化學(xué)與分子生物學(xué)學(xué)術(shù)交流會論文集[C];2005年
4 趙國琦;賈亞紅;陳小連;孫龍生;趙健亞;周為琴;郭玉華;;不同日糧對山羊可吸收氨基酸組成的影響[A];中國畜牧獸醫(yī)學(xué)會動物營養(yǎng)學(xué)分會——第九屆學(xué)術(shù)研討會論文集[C];2004年
5 馬萬倫;劉茗;劉敏雄;艾曉杰;;ISCA對瘤胃原蟲和微生物蛋白質(zhì)含量及氨基酸組成的影響[A];中國畜牧獸醫(yī)學(xué)會動物營養(yǎng)學(xué)分會第六屆全國會員代表大會暨第八屆學(xué)術(shù)研討會論文集(上)[C];2000年
6 趙國芬;敖長金;趙志恭;張宇宏;趙春艷;;沙蔥和油料籽實(shí)對羊肉中氨基酸組成的影響[A];全國動物生理生化第九次學(xué)術(shù)交流會論文摘要匯編[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前7條
1 馬壽成;氨基酸并非多多益善[N];中國中醫(yī)藥報;2008年
2 ;氨基酸[N];中國畜牧獸醫(yī)報;2008年
3 本報記者 謝玲;應(yīng)試生考前“打吊瓶”補(bǔ)充能量不靠譜[N];中國食品報;2012年
4 記者 張曄邋通訊員 羅靜;鎖定抗艾滋氨基酸“包圍圈”在縮小[N];科技日報;2008年
5 成器;青石斑魚[N];中國畜牧水產(chǎn)報;2000年
6 龔暢;氨基酸斷代法古人類考古“新武器”[N];中國石油報;2004年
7 魏風(fēng);食素者長壽[N];云南政協(xié)報;2000年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 陶淑云;龜足白堊腺結(jié)構(gòu)及膠體的初步研究[D];福建師范大學(xué);2015年
2 李園園;白鰱p38 MAPK,c-fos,c-jun基因克隆及其微囊藻毒素暴露后的表達(dá)分析[D];河南師范大學(xué);2015年
3 楊祺福;海蜇膠原蛋白的提取及其熱穩(wěn)定性研究[D];大連工業(yè)大學(xué);2015年
4 王琳;基于組合分類算法的蛋白質(zhì)過敏原預(yù)測方法研究和平臺開發(fā)[D];東北師范大學(xué);2016年
5 鄧明霞;氨基酸組成對魚膠原性能的影響研究[D];武漢輕工大學(xué);2016年
6 向其林;基于結(jié)構(gòu)特征與偽氨基酸組成的蛋白質(zhì)結(jié)構(gòu)類預(yù)測研究[D];湖南大學(xué);2012年
7 熊鋼;鯽魚LAT2和PEPT1基因克隆、序列分析及組織表達(dá)研究[D];湖南農(nóng)業(yè)大學(xué);2009年
8 代小芳;蘋果籽、南瓜籽對團(tuán)頭魴(Megalobrama amblycephala)生長、部分生理機(jī)能、魚體脂肪酸和氨基酸組成的影響[D];蘇州大學(xué);2010年
9 華國洪;鵝TLR2-1、15基因的克隆、組織表達(dá)譜分析[D];廣東海洋大學(xué);2012年
,本文編號:1068078
本文鏈接:http://sikaile.net/yixuelunwen/nfm/1068078.html