天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的piRNA識(shí)別算法研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-12-14 12:58
  非編碼RNA(ncRNA)是一種從DNA中轉(zhuǎn)錄但不編碼蛋白質(zhì)的功能性RNA,其研究是當(dāng)前生物醫(yī)學(xué)研究中最令人興奮的領(lǐng)域之一。根據(jù)轉(zhuǎn)錄組學(xué)和生物信息學(xué)的研究,有成千上萬(wàn)的ncRNA根據(jù)其功能和長(zhǎng)度被分為不同的類(lèi)別,包括tRNA、rRNA、miRNA、siRNA、piRNA和lncRNA等等。piRNA是不同物種中廣泛存在且數(shù)量龐大的一類(lèi)小非編碼RNA。相比于miRNA和lncRNA的數(shù)據(jù)量有限且已經(jīng)進(jìn)行廣泛研究,對(duì)piRNA的研究目前仍處在基礎(chǔ)階段,主要集中在轉(zhuǎn)錄和轉(zhuǎn)錄后水平,而很少有在翻譯后水平piRNA的功能研究。準(zhǔn)確從非編碼RNA序列中識(shí)別出piRNA是開(kāi)展其后續(xù)功能研究的重要保證。當(dāng)前研究大多基于人工或者工具提取出上千個(gè)特征,然后結(jié)合一些機(jī)器學(xué)習(xí)方法進(jìn)行分類(lèi)識(shí)別,由于特征過(guò)多導(dǎo)致方法重復(fù)性不強(qiáng),并且只能針對(duì)有相應(yīng)特征的一小類(lèi)piRNA使用,整體piRNA識(shí)別準(zhǔn)確率或可靠性有待提高。因此,本文基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(BiLSTM)的組合設(shè)計(jì)了一種深度學(xué)習(xí)網(wǎng)絡(luò)模型,命名為DeepiRNA模型。該模型有效減少了人工對(duì)特征提取的干預(yù),提高了識(shí)別piRNA的準(zhǔn)確率和... 

【文章來(lái)源】:山東農(nóng)業(yè)大學(xué)山東省

【文章頁(yè)數(shù)】:71 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的piRNA識(shí)別算法研究與實(shí)現(xiàn)


piRNA的形成示意圖(王海龍等,2016)

序列,癌癥,數(shù)據(jù)庫(kù)


基于深度學(xué)習(xí)的piRNA序列識(shí)別算法研究與實(shí)現(xiàn)102.3數(shù)據(jù)來(lái)源2.3.1piRNA數(shù)據(jù)庫(kù)piRBase數(shù)據(jù)庫(kù)(WangJetal.,2019),是鄭州大學(xué)闞云超教授團(tuán)隊(duì)搜集整理并構(gòu)建的針對(duì)piRNA數(shù)據(jù)的數(shù)據(jù)庫(kù),涉及21個(gè)物種,總piRNA序列數(shù)量達(dá)到1.7億條,并且物種的基因組也都是更新到2018年的最新版本,其注釋包括疾病,轉(zhuǎn)座子,甲基化等多項(xiàng)參考數(shù)據(jù)。本研究選擇piRBase數(shù)據(jù)庫(kù),因?yàn)樗鼰o(wú)論在序列的數(shù)據(jù)量、物種數(shù)據(jù)量還是對(duì)piRNA的注釋和查閱方面,都處在同類(lèi)數(shù)據(jù)庫(kù)中領(lǐng)先地位(路一平等,2019)。piRBase數(shù)據(jù)庫(kù)網(wǎng)站鏈接:http://www.regulatoryrna.org/database/piRNA/。論文分析piRBase數(shù)據(jù)庫(kù)中的數(shù)據(jù),發(fā)現(xiàn)在其物種上和數(shù)量上提供了最豐富的piRNA數(shù)據(jù),但是根據(jù)國(guó)際上的研究來(lái)說(shuō),盡管有些物種有了最新的piRNA測(cè)序結(jié)果,但是對(duì)于某些常見(jiàn)的有重大經(jīng)濟(jì)價(jià)值的物種研究還是缺乏。從全世界的科研來(lái)看piRNA的研究還是主要圍繞著小鼠,其次是果蠅來(lái)研究,但是值得注意的是,2014-2018年數(shù)據(jù)的更新來(lái)看,對(duì)人的研究卻是增加的最多,新增了14個(gè)數(shù)據(jù)集共8405438條序列,這足以說(shuō)明piRNA序列對(duì)人類(lèi)的影響隨著研究的深入將會(huì)有更有價(jià)值的發(fā)現(xiàn)(路一平等,2019)。圖3piRNA表達(dá)異常導(dǎo)致的癌癥Fig.3CancercausedbyabnormalexpressionofpiRNA如圖3所示,由piRBase數(shù)據(jù)庫(kù)中提供截止到2018年的研究中,由生物實(shí)驗(yàn)或臨床驗(yàn)證的piRNA序列異常導(dǎo)致的癌癥多達(dá)八種,其中,與膀胱癌相關(guān)的piRNA序列數(shù)

卷積,神經(jīng)網(wǎng)絡(luò)


山東農(nóng)業(yè)大學(xué)碩士專(zhuān)業(yè)學(xué)位論文13圖5卷積神經(jīng)網(wǎng)絡(luò)Fig.5convolutionalneuralnetwork在圖像識(shí)別領(lǐng)域取得了成功后,CNN也被應(yīng)用于其它模式識(shí)別任務(wù)。國(guó)顯達(dá)等將卷積神經(jīng)網(wǎng)絡(luò)引入文本分類(lèi)任務(wù)中,與人工設(shè)計(jì)的特征相比,使用CNN提取特征更快捷,同時(shí)預(yù)測(cè)得到的結(jié)果更準(zhǔn)確(國(guó)顯達(dá)等,2020);曾凡鋒等(2020)將卷積神經(jīng)網(wǎng)絡(luò)用于中文新聞分類(lèi),結(jié)果多個(gè)指標(biāo)優(yōu)于傳統(tǒng)機(jī)器學(xué)習(xí)。2.4.2雙向長(zhǎng)短期記憶網(wǎng)絡(luò)雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bi-directionalLongShort-TermMemory,BiLSTM),由前向LSTM與反向LSTM組合而成,其在自然語(yǔ)言處理任務(wù)中常被用來(lái)建模上下文信息。LSTM的全稱(chēng)是LongShort-TermMemory,它是循環(huán)網(wǎng)絡(luò)(RecurrentNeuralNetwork,RNN)的一種,循環(huán)網(wǎng)絡(luò)又稱(chēng)遞歸網(wǎng)絡(luò),由于其設(shè)計(jì)的特點(diǎn),非常適用于對(duì)時(shí)序數(shù)據(jù)的建模,常被用來(lái)文字建模、語(yǔ)音識(shí)別等。圖6循環(huán)神經(jīng)網(wǎng)絡(luò)RNNFig.6RecurrentNeuralNetwork

【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)句級(jí)新聞分類(lèi)算法[J]. 曾凡鋒,李玉珂,肖珂.  計(jì)算機(jī)工程與設(shè)計(jì). 2020(04)
[2]融合主題信息的卷積神經(jīng)網(wǎng)絡(luò)文本分類(lèi)方法研究[J]. 楊銳,陳偉,何濤,張敏,李蕊伶,岳芳.  現(xiàn)代情報(bào). 2020(04)
[3]整合BiLSTM-CRF網(wǎng)絡(luò)和詞典資源的中文電子病歷實(shí)體識(shí)別[J]. 李綱,潘榮清,毛進(jìn),操玉杰.  現(xiàn)代情報(bào). 2020(04)
[4]基于CNN-BiLSTM的消費(fèi)者網(wǎng)絡(luò)評(píng)論情感分析[J]. 國(guó)顯達(dá),那日薩,崔少澤.  系統(tǒng)工程理論與實(shí)踐. 2020(03)
[5]改進(jìn)biLSTM網(wǎng)絡(luò)的短文本分類(lèi)方法[J]. 李文慧,張英俊,潘理虎.  計(jì)算機(jī)工程與設(shè)計(jì). 2020(03)
[6]基于CNN的多標(biāo)簽文本分類(lèi)與研究[J]. 萬(wàn)磊,張立霞,時(shí)宏偉.  現(xiàn)代計(jì)算機(jī). 2020(08)
[7]MIWI/piRNA激活小鼠精子細(xì)胞mRNA翻譯的新功能機(jī)制研究[J]. 戴鵬,劉默芳.  中國(guó)細(xì)胞生物學(xué)學(xué)報(bào). 2020(02)
[8]基于Attention-BiLSTM的情感分類(lèi)模型[J]. 黃奇景,付偉.  電子技術(shù)與軟件工程. 2020(03)
[9]生物信息學(xué)在農(nóng)業(yè)領(lǐng)域的應(yīng)用及展望[J]. 徐佳瑩,寧璐.  安徽農(nóng)學(xué)通報(bào). 2019(22)
[10]基于CNN和BiLSTM的文本情感分類(lèi)[J]. 武姍姍.  信息記錄材料. 2019(11)

博士論文
[1]白背飛虱非編碼RNA的鑒定和特征分析[D]. 常朝霞.中國(guó)科學(xué)技術(shù)大學(xué) 2019
[2]piRNA鑒定、數(shù)據(jù)仿真及與疾病的關(guān)聯(lián)分析[D]. 劉雅君.西安電子科技大學(xué) 2017
[3]面向不平衡數(shù)據(jù)的特征選擇與半監(jiān)督分類(lèi)算法研究[D]. 杜利敏.西南交通大學(xué) 2017
[4]非編碼RNA的二級(jí)結(jié)構(gòu)預(yù)測(cè)與結(jié)構(gòu)化RNA的檢測(cè)[D]. 徐成振.哈爾濱工程大學(xué) 2017
[5]基于機(jī)器學(xué)習(xí)算法的非編碼RNA識(shí)別[D]. 駢聰.南京農(nóng)業(yè)大學(xué) 2016
[6]Docker生物云計(jì)算平臺(tái)分析松材線蟲(chóng)高通量測(cè)序數(shù)據(jù)的應(yīng)用研究[D]. 程功.東北林業(yè)大學(xué) 2015

碩士論文
[1]地方消防政務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 胡濤.華東交通大學(xué) 2020
[2]piRNA數(shù)據(jù)庫(kù)piRBase的版本升級(jí)及數(shù)據(jù)完善[D]. 路一平.鄭州大學(xué) 2019
[3]PiRNAs作為診斷NOA患者睪丸內(nèi)殘存精子的生物標(biāo)志物的探索性研究[D]. 曹聰聰.華中科技大學(xué) 2019
[4]深度學(xué)習(xí)在植物lncRNA識(shí)別中的研究與應(yīng)用[D]. 常征.大連理工大學(xué) 2019
[5]利用高通量測(cè)序技術(shù)和生物信息學(xué)分析人和動(dòng)物病毒宏基因組與全基因組[D]. 王媛媛.安徽醫(yī)科大學(xué) 2019
[6]長(zhǎng)非編碼RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)方法的研究與實(shí)現(xiàn)[D]. 戴丹.揚(yáng)州大學(xué) 2018
[7]家蠶大腦中piRNA的鑒定及功能探索[D]. 劉曉.南陽(yáng)師范學(xué)院 2018
[8]基于遺傳算法的加權(quán)集成學(xué)習(xí)及其對(duì)piRNA的預(yù)測(cè)[D]. 羅龍強(qiáng).武漢大學(xué) 2017
[9]基于轉(zhuǎn)座子互作信息的piRNA預(yù)測(cè)算法及二化螟piRNA分析[D]. 王凱.南京農(nóng)業(yè)大學(xué) 2014



本文編號(hào):2916447

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2916447.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶007f8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com