天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

面向全基因組的改進參數(shù)服務器研究

發(fā)布時間:2017-12-01 21:27

  本文關(guān)鍵詞:面向全基因組的改進參數(shù)服務器研究


  更多相關(guān)文章: 全基因組 參數(shù)服務器 機器學習 FTRL 并行計算


【摘要】:隨著高通量測序成本的逐年下降,針對全基因組數(shù)據(jù)的研究開始火熱發(fā)展。由于數(shù)據(jù)規(guī)模的激增,以往基于傳統(tǒng)統(tǒng)計分析的方法表現(xiàn)出工作量巨大、效率低下等問題,面向全基因組的大規(guī)模機器學習成為研究和發(fā)展的重要方向。面對這一問題,不少組織機構(gòu)嘗試采用如Hadoop、Spark等通用分布式計算框架,效果并不太理想。效果不理想的主要原因在于框架對全基因組機器學習問題的適用性不佳。因此,本文提出了采用基于參數(shù)服務器的分布式計算架構(gòu)來應對全基因組機器學習問題。參數(shù)服務器是近兩年新興的一種分布式機器學習框架的抽象,目前在大型廣告系統(tǒng)和人工智能系統(tǒng)中有著深入的應用。這種概念最早于2010年由Alex Smola在其設(shè)計的并行LDA框架中被提出。在此之后,參數(shù)服務器于2012年作為Google Brain的解決方案被業(yè)內(nèi)所廣泛關(guān)注。其架構(gòu)的核心設(shè)計是將模型參數(shù)的存儲和更新上升為獨立組件,并采用異步機制提升處理能力。通過這種設(shè)計,有效的解決了大規(guī)模機器學習求解過程中參數(shù)收斂非均性所帶來的低效迭代問題,大大減少了在通信、協(xié)調(diào)、等待過程中的資源浪費。這種優(yōu)化同時也使得模型求解效率得以真正隨著機器的增加而能力線性提升,從而為全基因組機器學習問題的解決提供新的思路。本文首先系統(tǒng)闡述分析了全基因組機器學習問題在計算機技術(shù)上的難點,并總結(jié)探討了已有主流分布式計算框架抽象的特點和適用性。然后針對全基因組機器學習效率問題,本文改進了傳統(tǒng)參數(shù)服務器的架構(gòu),引入了FTRL算法,設(shè)計實現(xiàn)了一種改進參數(shù)服務器模型GW-PS。該模型能引入稀疏性,防止過擬合,從而更好的適應全基因組數(shù)據(jù)。在此基礎(chǔ)上,根據(jù)基因序列特異性識別的切實需求,本文還改進了傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并分別在改進參數(shù)服務器GW-PS和Spark架構(gòu)上進行了詳細的模型訓練效率對比。實驗證明,改進參數(shù)服務器GW-PS對于全基因組機器學習問題在效率和性能上都要優(yōu)于傳統(tǒng)的Spark架構(gòu),為參數(shù)服務器這種最新技術(shù)在生物信息學問題上的可行性做出了探索。
【學位授予單位】:云南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q811.4;TP181

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 王玨,石純一;機器學習研究[J];廣西師范大學學報(自然科學版);2003年02期

2 張震;李軍利;;機器學習方法及其在生物信息學中的應用[J];吉首大學學報(自然科學版);2006年04期

3 許程;;機器學習的主要策略與基本結(jié)構(gòu)[J];科技資訊;2010年03期

4 黃蔚;;淺析機器學習及其在教育中的應用[J];科技信息;2011年18期

5 曹加恒;湯怡群;姚唐;;機器學習研究[J];武漢大學學報(自然科學版);1988年01期

6 林士敏;機器學習概況[J];廣西師范大學學報(自然科學版);1989年02期

7 盧美律;張渡;;機器學習:理論、方法及應用[J];科學;1995年02期

8 羅芳;李志亮;;基于分類的機器學習方法中的決策樹算法[J];寧德師專學報(自然科學版);2009年01期

9 李鈞濤;楊瑞峰;左紅亮;;統(tǒng)計機器學習研究[J];河南師范大學學報(自然科學版);2010年06期

10 黃健;;何清:挖掘數(shù)據(jù)開啟新知[J];科學中國人;2013年12期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 王玨;;歸納機器學習[A];2001年中國智能自動化會議論文集(上冊)[C];2001年

2 王昊;李銀波;紀志梁;;利用機器學習方法預測嚴重藥物不良反應-呼吸困難[A];中國化學會第28屆學術(shù)年會第13分會場摘要集[C];2012年

3 吳滄浦;;智能系統(tǒng)與機器學習的新領(lǐng)域[A];西部大開發(fā) 科教先行與可持續(xù)發(fā)展——中國科協(xié)2000年學術(shù)年會文集[C];2000年

4 周晴杰;徐立鴻;吳啟迪;;機器學習串級結(jié)構(gòu)的初步探討[A];1998年中國控制會議論文集[C];1998年

5 李剛;郭崇慧;林鴻飛;楊志豪;唐煥文;;基于詞典法和機器學習法相結(jié)合的蛋白質(zhì)名識別[A];大連理工大學生物醫(yī)學工程學術(shù)論文集(第2卷)[C];2005年

6 徐禮勝;李乃民;王寬全;張冬雨;耿斌;姜曉睿;陳超海;羅貴存;;機器學習在中醫(yī)計算機診斷識別系統(tǒng)中的應用思考[A];第一屆全國中西醫(yī)結(jié)合診斷學術(shù)會議論文選集[C];2006年

7 蔡健平;林世平;;基于機器學習的詞語和句子極性分析[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年

8 黃金鐵;李景銀;周建常;;對高爐爐況評價模型參數(shù)的機器學習——一個三類線性模式分類器的實現(xiàn)[A];1995中國控制與決策學術(shù)年會論文集[C];1995年

9 程國建;蔡磊;潘華賢;;核向量機在大規(guī)模機器學習中的應用[A];第十一屆中國青年信息與管理學者大會論文集[C];2009年

10 張鈸;張鈴;;統(tǒng)計學習理論及其應用[A];2001年中國智能自動化會議論文集(上冊)[C];2001年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 黎驪/文 [美] Tom M.Mitchell 著;機器學習與智能化社會[N];中國郵政報;2003年

2 IBM大數(shù)據(jù)專家 James Kobielus 范范 編譯;機器學習已成為大數(shù)據(jù)基石[N];網(wǎng)絡(luò)世界;2014年

3 本報記者 房琳琳;合久必分:分布式“機器學習”應運而生[N];科技日報;2014年

4 雨辰;機器學習類圖書為什么火爆[N];中華讀書報;2014年

5 百度公司技術(shù)副總監(jiān) 多媒體部負責人 余凱;深度學習與多媒體搜索技術(shù)演進[N];中國信息化周報;2013年

6 本報記者 余建斌;機器學習與互聯(lián)網(wǎng)搜索[N];人民日報;2011年

7 本報記者 張曄邋通訊員 李瑋;周志華:永不墨守成規(guī)[N];科技日報;2008年

8 記者  彭德倩;機器學習精度提升近6個百分點[N];解放日報;2006年

9 本報記者 閔杰;大數(shù)據(jù)熱 高端人才缺[N];中國電子報;2013年

10 沈建苗 編譯;如何成為大數(shù)據(jù)科學家[N];計算機世界;2013年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 董春茹;機器學習中的權(quán)重學習與差分演化[D];華南理工大學;2015年

2 姚明臣;機器學習和神經(jīng)網(wǎng)絡(luò)學習中的若干問題研究[D];大連理工大學;2016年

3 趙玉鵬;機器學習的哲學探索[D];大連理工大學;2010年

4 胡巍;面向格結(jié)構(gòu)的機器學習[D];上海交通大學;2009年

5 張義榮;基于機器學習的入侵檢測技術(shù)研究[D];國防科學技術(shù)大學;2005年

6 錢線;快速精確的結(jié)構(gòu)化機器學習方法研究[D];復旦大學;2010年

7 梁錫軍;稀疏優(yōu)化在機器學習中的若干應用[D];大連理工大學;2013年

8 蔣剛;核機器學習方法若干問題研究[D];西南交通大學;2006年

9 陳慧靈;面向智能決策問題的機器學習方法研究[D];吉林大學;2012年

10 周偉達;核機器學習方法研究[D];西安電子科技大學;2003年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 毛海斌;基于半監(jiān)督機器學習的情感分類領(lǐng)域適應問題研究[D];南京理工大學;2015年

2 安軍輝;基于微博數(shù)據(jù)的微博用戶性別判斷研究[D];華中師范大學;2015年

3 陳召陽;基于機器學習的改性麥槽吸附重金屬構(gòu)效關(guān)系模型研究[D];江西理工大學;2014年

4 王成;基于半監(jiān)督機器學習的文本情感分析技術(shù)[D];南京理工大學;2015年

5 孫科;基于Spark的機器學習應用框架研究與實現(xiàn)[D];上海交通大學;2015年

6 劉江龍;基于機器學習的射頻指紋定位方法研究[D];電子科技大學;2015年

7 張蕾;基于機器學習的網(wǎng)絡(luò)輿情采集技術(shù)研究與設(shè)計[D];電子科技大學;2014年

8 施宇;基于數(shù)據(jù)挖掘和機器學習的木馬檢測系統(tǒng)設(shè)計與實現(xiàn)[D];電子科技大學;2014年

9 施應敏;基于機器學習的Femtocell信道頻譜與功率資源分配算法的研究[D];南京郵電大學;2015年

10 張柯;基于機器學習的錯誤定位方法研究[D];南京航空航天大學;2015年

,

本文編號:1242542

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1242542.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶68f12***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com