面向壓縮生物基因數(shù)據(jù)的高效的查詢方法
本文關(guān)鍵詞:面向壓縮生物基因數(shù)據(jù)的高效的查詢方法
更多相關(guān)文章: 基因數(shù)據(jù) 大數(shù)據(jù) 可伸縮性 數(shù)據(jù)壓縮 并行計(jì)算
【摘要】:隨著下一代、第三代等測(cè)序技術(shù)的快速發(fā)展,DNA等生物序列數(shù)據(jù)快速增長(zhǎng).如何高效地處理這些大數(shù)據(jù)是目前所面臨的一個(gè)挑戰(zhàn).研究發(fā)現(xiàn),這些生物序列數(shù)據(jù)盡管很大,但是不同數(shù)據(jù)之間具有很高的相似性.因此可以通過(guò)保存這些基因串同一個(gè)基準(zhǔn)序列之間的差異來(lái)減少存儲(chǔ)的代價(jià).最新的研究發(fā)現(xiàn),可以在這些壓縮的數(shù)據(jù)上直接進(jìn)行查詢,而不需要解壓縮.研究的目標(biāo)是進(jìn)一步提高索引和查詢的可伸縮性,從而滿足日益增長(zhǎng)的大數(shù)據(jù)需要.首先在現(xiàn)有方法的基礎(chǔ)上,對(duì)基準(zhǔn)序列進(jìn)行了壓縮存儲(chǔ).基于該壓縮數(shù)據(jù),提出了一系列優(yōu)化查詢方法以高效地支持任意長(zhǎng)度序列的精確和近似查詢.在此基礎(chǔ)上,進(jìn)一步對(duì)原有方法進(jìn)行改進(jìn),利用并行計(jì)算來(lái)提高對(duì)大數(shù)據(jù)的查詢效率.最后,實(shí)驗(yàn)研究展示了所提方法的高效性.
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;
【關(guān)鍵詞】: 基因數(shù)據(jù) 大數(shù)據(jù) 可伸縮性 數(shù)據(jù)壓縮 并行計(jì)算
【基金】:國(guó)家自然科學(xué)基金優(yōu)秀青年基金(61322208);國(guó)家自然科學(xué)基金(61272178,61572122,61532021) 國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973)(2012CB316201)~~
【分類(lèi)號(hào)】:TP311.13
【正文快照】:
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 林學(xué)民;王煒;;集合和字符串的相似度查詢[J];計(jì)算機(jī)學(xué)報(bào);2011年10期
2 朱揚(yáng)勇;熊峗;;DNA序列數(shù)據(jù)挖掘技術(shù)[J];軟件學(xué)報(bào);2007年11期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張素莉;;基于部分連接神經(jīng)網(wǎng)絡(luò)的序列數(shù)據(jù)分類(lèi)算法研究[J];現(xiàn)代電子技術(shù);2016年09期
2 姜建華;楊玉免;邊海燕;康嘉容;王麗敏;劉穎;;改進(jìn)DBSCAN聚類(lèi)算法在電子商務(wù)網(wǎng)站評(píng)價(jià)中的應(yīng)用[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2016年02期
3 王佳英;王斌;楊曉春;;面向壓縮生物基因數(shù)據(jù)的高效的查詢方法[J];軟件學(xué)報(bào);2016年07期
4 楊良斌;;數(shù)據(jù)挖掘領(lǐng)域研究現(xiàn)狀與趨勢(shì)的可視化分析[J];圖書(shū)情報(bào)工作;2015年S2期
5 郭彥明;陳黎飛;郭躬德;;DNA序列的二階隱馬爾科夫模型分類(lèi)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2015年09期
6 李圣文;凌微;龔君芳;周長(zhǎng)征;;一種基于熵的文本相似性計(jì)算方法[J];計(jì)算機(jī)應(yīng)用研究;2016年03期
7 丁學(xué)君;;微博輿情話題傳播行為預(yù)測(cè)研究[J];中國(guó)管理信息化;2015年17期
8 梁路;王彪;王劍輝;劉冬寧;;基于細(xì)精度關(guān)聯(lián)規(guī)則挖掘的電信客戶流失分析[J];智能系統(tǒng)學(xué)報(bào);2015年03期
9 陳一帆;趙翔;何培俊;張維明;唐九陽(yáng);;BMGSJoin:一種基于MapReduce的圖相似度連接算法[J];模式識(shí)別與人工智能;2015年05期
10 肖雨;崔榮一;懷麗波;;一種融合位置信息的字符串相似度度量方法[J];計(jì)算機(jī)應(yīng)用研究;2015年11期
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 王鏑;趙毅;陳白塵;王國(guó)仁;;DNA序列中基于后繼數(shù)組索引的SATR查找算法[J];東北大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
2 ;A measure of semantic similarity between gene ontology terms based on semantic pathway covering[J];Progress in Natural Science;2006年07期
3 王國(guó)仁;葛健;徐恒宇;鄭若石;;基于二分頻率變換的序列相似性查詢處理技術(shù)[J];軟件學(xué)報(bào);2006年02期
4 王鏑;王國(guó)仁;陳白塵;吳青泉;王斌;韓冬紅;;一種可用于生物序列分析的輕量級(jí)索引結(jié)構(gòu)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
5 李冬冬;王正志;倪青山;;一種有效的重復(fù)序列識(shí)別算法[J];生物信息學(xué);2005年04期
6 鄧緒斌;朱揚(yáng)勇;;ReDE:一個(gè)基于正則表達(dá)式的生物數(shù)據(jù)抽取方法[J];計(jì)算機(jī)研究與發(fā)展;2005年12期
7 ;Semantic Search among Heterogeneous Biological Databases Based on Gene Ontology[J];Acta Biochimica et Biophysica Sinica;2004年05期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 安世虎;一種有效的報(bào)表查詢方法[J];計(jì)算機(jī)應(yīng)用研究;1995年02期
2 王侃夫;王慧;顧曉春;;基于總線結(jié)構(gòu)的住戶抄表查詢方法和裝置研究[J];上海電機(jī)學(xué)院學(xué)報(bào);2007年04期
3 許景科;孫煥良;王永會(huì);宋曉宇;;一種基于知識(shí)的多層概念化數(shù)據(jù)查詢方法[J];小型微型計(jì)算機(jī)系統(tǒng);2012年07期
4 莊麗娟,張玉民;Visual FoxPro6.0的復(fù)合查詢方法設(shè)計(jì)[J];佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年02期
5 程飛;;基于云計(jì)算的圖書(shū)數(shù)據(jù)庫(kù)查詢方法研究[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2013年07期
6 周千明;王巧俠;朱欣娟;;通用動(dòng)態(tài)多條件查詢方法的研究與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2011年04期
7 范軍;網(wǎng)上查詢方法淺談[J];電腦愛(ài)好者;1998年13期
8 李久仲;石碩;沈軼;;基于集合分析的數(shù)據(jù)查詢方法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年12期
9 史新華;韋思惠;;期刊數(shù)據(jù)庫(kù)索引與文章查詢方法[J];廣西物理;2012年01期
10 李占宣;;數(shù)據(jù)庫(kù)中面向復(fù)雜應(yīng)用的查詢方法[J];電腦學(xué)習(xí);2009年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前8條
1 王斌;李保棟;;電力營(yíng)銷(xiāo)決策支持系統(tǒng)中的查詢方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
2 黃邦宇;吳效明;周靜;;島礁部隊(duì)健康管理多字段數(shù)據(jù)庫(kù)的多表查詢方法[A];中國(guó)生物醫(yī)學(xué)工程學(xué)會(huì)第六次會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文摘要匯編[C];2004年
3 黃光安;肖璐;張亮;施伯樂(lè);;一種基于文檔編碼的XML優(yōu)化查詢方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
4 廖順和;樂(lè)嘉錦;;一種類(lèi)K-means算法的高效近似查詢方法研究[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年
5 翁偉;薛永生;段江嬌;黃震華;;一種基于交叉鏈表的文檔查詢方法[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年
6 李興東;姜守旭;張碩;;一種處理圖數(shù)據(jù)庫(kù)中超圖集合的查詢方法[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
7 何震瀛;李建中;高宏;;Web數(shù)據(jù)倉(cāng)庫(kù)的異步迭代查詢方法(英文)[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
8 王敬貴;蘇奮振;楊曉梅;杜云艷;仉天宇;;基于Ontology的空間知識(shí)查詢方法研究[A];第十四屆全國(guó)遙感技術(shù)學(xué)術(shù)交流會(huì)論文摘要集[C];2003年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前4條
1 ;防偽查詢方法[N];中國(guó)質(zhì)量報(bào);2003年
2 ;部分省市高考分?jǐn)?shù)查詢方法[N];中國(guó)教育報(bào);2006年
3 金愛(ài)玲;甘肅:管局工商聯(lián)手治理[N];人民郵電;2005年
4 本報(bào)記者 秦延安 通訊員 孫少軍;許可建設(shè)項(xiàng)目管理信息系統(tǒng)投入使用[N];中國(guó)水利報(bào);2008年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李雪城;大規(guī)模DAG圖可達(dá)查詢與優(yōu)化方法研究[D];遼寧大學(xué);2015年
2 呂倩楠;面向多維對(duì)象的反k近鄰e笥行Р檠椒╗D];吉林大學(xué);2012年
3 高世偉;三維空間中基于對(duì)象方位的方向關(guān)系查詢方法研究[D];燕山大學(xué);2010年
4 辛婷婷;K-匿名數(shù)據(jù)的查詢方法研究[D];東華大學(xué);2012年
5 彭川;反k最遠(yuǎn)鄰查詢方法的研究[D];燕山大學(xué);2012年
6 任彩平;路網(wǎng)中連續(xù)路過(guò)近鄰的查詢方法[D];燕山大學(xué);2010年
7 李艷群;網(wǎng)絡(luò)教育資源的建設(shè)及查詢方法研究[D];山東師范大學(xué);2005年
8 李若愚;空間數(shù)據(jù)庫(kù)中基于R-樹(shù)的最近鄰查詢方法研究[D];哈爾濱工程大學(xué);2010年
9 王璐;路網(wǎng)中互近鄰查詢和最大化雙色反近鄰查詢方法研究[D];燕山大學(xué);2010年
10 丁曉劍;對(duì)大信息量XML文檔查詢方法的研究[D];西安理工大學(xué);2006年
,本文編號(hào):971837
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/971837.html