基因組中最大唯一匹配的查找算法研究
本文關鍵詞:基于Android的手機桌面搜索引擎研究與設計,由筆耕文化傳播整理發(fā)布。
《西安電子科技大學》 2009年
基因組中最大唯一匹配的查找算法研究
王學
【摘要】:最大唯一匹配在基因序列比對中有著重要的作用。它可以從相互重疊的序列片斷中重構DNA的完整序列,可在各種試驗條件下從探測數(shù)據(jù)中決定物理和基因圖存貯,可遍歷和比較數(shù)據(jù)庫中的DNA序列來判斷兩個或多個序列的相似性。 本文首先簡單介紹了國內(nèi)外現(xiàn)有的部分研究成果,并在詳細介紹后綴樹和后綴數(shù)組的基礎上,給出了一種基于后綴數(shù)組的最大唯一匹配(Maximal Unique Matches簡寫為MUM)查找及其排序的方法。算法首先構造出兩條基因序列的后綴數(shù)組,然后通過兩兩比較后綴數(shù)組中相鄰的后綴獲得相鄰后綴的最長公共前綴(Longest Common Prefixes簡寫為LCP)值,然后通過掃描滿足MUM條件的LCP值求出MUM,最后利用最長遞增子序列(Longest Increasing Subsequences簡寫為LIS)算法對獲得的MUM進行排序。測試結果表明,在同等規(guī)模的數(shù)據(jù)量下,基于后綴數(shù)組的算法相比基于后綴樹的算法在空間上具有顯著優(yōu)勢,基于后綴數(shù)組的MUM查找及其排序方法可以節(jié)省28%的空間。
【關鍵詞】:
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2009
【分類號】:TP301.6
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網(wǎng)充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 周文鵑;劉自偉;陳昌平;;基于DC3算法的非編碼區(qū)序列最大串聯(lián)重復識別[J];兵工自動化;2009年03期
2 喬百友,葛健,王國仁,韓東紅;并行后綴樹的構造及查詢算法[J];東北大學學報;2004年03期
3 閆雷鳴;孫志揮;張柏禮;;一種時序數(shù)據(jù)局部相關對象聚類算法[J];東南大學學報(自然科學版);2007年05期
4 陳昌平;劉自偉;周文鵑;彭春艷;;串聯(lián)重復序列識別方法研究[J];電腦知識與技術;2008年31期
5 陳虎;陳書明;陳勝剛;谷會濤;陳小文;;GISEES:面向嵌入式系統(tǒng)的擴展指令集自動產(chǎn)生方法[J];電子學報;2011年09期
6 彭靜;翟英;馮爽;;后綴樹算法在輿情聚類中的應用[J];河北科技大學學報;2012年01期
7 柳渤;李建中;;基于廣義后綴樹的最長重復子模式算法[J];航天控制;2008年02期
8 閆雷鳴;孫志揮;吳英杰;張柏禮;;聯(lián)合聚類非線性相關的時序基因表達數(shù)據(jù)[J];計算機研究與發(fā)展;2008年11期
9 胡海龍;孫晨;赫楓齡;左萬利;;基于改進后綴樹算法中英文聚類引擎的實現(xiàn)[J];吉林大學學報(理學版);2009年02期
10 劉燕兵;譚建龍;郭莉;;可動態(tài)增刪關鍵詞的串匹配算法[J];計算機工程與應用;2005年35期
中國重要會議論文全文數(shù)據(jù)庫 前6條
1 ;A Chinese Web Page Clustering Algorithm Based on the Suffix Tree[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
2 龔才春;賀敏;張華平;許洪波;程學旗;;大規(guī)模語料的頻繁模式快速發(fā)現(xiàn)算法[A];全國網(wǎng)絡與信息安全技術研討會論文集(上冊)[C];2007年
3 曾依靈;許洪波;;網(wǎng)絡熱點信息發(fā)現(xiàn)研究[A];全國網(wǎng)絡與信息安全技術研討會論文集(下冊)[C];2007年
4 郭莉;劉燕兵;譚建龍;;基于存儲壓縮的多模式串匹配算法[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年
5 張龍;周傲英;鄭仕輝;梁宇奇;;一種可行的層次型XML倉庫索引結構[A];第十八屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2001年
6 包小源;宋再生;唐世渭;楊冬青;王騰蛟;;SuffIndex——一種基于后綴樹的XML索引結構[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2004年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 李炳龍;文檔碎片取證關鍵技術研究[D];解放軍信息工程大學;2007年
2 陳曦;基于子串的文本分割與主題標注研究[D];武漢大學;2009年
3 劉玉國;基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關鍵技術研究[D];山東大學;2011年
4 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學;2010年
5 陳虎;面向應用的指令集處理器關鍵技術研究[D];國防科學技術大學;2011年
6 趙基;基于數(shù)據(jù)挖掘的銀行客戶分析管理關鍵技術研究[D];浙江大學;2005年
7 劉潔;對等網(wǎng)絡環(huán)境下基于語義的異構數(shù)據(jù)管理模型[D];中國科學院研究生院(計算技術研究所);2005年
8 梁作鵬;面向Web的XML檢索關鍵技術研究[D];東南大學;2005年
9 何麗;基于Web挖掘的決策支持系統(tǒng)模型研究[D];天津大學;2005年
10 滕偉;面向Web信息集成的Web信息抽取中若干關鍵問題的研究[D];上海交通大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 李英斌;模體發(fā)現(xiàn)問題中投影算法的研究[D];西安電子科技大學;2009年
2 王敬艷;DNA序列中串聯(lián)重復體查找算法研究[D];西安電子科技大學;2009年
3 黃影;生物序列索引結構構造算法研究[D];西安電子科技大學;2009年
4 王洋;高效的motif識別方法研究[D];北京交通大學;2011年
5 趙穎;基于Ontology的Web文本聚類研究[D];西華大學;2011年
6 公衍磊;跨站腳本漏洞與攻擊的客戶端檢測方法研究[D];大連理工大學;2011年
7 陳飛;聚類搜索引擎關鍵技術的研究[D];北京郵電大學;2011年
8 丁溪源;基于大規(guī)模語料的中文新詞抽取算法的設計與實現(xiàn)[D];南京理工大學;2011年
9 肖鵬;基于Android的手機桌面搜索引擎研究與設計[D];電子科技大學;2011年
10 張維華;基于聚類的中文元搜索引擎技術研究[D];南京郵電大學;2011年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁四成;;C語言程序—指針算法分析[J];宿州教育學院學報;2011年02期
2 杜素芳;韓利娟;;C#索引器教學法探討[J];濮陽職業(yè)技術學院學報;2011年03期
3 何曉敏;關于C語言教學中指針的探討[J];長沙大學學報;1999年04期
4 楊風暴,王召巴;在實模式下編程使用擴充內(nèi)存[J];山西電子技術;1999年01期
5 陳琦;C程序設計中常見問題辨析[J];燕山大學學報;2000年03期
6 荊霜雁,車紫輝;C語言中多維數(shù)組指針處理技術及應用[J];保定師專學報;2001年02期
7 李娜;仁慶道爾吉;曹軍;;一種求第K個元素新算法的實現(xiàn)[J];陰山學刊(自然科學版);2005年01期
8 馮林;鄒繼軍;;非接觸式ID卡浴室收費系統(tǒng)設計[J];微計算機信息;2008年23期
9 陳新一;唐文玲;;二分搜索排序的算法研究[J];科技信息(學術研究);2008年27期
10 沙勝賢,譚振江;Turbo-Prolog程序設計的某些方法[J];吉林師范大學學報(自然科學版);1993年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 黃紀武;毛澤華;李松濤;張錦雄;;SPMD并行查找算法的MPI實現(xiàn)[A];廣西計算機學會——2004年學術年會論文集[C];2004年
2 郝軍軍;郝五零;;Levy飛行查找算法[A];第五屆全國復雜網(wǎng)絡學術會議論文(摘要)匯集[C];2009年
3 許曉峰;金澈清;高明;周傲英;;面向大型數(shù)據(jù)集合的關鍵分類查找算法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2009年
4 駱雄武;萬小軍;楊建武;吳於茜;;基于后綴樹的Web檢索結果聚類標簽生成方法[A];第四屆全國信息檢索與內(nèi)容安全學術會議論文集(上)[C];2008年
5 張常有;秦曉靜;李文清;曹元大;;一種面向對等網(wǎng)絡的Web服務快速查找算法[A];2009年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2009年
6 黃紀武;毛澤華;李松濤;張錦雄;;SPMD并行查找算法的MPI實現(xiàn)[A];廣西計算機學會2004年學術年會論文集[C];2004年
7 務孟慶;高軍;王騰蛟;楊冬青;;WD-STC:一種基于網(wǎng)絡詞典的WEB新聞文檔后綴樹聚類算法[A];全國網(wǎng)絡與信息安全技術研討會論文集(上冊)[C];2007年
8 涂錕;顧乃杰;董萬利;;分布存儲環(huán)境下的基于后綴數(shù)組的串匹配算法[A];2005年“數(shù)字安徽”博士科技論壇論文集[C];2005年
9 尚鳳軍;;一種IP數(shù)據(jù)包快速分類算法[A];第十七屆全國過路控制會議論文集[C];2006年
10 尚鳳軍;唐紅;潘英俊;;一種串行IP分類算法研究[A];第九屆全國青年通信學術會議論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 高軍;[N];中國電腦教育報;2008年
2 曾;[N];計算機世界;2002年
3 魏偉;[N];電腦報;2009年
4 馬嚴;[N];中國電腦教育報;2003年
5 蔡昌;[N];中國會計報;2009年
6 曹悟爾;[N];網(wǎng)絡世界;2005年
7 廣安職業(yè)技術學院 楊志倫;[N];廣安日報;2008年
8 山東萊蕪鋼城雙泉路學校 張志國;[N];中國電腦教育報;2008年
9 艾緹;[N];中國電子報;2009年
10 符聞;[N];國防時報;2010年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 梁作鵬;面向Web的XML檢索關鍵技術研究[D];東南大學;2005年
2 龔才春;短文本語言計算的關鍵技術研究[D];中國科學院研究生院(計算技術研究所);2008年
3 高茂庭;文本聚類分析若干問題研究[D];天津大學;2007年
4 王振興;NGI高性能路由器轉發(fā)處理算法與實現(xiàn)[D];南京理工大學;2004年
5 余小高;電子商務環(huán)境中分布式數(shù)據(jù)挖掘的研究[D];武漢理工大學;2007年
6 楊瑞龍;基于短語特征的Web文檔聚類方法研究[D];重慶大學;2010年
7 趙華;多模型下的近似字符串匹配算法研究[D];華中科技大學;2013年
8 何麗;基于Web挖掘的決策支持系統(tǒng)模型研究[D];天津大學;2005年
9 程勝;移動Ad hoc網(wǎng)絡中虛擬骨干網(wǎng)技術的研究[D];北京郵電大學;2003年
10 尹傳環(huán);結構化數(shù)據(jù)核函數(shù)的研究[D];北京交通大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王學;基因組中最大唯一匹配的查找算法研究[D];西安電子科技大學;2009年
2 趙麗紅;后綴數(shù)組在維、哈、柯搜索引擎中的應用[D];新疆大學;2012年
3 王堅;基于后綴數(shù)組的滑動窗口匹配壓縮改進算法研究[D];華中科技大學;2012年
4 解洋;ATN中信任證關鍵技術的研究[D];哈爾濱工程大學;2010年
5 董麗霞;基因組比對中若干改進算法研究[D];西安電子科技大學;2009年
6 王智強;高速路由查找算法研究[D];中國人民解放軍信息工程大學;2003年
7 謝可心;P2P網(wǎng)絡中分類數(shù)據(jù)查找算法的研究與實現(xiàn)[D];東北大學;2008年
8 李歡;利用領域特性擴展的kd-tree及其查找算法[D];河北大學;2011年
9 李建祥;智能網(wǎng)頁推薦系統(tǒng)的相關技術研究[D];西南交通大學;2004年
10 史慶慶;基于后綴數(shù)組的克隆代碼檢測研究[D];內(nèi)蒙古師范大學;2013年
本文關鍵詞:基于Android的手機桌面搜索引擎研究與設計,由筆耕文化傳播整理發(fā)布。
,本文編號:189981
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/189981.html