天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向生物網(wǎng)絡(luò)的并行關(guān)聯(lián)搜索算法研究

發(fā)布時(shí)間:2020-06-09 12:43
【摘要】:隨著生物醫(yī)療大數(shù)據(jù)的不斷增長,用戶對(duì)生物醫(yī)療大數(shù)據(jù)的搜索需求也隨之增長,但是具體生物蘊(yùn)含的特定語義使得傳統(tǒng)的搜索引擎失效,無法為醫(yī)療大數(shù)據(jù)提供搜索支持。國家863項(xiàng)目“生物大數(shù)據(jù)表述索引、搜索與存儲(chǔ)訪問關(guān)鍵技術(shù)研發(fā)”就是為解決這個(gè)問題。該項(xiàng)目的核心是構(gòu)建在由生物語義關(guān)系構(gòu)建的生物網(wǎng)絡(luò)中進(jìn)行多關(guān)鍵字關(guān)聯(lián)搜索的算法。生物網(wǎng)絡(luò)中的關(guān)聯(lián)搜索算法大多是以網(wǎng)絡(luò)的最小斯坦納樹問題(SPN問題)作為算法基礎(chǔ)進(jìn)行設(shè)計(jì),但是SPN問題本身時(shí)間復(fù)雜度很高,在大規(guī)模生物網(wǎng)絡(luò)中不再適用。為此,本課題借用Spark計(jì)算框架,設(shè)計(jì)了針對(duì)生物網(wǎng)絡(luò)的基于中心點(diǎn)的并行關(guān)聯(lián)搜索算法(PAS-CN算法),并進(jìn)行了實(shí)驗(yàn)驗(yàn)證。多關(guān)鍵字的關(guān)聯(lián)搜索試圖在生物網(wǎng)絡(luò)中搜索到多關(guān)鍵字彼此之間的關(guān)聯(lián)關(guān)系,從而找到可用于輔助醫(yī)療診斷的相關(guān)知識(shí)。生物網(wǎng)絡(luò)是基于生物實(shí)體的關(guān)系而構(gòu)建的,因此構(gòu)建基于生物網(wǎng)絡(luò)的最小斯坦納樹,就可以探索出這組關(guān)鍵字之間的關(guān)聯(lián)關(guān)系。SPN問題是NP-hard問題,所以只能用近似算法求解。本課題利用生物網(wǎng)絡(luò)的無標(biāo)度特性對(duì)生物網(wǎng)絡(luò)進(jìn)行層次聚類,從而實(shí)現(xiàn)網(wǎng)絡(luò)劃分。并以此為基礎(chǔ)設(shè)計(jì)了并行關(guān)聯(lián)搜索算法,大大降低了時(shí)間復(fù)雜度,并且通過引入網(wǎng)絡(luò)中心點(diǎn)成功控制了斯坦納樹的規(guī)模。本課題中對(duì)生物網(wǎng)絡(luò)做了大量的預(yù)處理作為算法的基礎(chǔ)條件,其中包含了層次聚類、網(wǎng)絡(luò)劃分、子網(wǎng)絡(luò)中心點(diǎn)選取、最低公共祖先矩陣構(gòu)建。本課題設(shè)計(jì)的基于中心點(diǎn)的并行關(guān)聯(lián)搜索算法(PAS-CN算法)主要包含了3個(gè)部分:子網(wǎng)絡(luò)劃分、并行斯坦納搜索和局部斯坦納樹合并。其中子網(wǎng)絡(luò)劃分和局部斯坦納樹合并部分都是Spark平臺(tái)串行計(jì)算完成,并行斯坦納搜索部分在Spark集群中并行計(jì)算求解。實(shí)驗(yàn)表明PAS-CN算法在運(yùn)算時(shí)間和斯坦納樹規(guī)模的控制上都取得了很大的提升。
【圖文】:

示意圖,示意圖,離群點(diǎn),工程碩士學(xué)位


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文的,幾乎沒有什么差別。最小距離和最大距離將兩個(gè)樣個(gè)簇之間的距離,由于是由兩個(gè)樣本點(diǎn)決定的,,所以穩(wěn)些離群點(diǎn)和錯(cuò)誤數(shù)據(jù)的影響,從而導(dǎo)致聚類的效果不好慮著兩種做法。離考慮了所有的樣本點(diǎn)之間的距離,全面反映了兩個(gè)簇具有很高的穩(wěn)定性和極強(qiáng)的代表性。有時(shí)候?yàn)榱吮苊怆x點(diǎn)的影響,可以對(duì)一些過大過小的距離進(jìn)行刪除,求取為兩個(gè)簇之間的距離。平均距離還有一個(gè)很好的變種,為兩個(gè)簇之間的距離,這個(gè)方式可以有效避免離群點(diǎn)和

樹狀圖,層次聚類,樹狀圖,示例


從而得到一組不同方案的網(wǎng)絡(luò)劃分結(jié)果。此處以如圖 2-2 為例,介紹對(duì)樹狀圖進(jìn)行分割的算法。如圖2-2 所示,它是一個(gè)有 30 個(gè)節(jié)點(diǎn)的層次聚類的結(jié)果樹狀圖,其中每層鏈接成一組聚類簇。此處我們?cè)O(shè)立簇距 , 表示樹狀圖相鄰兩次分割之后對(duì)應(yīng)的層次的簇個(gè)數(shù)的差。用簇距控制分割,可以相對(duì)在各種不同級(jí)別完成對(duì)網(wǎng)絡(luò)的子網(wǎng)絡(luò)劃分。層次聚類樹狀圖分割算法描述如下:(1)從根節(jié)點(diǎn)開始,初始化層次 ,記錄當(dāng)前簇個(gè)數(shù) m=1。(2)查看當(dāng)前層次的簇的數(shù)目 k,如果 k≥m+ ,則進(jìn)行分割
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:O157.5;TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 郭昌;傅明駿;;生物網(wǎng)絡(luò)在生物功能分析中的應(yīng)用[J];高師理科學(xué)刊;2018年03期

2 TRAFFIC;PEXELS;;野生物網(wǎng)絡(luò)非法交易新趨勢(shì)和問題[J];人與自然;2017年08期

3 梅娟;王正祥;石貴陽;李煒疆;;復(fù)雜生物網(wǎng)絡(luò)分析的圖聚類方法研究進(jìn)展[J];食品與生物技術(shù)學(xué)報(bào);2008年05期

4 肖巧玲;;初次嘗試生物網(wǎng)絡(luò)教學(xué)[J];中小學(xué)信息技術(shù)教育;2003年03期

5 趙琳琳;趙亞莉;張牧歌;李文龍;;一款輕量級(jí)的復(fù)雜生物網(wǎng)絡(luò)圖形化分析軟件的設(shè)計(jì)與實(shí)現(xiàn)[J];智能計(jì)算機(jī)與應(yīng)用;2018年02期

6 周鳳妹;;設(shè)計(jì)合理高效的生物網(wǎng)絡(luò)課[J];中國信息技術(shù)教育;2011年18期

7 丁永生,任立紅;一種基于免疫突現(xiàn)計(jì)算的生物網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)[J];控制與決策;2003年02期

8 張文波;吳晶;;生物網(wǎng)絡(luò)型社會(huì)組織[J];辦公自動(dòng)化;2015年11期

9 張航;昝鄉(xiāng)鎮(zhèn);劉志偉;;生物網(wǎng)絡(luò)模體識(shí)別算法概述[J];科協(xié)論壇(下半月);2010年02期

10 丁永生;;計(jì)算智能的新框架:生物網(wǎng)絡(luò)結(jié)構(gòu)[J];智能系統(tǒng)學(xué)報(bào);2007年02期

相關(guān)會(huì)議論文 前10條

1 古華光;;生物網(wǎng)絡(luò)的時(shí)空動(dòng)力學(xué)行為的實(shí)驗(yàn)和數(shù)學(xué)模型研究[A];The 5th 全國動(dòng)力學(xué)與控制青年學(xué)者研討會(huì)論文摘要集[C];2011年

2 徐佳;雷明莉;王博;李婧;;生物網(wǎng)絡(luò)與疾病關(guān)鍵肽段/蛋白質(zhì)的鑒定[A];“農(nóng)業(yè)健康與環(huán)境”組學(xué)大數(shù)據(jù)整合生物信息學(xué)研討會(huì)論文集[C];2017年

3 劉曾榮;;動(dòng)力學(xué)與控制在生物系統(tǒng)中應(yīng)用的幾個(gè)例子[A];中國力學(xué)學(xué)會(huì)學(xué)術(shù)大會(huì)'2009論文摘要集[C];2009年

4 張嗣瀛;;網(wǎng)絡(luò)生物學(xué)及其一些進(jìn)展(報(bào)告提綱)[A];第四屆全國網(wǎng)絡(luò)科學(xué)學(xué)術(shù)論壇暨研究生暑期學(xué)校論文集[C];2008年

5 徐筱杰;古江勇;陳麗蓉;;藥用天然產(chǎn)物的網(wǎng)絡(luò)藥理學(xué)研究[A];中國化學(xué)會(huì)第28屆學(xué)術(shù)年會(huì)第14分會(huì)場(chǎng)摘要集[C];2012年

6 高蕾;高魯彬;郭進(jìn)利;;生物網(wǎng)絡(luò)研究進(jìn)展述評(píng)[A];第五屆全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年

7 楊卓琴;管亭亭;陸啟韶;;多時(shí)間尺度的復(fù)雜網(wǎng)絡(luò)的動(dòng)力學(xué)問題研究[A];第四屆全國動(dòng)力學(xué)與控制青年學(xué)者研討會(huì)論文摘要集[C];2010年

8 李永;方錦清;畢橋;劉強(qiáng);;和諧統(tǒng)一的混合網(wǎng)絡(luò)中的相稱性系數(shù)轉(zhuǎn)變[A];第三屆全國復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)學(xué)術(shù)論壇論文集[C];2006年

9 來魯華;;基于系統(tǒng)的藥物設(shè)計(jì)[A];中國化學(xué)會(huì)第30屆學(xué)術(shù)年會(huì)摘要集-第二十五分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2016年

10 陳慧平;陳慧選;;多重分形譜在非線性網(wǎng)絡(luò)中的應(yīng)用[A];2006全國復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文集[C];2006年

相關(guān)重要報(bào)紙文章 前3條

1 記者 周穎;網(wǎng)絡(luò)靶標(biāo) 可闡釋中藥方劑作用機(jī)理[N];中國中醫(yī)藥報(bào);2010年

2 趙曉濤;哲學(xué)角度談安全[N];網(wǎng)絡(luò)世界;2008年

3 本報(bào)記者 楊豐源;大數(shù)據(jù)治病時(shí)代已來臨[N];貴陽日?qǐng)?bào);2016年

相關(guān)博士學(xué)位論文 前10條

1 姜sバ

本文編號(hào):2704707


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2704707.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b853a***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com