云計(jì)算環(huán)境下可視化探索式搜索引擎的研究
【圖文】:
時(shí)提交一個(gè)查詢至多個(gè)搜索引擎自動(dòng)完成這一過(guò)程,從而減輕了用戶的負(fù)擔(dān)[3].元搜索為探索性搜索提供足夠豐富的信息資源.在其搜索框架中,本文使用谷歌、百度和一個(gè)專(zhuān)用搜索引擎作為元搜索引擎的底層搜索引擎,稱為成員搜索引擎,見(jiàn)圖1.在所有的成員搜索引擎獲得了返回結(jié)果之后,元搜索引擎將結(jié)果合并為一個(gè)有序列表.目前大多數(shù)搜索引擎將其檢索結(jié)果表示為信息檢索記錄集(SRR)呈現(xiàn)給用戶.一個(gè)典型的SRR由URL、標(biāo)題和檢索文獻(xiàn)的摘要組成[4].因此,與SRR有關(guān)的內(nèi)容可以用于對(duì)來(lái)自不同搜索引擎的檢索結(jié)果進(jìn)行合并和排序.圖1元搜索引擎在元搜索引擎中,選擇排在列表前列的SRR,并計(jì)算搜索引擎評(píng)分的算法稱為T(mén)opSRR[4].當(dāng)查詢Q被提交給搜索引擎j時(shí),那么搜索引擎返回動(dòng)態(tài)生成的結(jié)果頁(yè)面,頁(yè)面上包括一定數(shù)目的SRR,在TopSRR算法中,從每個(gè)搜索引擎返回的不是前n個(gè)文檔,而是前n個(gè)文檔的SRR,其用于估算搜索引擎的得分.直觀地說(shuō),這是合理的,因?yàn)閷?duì)于一個(gè)給定的查詢,更好的搜索引擎易于獲取更好的結(jié)果,,結(jié)果的優(yōu)劣通常是反映在其SRR之上.具體而言,來(lái)自搜索引擎j的前n個(gè)SRR的標(biāo)題合并在一起,形成一個(gè)標(biāo)題向量TVj,所有的片段也被合并成一個(gè)片段向量SVj.分別計(jì)算查詢Q和TVj之間的相似度,以及Q和SVj之間的相似度,然后匯總到搜索引擎的j的評(píng)分之上.算法可以描述為Sj=c1×Similarity(Q,TVj)+(1-c1)×Similarity(Q,SVj),在本文定義的框架中,c1=0.5.1.2探索性搜索近年來(lái),出現(xiàn)了一種被稱為探索性搜索[1]的新的搜索方法,探索性搜索是一種特定的信息搜索行為,其搜索者具有以下特征:不熟悉其目標(biāo)領(lǐng)域;實(shí)現(xiàn)目標(biāo)的方法?
相同,所以將服務(wù)器置于云計(jì)算平臺(tái)中,稱之為云服務(wù)器.從云服務(wù)器中獲得的搜索結(jié)果在被傳遞到終端之前,需要進(jìn)一步的后期處理,語(yǔ)義關(guān)系圖的預(yù)處理和后期處理步驟需要耗費(fèi)大量的計(jì)算資源,終端的計(jì)算能力目前無(wú)法處理這些計(jì)算密集型的步驟.因此,將這些計(jì)算過(guò)程提交至云服務(wù)器,憑借其強(qiáng)大的計(jì)算能力和云計(jì)算服務(wù)的高可擴(kuò)展性,搜索引擎框架將實(shí)現(xiàn)實(shí)時(shí)處理.2框架搜索引擎框架的基礎(chǔ)架構(gòu)如圖2所示.客戶端使得用戶以直觀交互的方式探索和發(fā)現(xiàn)針對(duì)特定起始關(guān)鍵詞的信息,云服務(wù)器通過(guò)元搜索和知識(shí)集成來(lái)構(gòu)造并返回關(guān)系圖.該框架由3個(gè)主要部分組成:基于元搜索的語(yǔ)義關(guān)系圖的推理和表示、對(duì)基于查詢和瀏覽策略形成的關(guān)系圖的可視化探索性搜索,以及人機(jī)交互.圖2框架的基礎(chǔ)架構(gòu)2.1構(gòu)造語(yǔ)義關(guān)系圖語(yǔ)義關(guān)系圖的構(gòu)造包括3個(gè)主要步驟:(i)輸入關(guān)鍵詞;(ii)在主流搜索引擎上進(jìn)行元搜索;(iii)對(duì)返回的網(wǎng)頁(yè)和網(wǎng)站的內(nèi)在關(guān)系進(jìn)行推理.在(i)中,用戶輸入待查找的關(guān)鍵詞;在(ii)中,關(guān)鍵詞會(huì)被發(fā)送到一個(gè)內(nèi)部元搜索引擎,該引擎與包括百度和谷歌在內(nèi)的成員搜索引擎進(jìn)行交互,如圖1所示,成員搜索引擎接受關(guān)鍵詞并返回檢索的鏈接和網(wǎng)頁(yè)結(jié)果列表.具體來(lái)說(shuō),元搜索引擎調(diào)用成員搜索引擎的應(yīng)用程序接口(API);在(iii)中,對(duì)返回的網(wǎng)頁(yè)和網(wǎng)站進(jìn)行有效的自然語(yǔ)言處理和統(tǒng)計(jì),并構(gòu)建語(yǔ)義關(guān)系圖.尤為重要的是,對(duì)于所有從元搜索返回的結(jié)果,測(cè)量其語(yǔ)義相似度,為可視化探索性搜索做好準(zhǔn)備.在所建立的關(guān)系圖中,各節(jié)點(diǎn)表示為關(guān)鍵詞,弧被定義為語(yǔ)義關(guān)系的長(zhǎng)度.特別的是,返回的結(jié)果列表按照?qǐng)D中的弧進(jìn)行索引.2.2計(jì)算語(yǔ)義相似度開(kāi)發(fā)網(wǎng)絡(luò)搜索機(jī)制需要解決兩個(gè)核心問(wèn)題:(i)如何找到相關(guān)的網(wǎng)頁(yè),(ii)給定一組潛在的相關(guān)網(wǎng)頁(yè),如何根據(jù)?
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 李蕾,王楠,鐘義信,郭祥昊,韓鵬,賈自燕,高清霞;基于語(yǔ)義網(wǎng)絡(luò)的概念檢索研究與實(shí)現(xiàn)[J];情報(bào)學(xué)報(bào);2000年05期
2 鐘偉金;;基于概念關(guān)聯(lián)的詞匯語(yǔ)義關(guān)系識(shí)別研究[J];情報(bào)雜志;2014年01期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 唐培麗,王樹(shù)明,胡明;基于語(yǔ)義的漢語(yǔ)文獻(xiàn)主題詞提取算法研究[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2005年05期
2 李志輝;智能答疑系統(tǒng)中概念詞典的設(shè)計(jì)與應(yīng)用[J];重慶科技學(xué)院學(xué)報(bào);2005年02期
3 王理達(dá);電子政務(wù)中中文文本分類(lèi)技術(shù)的應(yīng)用[J];大眾科技;2005年01期
4 柳曉春,左少凝;知識(shí)組織與網(wǎng)絡(luò)資源分類(lèi)的現(xiàn)狀與展望[J];高校圖書(shū)館工作;2001年04期
5 呂元智;;數(shù)字檔案資源跨媒體語(yǔ)義關(guān)聯(lián)聚合實(shí)現(xiàn)策略研究[J];檔案學(xué)研究;2015年05期
6 路楊;宋亞林;顧景文;;基于語(yǔ)義網(wǎng)絡(luò)的古建筑圖像數(shù)據(jù)庫(kù)的查詢策略[J];河南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年01期
7 運(yùn)乃東;網(wǎng)絡(luò)環(huán)境下情報(bào)檢索語(yǔ)言的存廢問(wèn)題[J];河南圖書(shū)館學(xué)刊;2001年01期
8 左穎萍;周揚(yáng);;基于本體的故障維修案例知識(shí)建模和語(yǔ)義檢索方法研究[J];軍民兩用技術(shù)與產(chǎn)品;2009年10期
9 劉鋼,趙愛(ài)華,王婕,丘大謀,謝友柏;基于語(yǔ)義分析的設(shè)計(jì)實(shí)體智能搜索[J];機(jī)床與液壓;2003年03期
10 孫霞,鄭慶華;教育資源元數(shù)據(jù)語(yǔ)義擴(kuò)展查找方法的研究[J];計(jì)算機(jī)研究與發(fā)展;2004年12期
相關(guān)會(huì)議論文 前1條
1 汪明;熊璋;吳晶;;基于LDAP的多語(yǔ)言概念檢索模型的研究[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
相關(guān)博士學(xué)位論文 前10條
1 楊抒;基于WEB的林產(chǎn)品信息資源整合方法研究[D];北京林業(yè)大學(xué);2011年
2 王蘭成;基于XMARC信息描述的知識(shí)標(biāo)引與概念檢索研究[D];東華大學(xué);2004年
3 劉云峰;基于潛在語(yǔ)義分析的中文概念檢索研究[D];華中科技大學(xué);2005年
4 黃亦瀟;客戶知識(shí)獲取的理論與應(yīng)用研究[D];電子科技大學(xué);2006年
5 席運(yùn)江;組織知識(shí)的網(wǎng)絡(luò)表示模型及分析方法[D];大連理工大學(xué);2007年
6 劉建國(guó);復(fù)雜網(wǎng)絡(luò)模型構(gòu)建及其在知識(shí)系統(tǒng)中的應(yīng)用[D];大連理工大學(xué);2007年
7 秦忠寶;基于混合知識(shí)表示的設(shè)計(jì)創(chuàng)新及知識(shí)獲取研究[D];西北工業(yè)大學(xué);2006年
8 丘宏俊;基于知識(shí)的飛機(jī)裝配工藝設(shè)計(jì)關(guān)鍵技術(shù)研究[D];西北工業(yè)大學(xué);2006年
9 伍淳華;智能旅游目的地信息服務(wù)中效用的產(chǎn)生和體現(xiàn)機(jī)制研究[D];北京郵電大學(xué);2008年
10 李衛(wèi);領(lǐng)域知識(shí)的獲取[D];北京郵電大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 王洋;基于潛在語(yǔ)義分析的智能搜索技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 劉曉英;知識(shí)關(guān)聯(lián)及其應(yīng)用研究[D];湘潭大學(xué);2010年
3 董錦霞;基于菱形思維的概念檢索模型研究[D];大連理工大學(xué);2011年
4 楊劍軍;制造企業(yè)的知識(shí)管理及其模塊化研究[D];寧波大學(xué);2009年
5 俞方河;制造企業(yè)的知識(shí)資源配置方法研究[D];寧波大學(xué);2011年
6 王振佶;面向銷(xiāo)售服務(wù)的自動(dòng)問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2011年
7 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
8 余媛芳;面向產(chǎn)品創(chuàng)新設(shè)計(jì)的知識(shí)獲取研究[D];西北工業(yè)大學(xué);2004年
9 李欣;基于概念檢索的智能信息檢索技術(shù)研究[D];華中師范大學(xué);2004年
10 劉柏青浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系韓惠琴寧波大學(xué)圖書(shū) 館 (出處)=大學(xué)圖書(shū)館學(xué)報(bào)2002(2)一10一11 http:刀~.istis.sh.en/istis/dlib/;基于知識(shí)的數(shù)字圖書(shū)館[D];華中師范大學(xué);2004年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 侯躍芳;崔雷;朱利娜;;應(yīng)用主題詞/副主題詞關(guān)聯(lián)規(guī)則對(duì)專(zhuān)題知識(shí)的挖掘分析及評(píng)價(jià)[J];情報(bào)理論與實(shí)踐;2008年02期
2 張晗;任志國(guó);張健;崔雷;;基于主題詞關(guān)聯(lián)規(guī)則的醫(yī)學(xué)文本數(shù)據(jù)庫(kù)數(shù)據(jù)挖掘的嘗試[J];醫(yī)學(xué)信息學(xué)雜志;2008年01期
3 孫海霞;李軍蓮;李丹亞;李芳;冀玉靜;;MTI副主題詞自動(dòng)組配標(biāo)引機(jī)制解析[J];醫(yī)學(xué)信息學(xué)雜志;2011年05期
4 李軍蓮;李丹亞;孫海霞;冀玉靜;李芳;;中文生物醫(yī)學(xué)文獻(xiàn)主題標(biāo)引中副主題詞自動(dòng)組配機(jī)制探討[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2012年06期
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 張?jiān)魄?安文秀;于雙成;;探索式搜索中用戶認(rèn)知的實(shí)驗(yàn)研究[J];情報(bào)理論與實(shí)踐;2013年06期
2 張?jiān)魄?李玉玲;王洪媛;;基于日志與認(rèn)知分析的探索式醫(yī)學(xué)搜索行為研究[J];圖書(shū)情報(bào)工作;2014年11期
3 張?jiān)魄?;專(zhuān)題:探索式搜索行為研究 序[J];圖書(shū)情報(bào)工作;2014年11期
4 馮佳;張?jiān)魄?;基于瀏覽器日志分析的探索式搜索行為研究[J];圖書(shū)情報(bào)工作;2014年11期
5 張建映;;構(gòu)建思想政治理論課的探索式教學(xué)內(nèi)容體系[J];河北軟件職業(yè)技術(shù)學(xué)院學(xué)報(bào);2008年01期
6 ;[J];;年期
相關(guān)重要報(bào)紙文章 前2條
1 中山大學(xué)管理學(xué)院 唐清泉 李海威 周熠蒙;企業(yè)創(chuàng)新模式路徑選擇[N];首都建設(shè)報(bào);2011年
2 劉國(guó);國(guó)際商務(wù)談判“問(wèn)”的技巧[N];公共商務(wù)信息導(dǎo)報(bào);2006年
相關(guān)博士學(xué)位論文 前1條
1 王一川;基于內(nèi)容的海量文本探索式查詢導(dǎo)引中若干關(guān)鍵技術(shù)的研究[D];北京郵電大學(xué);2011年
相關(guān)碩士學(xué)位論文 前5條
1 安文秀;基于日志與認(rèn)知分析的探索式醫(yī)學(xué)搜索行為研究[D];吉林大學(xué);2014年
2 陳冬;基于相關(guān)性的海量圖像的可視化探索式搜索研究[D];湘潭大學(xué);2014年
3 鄭浩;基于語(yǔ)義關(guān)系圖的小視窗智能機(jī)上可視化探索式搜索研究[D];湘潭大學(xué);2014年
4 魏勇;基于功能點(diǎn)度量的探索式測(cè)試研究[D];天津大學(xué);2013年
5 張俊忠;初中數(shù)學(xué)探索式教學(xué)模式的理論與實(shí)踐[D];華中師范大學(xué);2005年
本文編號(hào):2577296
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2577296.html