基于搜索引擎的相似度研究與應(yīng)用
本文關(guān)鍵詞:基于搜索引擎的相似度研究與應(yīng)用
更多相關(guān)文章: 搜索引擎 相似度 集合論 市場份額
【摘要】:搜索引擎是現(xiàn)代社會不可或缺的最重要互聯(lián)網(wǎng)應(yīng)用之一,對其關(guān)注的重點(diǎn)也從商業(yè)領(lǐng)域逐步轉(zhuǎn)移到科研領(lǐng)域。針對現(xiàn)今相似度計(jì)算方法不能全面反映對象間的關(guān)聯(lián)性的局限,提出了一種基于搜索引擎的相似度計(jì)算方法。在搜索引擎結(jié)果數(shù)目的基礎(chǔ)上,借鑒集合論的思想,通過引入搜索引擎市場份額及一系列的簡化等數(shù)學(xué)方法,融合多個(gè)搜索引擎結(jié)果,最終得到相似度。實(shí)驗(yàn)結(jié)果證實(shí)了所提出的相似度計(jì)算方法的可行性與有效性。
【作者單位】: 西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 搜索引擎 相似度 集合論 市場份額
【基金】:國家自然基金項(xiàng)目(61175047,61262058,61152001) 中國科學(xué)院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制重點(diǎn)實(shí)驗(yàn)室開放課題(20110102)資助
【分類號】:TP391.3
【正文快照】: 1引言作為最重要的互聯(lián)網(wǎng)應(yīng)用之一,搜索引擎是時(shí)代的產(chǎn)物,它的出現(xiàn)部分解決了互聯(lián)網(wǎng)上信息泛濫所導(dǎo)致的信息檢索困難問題。搜索引擎的類別也由傳統(tǒng)的搜索引擎逐漸衍生出元搜索引擎、垂直搜索引擎、語義搜索引擎及智能搜索引擎等。近年來,以WalformAlpha、Freebase及DBpedia[1]
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年06期
2 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報(bào);2003年06期
3 金博,史彥軍,滕弘飛;基于語義理解的文本相似度算法[J];大連理工大學(xué)學(xué)報(bào);2005年02期
4 彭波,閆宏飛;搜索引擎檢索系統(tǒng)質(zhì)量評估[J];計(jì)算機(jī)研究與發(fā)展;2005年10期
5 張培穎;;多特征融合的語句相似度計(jì)算模型[J];計(jì)算機(jī)工程與應(yīng)用;2010年26期
6 連宇;彭進(jìn)業(yè);謝紅梅;馮曉毅;;基于Google與KL距離的概念相關(guān)度算法[J];計(jì)算機(jī)工程;2011年19期
7 李彬,劉挺,秦兵,李生;基于語義依存的漢語句子相似度計(jì)算[J];計(jì)算機(jī)應(yīng)用研究;2003年12期
8 張玉芳;艾東梅;黃濤;熊忠陽;;結(jié)合編輯距離和Google距離的語義標(biāo)注方法[J];計(jì)算機(jī)應(yīng)用研究;2010年02期
9 王榮波,池哲儒;基于詞類串的漢語句子結(jié)構(gòu)相似度計(jì)算方法[J];中文信息學(xué)報(bào);2005年01期
10 李峰;李芳;;中文詞語語義相似度計(jì)算——基于《知網(wǎng)》2000[J];中文信息學(xué)報(bào);2007年03期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 劉高軍;馬硯忠;段建勇;;基于維基百科的中文命名實(shí)體關(guān)聯(lián)度計(jì)算[J];北方工業(yè)大學(xué)學(xué)報(bào);2012年01期
2 陳康;樊孝忠;劉杰;賈可亮;;基于問句語義表征的中文問句相似度計(jì)算方法[J];北京理工大學(xué)學(xué)報(bào);2007年12期
3 官連軍;丁光耀;張燕妮;;支持多種模糊處理的英文智能預(yù)提示輸入引擎[J];成都信息工程學(xué)院學(xué)報(bào);2012年02期
4 楊松;樓新遠(yuǎn);;基于向量空間模型附加詞義特征的句子相似度研究[J];成都信息工程學(xué)院學(xué)報(bào);2012年03期
5 張燕;宋錦斌;;卡通動(dòng)畫數(shù)字媒體資源管理系統(tǒng)[J];長沙醫(yī)學(xué)院學(xué)報(bào);2010年02期
6 李旭;趙亞偉;劉國華;;基于指紋和語義特征的文檔復(fù)制檢測方法[J];燕山大學(xué)學(xué)報(bào);2008年04期
7 楊思春;;一種改進(jìn)的句子相似度計(jì)算模型[J];電子科技大學(xué)學(xué)報(bào);2006年06期
8 林鴻飛;丁洪文;楊志豪;趙晶;;基于概念和統(tǒng)計(jì)的問答系統(tǒng)實(shí)現(xiàn)機(jī)制[J];大連理工大學(xué)學(xué)報(bào);2006年02期
9 柴曉麗;張麗偉;管玉玲;;基于HowNet自動(dòng)文摘的研究[J];電腦編程技巧與維護(hù);2009年S1期
10 穆煒煒;王國才;;主觀題自動(dòng)評閱算法設(shè)計(jì)[J];電腦知識與技術(shù);2012年15期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 李紅霞;袁曉芳;田水承;王莉;;基于義類詞典的煤礦瓦斯爆炸案例推理系統(tǒng)研究[A];中國職業(yè)安全健康協(xié)會2008年學(xué)術(shù)年會論文集[C];2008年
2 鄧輝;林柏鋼;;一種基于《知網(wǎng)》的敏感信息預(yù)測技術(shù)[A];第十屆中國科協(xié)年會論文集(三)[C];2008年
3 陳慧清;林世平;;基于知網(wǎng)和模式自舉的概念間分類關(guān)系獲取方法[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國青年通信學(xué)術(shù)會議論文集[C];2009年
4 李月雷;師瑞峰;林麗冰;周一民;;漢語語句語義相似度的計(jì)算方法[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
5 趙妍妍;秦兵;劉挺;張俐;蘇中;;基于多特征融合的句子相似度計(jì)算[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
6 菅小艷;鄭家恒;;一種改進(jìn)的句子相似度計(jì)算方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
7 劉寶艷;林鴻飛;楊志豪;;基于改進(jìn)編輯距離和依存結(jié)構(gòu)的句子相似度計(jì)算[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
8 宋彥;張桂平;蔡東風(fēng);;基于N-gram的句子相似度計(jì)算技術(shù)[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國計(jì)算語言學(xué)學(xué)術(shù)會議論文集[C];2007年
9 董刊生;方金云;;基于向量距離的詞序相似度算法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
10 盧延科;尹寶生;張桂平;苗雪雷;白宇;;基于偽LCS的中文專利句子相似度計(jì)算方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 熊回香;面向Web3.0的大眾分類研究[D];華中師范大學(xué);2011年
2 舒江波;面向中文信息處理的復(fù)句關(guān)系詞自動(dòng)標(biāo)識研究[D];華中師范大學(xué);2011年
3 李劍;PSTN話帶數(shù)據(jù)分離與調(diào)制識別[D];解放軍信息工程大學(xué);2009年
4 趙威;電網(wǎng)數(shù)據(jù)中心的數(shù)據(jù)安全問題研究[D];燕山大學(xué);2011年
5 邵世維;基于幾何特征的多尺度矢量面狀實(shí)體匹配方法研究與應(yīng)用[D];武漢大學(xué);2011年
6 單建芳;面向事件的文本表示研究[D];上海大學(xué);2012年
7 彭強(qiáng);復(fù)雜系統(tǒng)遠(yuǎn)程智能故障診斷技術(shù)研究[D];南京理工大學(xué);2004年
8 楊雨圖;支持雙語的協(xié)同CAPP系統(tǒng)若干關(guān)鍵技術(shù)研究[D];南京航空航天大學(xué);2006年
9 謝能付;基于語義Web技術(shù)的知識融合和同步方法研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
10 傅魁;基于Web的本體學(xué)習(xí)研究[D];武漢理工大學(xué);2007年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 雷斌;基于Java技術(shù)的智能化搜索引擎的研究與設(shè)計(jì)[D];哈爾濱工程大學(xué);2010年
2 耿倩;基于文本相似度計(jì)算的文本聚類算法研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2010年
3 井志強(qiáng);基于擴(kuò)展的VSM中文文本分類方法[D];哈爾濱工程大學(xué);2010年
4 王森;基于主題樹的自上而下文本復(fù)制檢測研究[D];大連理工大學(xué);2010年
5 孔勝;文本資源的知識抽取研究[D];大連理工大學(xué);2010年
6 樸紅吉;基于分布式多索引融合的專利信息檢索研究[D];大連理工大學(xué);2010年
7 徐美霞;基于web技術(shù)的網(wǎng)上考試系統(tǒng)[D];中國海洋大學(xué);2010年
8 楊朝玉;基于知網(wǎng)的受限域問答系統(tǒng)原型的設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2010年
9 徐德玉;中文文檔內(nèi)容相似度檢測方法研究[D];長春工業(yè)大學(xué);2010年
10 樊春雷;基于語義分析的糖尿病健康教育系統(tǒng)研究與實(shí)現(xiàn)[D];華東理工大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李紅梅;丁振國;周水生;周利華;;元搜索引擎結(jié)果合成算法[J];北京郵電大學(xué)學(xué)報(bào);2008年05期
2 趙蔚;劉秀琴;邱百爽;;語義網(wǎng)自適應(yīng)學(xué)習(xí)系統(tǒng)中領(lǐng)域本體的構(gòu)建[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2008年05期
3 田久樂;趙蔚;;基于同義詞詞林的詞語相似度計(jì)算方法[J];吉林大學(xué)學(xué)報(bào)(信息科學(xué)版);2010年06期
4 呂學(xué)強(qiáng),任飛亮,黃志丹,姚天順;句子相似模型和最相似句子查找算法[J];東北大學(xué)學(xué)報(bào);2003年06期
5 朱靖波,王寶庫,姚天順;一種規(guī)則描述語言NPRDL語言[J];東北大學(xué)學(xué)報(bào);1996年06期
6 楊思春;;一種改進(jìn)的句子相似度計(jì)算模型[J];電子科技大學(xué)學(xué)報(bào);2006年06期
7 吳素研;郭巧;;語義網(wǎng)中基于Kullback-Leibler距離的本體映射方法(英文)[J];Journal of Southeast University(English Edition);2007年03期
8 程濤;施水才;王霞;呂學(xué)強(qiáng);;基于同義詞詞林的中文文本主題詞提取[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
9 秦兵;劉挺;王洋;鄭實(shí)福;李生;;基于常問問題集的中文問答系統(tǒng)研究[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2003年10期
10 朱禮軍,陶蘭,劉慧;領(lǐng)域本體中的概念相似度計(jì)算[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 車萬翔;劉挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然語言理解與機(jī)器翻譯——全國第六屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2001年
2 關(guān)毅;王曉龍;;基于統(tǒng)計(jì)的漢語詞匯間語義相似度計(jì)算[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
3 車萬翔;劉挺;秦兵;李生;;面向雙語句對檢索的漢語句子相似度計(jì)算[A];語言計(jì)算與基于內(nèi)容的文本處理——全國第七屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議論文集[C];2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 王斌;漢英雙語語料庫自動(dòng)對齊研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);1999年
2 李紅梅;智能元搜索引擎關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 陳沈焰;吳軍華;;基于本體的概念語義相似度計(jì)算及其應(yīng)用[J];微電子學(xué)與計(jì)算機(jī);2008年12期
2 張繼剛;搜索引擎使用技巧[J];網(wǎng)絡(luò)與信息;1999年09期
3 ;關(guān)鍵詞搜索[J];每周電腦報(bào);2000年38期
4 陳冰;;餓狼一樣的網(wǎng)站提交工具——“提交餓狼”[J];科學(xué)之友;2000年07期
5 許斗;從Google看新一代搜索引擎的發(fā)展趨向[J];蕪湖職業(yè)技術(shù)學(xué)院學(xué)報(bào);2001年01期
6 周毅華;從搜索引擎的分類看其應(yīng)用技巧[J];圖書館理論與實(shí)踐;2002年06期
7 鄒小筑;搜索引擎的選擇與使用技巧[J];圖書館學(xué)研究;2002年05期
8 林燕;Google搜索引擎的搜索功能與使用技巧[J];河北科技圖苑;2003年05期
9 林中;GOOGLE搜索引擎的關(guān)鍵詞檢索[J];中國信息導(dǎo)報(bào);2003年03期
10 封劍待封喉;吸星大法“搜”天下 笑傲網(wǎng)絡(luò)任我行——搜索引擎絕對專題[J];網(wǎng)絡(luò)與信息;2003年07期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會第五屆學(xué)術(shù)年會論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學(xué)術(shù)交流會議論文匯編[C];2003年
3 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學(xué)術(shù)研討會論文集[C];2010年
5 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會2008年年會論文集[C];2008年
6 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會議論文集[C];2005年
7 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2005年
8 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會年會暨學(xué)術(shù)研討會論文集[C];2010年
9 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會議(PCC'06)論文集[C];2006年
10 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
2 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
3 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日報(bào);2005年
4 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
5 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
6 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
7 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
8 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
9 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日報(bào);2006年
10 姜蕊;問天下誰識搜索?[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岑榮偉;基于用戶行為分析的搜索引擎評價(jià)研究[D];清華大學(xué);2010年
2 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
6 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
7 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評估研究[D];吉林大學(xué);2010年
8 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
9 鄭文良;基于簡單本體的農(nóng)業(yè)P2P搜索引擎關(guān)鍵技術(shù)研究[D];沈陽農(nóng)業(yè)大學(xué);2013年
10 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 薛云;Internet上元搜索引擎的研究與設(shè)計(jì)[D];太原理工大學(xué);2003年
2 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學(xué);2010年
3 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年
4 董晨;基于模糊聚類的個(gè)性化搜索引擎的研究[D];福州大學(xué);2005年
5 封俊;基于Hadoop的分布式搜索引擎研究與實(shí)現(xiàn)[D];太原理工大學(xué);2010年
6 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實(shí)現(xiàn)[D];華南理工大學(xué);2010年
7 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年
8 李建平;智能化WEB信息搜索引擎的研究與實(shí)現(xiàn)[D];大慶石油學(xué)院;2003年
9 田生偉;基于涉農(nóng)詞典的搜索引擎的研究與實(shí)踐[D];新疆大學(xué);2004年
10 歐建斌;基于Web挖掘與信息分類的個(gè)性化搜索引擎研究[D];暨南大學(xué);2010年
本文編號:717922
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/717922.html