面向語義搜索的查詢前置技術(shù)研究與實現(xiàn)
本文關(guān)鍵詞:面向語義搜索的查詢前置技術(shù)研究與實現(xiàn)
更多相關(guān)文章: 信息檢索 查詢擴展 面向語義搜索 查詢語言 本體 語義相關(guān)度 日志分析
【摘要】:互聯(lián)網(wǎng)已經(jīng)成為信息的主要載體,其規(guī)模還在飛速地增長。面對海量的互聯(lián)網(wǎng)信息,為了有效地從中查找到所需的信息,搜索引擎已經(jīng)成為人們檢索信息的首選工具。目前,大多數(shù)商業(yè)搜索引擎都是基于關(guān)鍵詞匹配技術(shù),隨著技術(shù)的發(fā)展,雖然返回的搜索結(jié)果質(zhì)量比過去也提升了不少,但是依舊存在幾個關(guān)鍵問題:1)用戶搜索到的信息并非如其所愿,因此用戶通常需要找到最合適的關(guān)鍵詞來描述搜索意圖,但是這并不容易;2)關(guān)鍵詞匹配技術(shù)不支持語義理解,這個缺點在歧義詞和同義詞上顯得尤為明顯,相同的詞可能表達不同的語義,而不同的詞也可能表達相同的語義;3)通過對搜索日志的分析發(fā)現(xiàn),用戶使用的查詢語句太短,導致搜索引擎難以理解用戶的搜索意圖。近年來,已有很多研究著手解決這些問題,從搜索流程的角度,可以把這些研究分成三類:查詢前置處理,例如查詢擴展、查詢重構(gòu)等研究;查詢中的處理,例如優(yōu)化檢索模型、建立概念索引等研究;查詢后置處理,例如搜索結(jié)果重排序等研究。但是,這些研究零散,缺乏整體性解決方案,效果也有待進一步提高。對此,作者通過分析搜索引擎現(xiàn)存的問題,從改進和擴展查詢語言與接口入手,將面向詞匯的搜索,擴展為面向概念的語義搜索,從查詢前置處理角度優(yōu)化搜索引擎,從而改進網(wǎng)絡搜索的效果與質(zhì)量。作者具體的工作和成果包括:設計了面向語義的查詢語言,用于支持用戶和搜索引擎在語義層面的交互。查詢語言的核心是對歧義詞進行概念綁定,消除其歧義性。在概念綁定的基礎上,設計了三種語義查詢:概念查詢、關(guān)系查詢和類比查詢。面向語義的查詢語言可以幫助用戶表達搜索意圖,也利于搜索引擎理解用戶意圖。提出了基于本體的概念映射算法,用于理解概念綁定后的歧義詞在當前查詢中的語義,這是查詢前置處理的第一步。該算法先通過本體的術(shù)語表獲取歧義詞對應的候選概念集合,然后通過本體計算概念間的語義相關(guān)度,并構(gòu)造了基于相關(guān)度的評價函數(shù)f,候選集中使f求得最大值的概念就是最終映射的概念。通過本文設計的實驗證明,該算法有很高的準確率。提出了基于本體和查詢?nèi)罩镜牟樵償U展,在概念映射之后,對查詢語句做進一步擴展,這是查詢前置處理的第二步。首先利用本體構(gòu)造候選概念集,然后通過查詢會話中查詢的相關(guān)性,對候選概念計算得分,最后按照得分降序排序,選擇排名前N的概念作為擴展概念。通過對比實驗證明,本文的查詢擴展方法對搜索的查準率有了很大的改進。
【關(guān)鍵詞】:信息檢索 查詢擴展 面向語義搜索 查詢語言 本體 語義相關(guān)度 日志分析
【學位授予單位】:華東師范大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要6-8
- ABSTRACT8-12
- 第一章 緒論12-17
- 1.1 研究背景和意義12-13
- 1.2 本文的關(guān)鍵問題13-14
- 1.3 本文的主要工作14-15
- 1.4 本文的組織結(jié)構(gòu)15-17
- 第二章 相關(guān)研究工作17-28
- 2.1 信息檢索17-18
- 2.2 本體18-20
- 2.3 查詢?nèi)罩?/span>20-22
- 2.4 查詢擴展綜述22-27
- 2.4.1 查詢擴展流程22-24
- 2.4.2 查詢擴展方法24-26
- 2.4.3 關(guān)鍵問題和發(fā)展方向26-27
- 2.5 本章小結(jié)27-28
- 第三章 面向語義的查詢語言和智能查詢28-44
- 3.1 現(xiàn)有的查詢語言29-30
- 3.2 面向語義的查詢語言設計30-32
- 3.3 基于本體的概念映射算法32-36
- 3.4 語法分析與智能查詢流程36-41
- 3.5 實驗分析41-43
- 3.6 本章小結(jié)43-44
- 第四章 基于本體和查詢?nèi)罩镜牟樵償U展44-54
- 4.1 用戶搜索行為模型44-45
- 4.2 查詢?nèi)罩驹O計與預處理45-46
- 4.3 基于本體和查詢?nèi)罩镜牟樵償U展算法46-50
- 4.3.1 基于本體的候選概念集構(gòu)建47-48
- 4.3.2 基于查詢?nèi)罩镜母拍钸x擇48-49
- 4.3.3 查詢擴展算法描述49-50
- 4.4 實驗分析50-53
- 4.4.1 實驗平臺和數(shù)據(jù)50-51
- 4.4.2 實驗方法51
- 4.4.3 實驗結(jié)果分析51-53
- 4.5 本章小結(jié)53-54
- 第五章 查詢前置處理在智能搜索引擎中的應用54-60
- 5.1 智能搜索引擎系統(tǒng)架構(gòu)54-55
- 5.2 模塊功能55-58
- 5.2.1 基礎環(huán)境模塊55
- 5.2.2 知識庫模塊55
- 5.2.3 元搜索引擎和排名整合模塊55-56
- 5.2.4 摘要模塊56
- 5.2.5 日志模塊56
- 5.2.6 查詢擴展模塊56-57
- 5.2.7 關(guān)系挖掘模塊57
- 5.2.8 語法處理模塊57-58
- 5.3 實際應用效果58-59
- 5.4 本章小結(jié)59-60
- 第六章 總結(jié)和展望60-61
- 6.1 全文工作總結(jié)60
- 6.2 未來工作展望60-61
- 參考文獻61-64
- 附錄一 作者攻讀碩士學位期間發(fā)表的學術(shù)論文64-65
- 附錄二 作者攻讀碩士學位期間參與的科研項目65-66
- 后記6
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 文坤梅;盧正鼎;孫小林;李瑞軒;;語義搜索研究綜述[J];計算機科學;2008年05期
2 王勇;;觸摸語義搜索的脈搏[J];軟件世界;2009年10期
3 蘇明明;宋文;;基于本體的語義搜索引擎解決方案研究新進展[J];現(xiàn)代圖書情報技術(shù);2008年11期
4 孫靜宇;余雪麗;李鮮花;;面向語義搜索的推薦模型研究[J];廣西師范大學學報(自然科學版);2008年03期
5 劉幺和;李巧云;;基于語義搜索的語音交互系統(tǒng)模型研究[J];計算機應用;2009年07期
6 陳響亮;李懷松;梁意文;;基于語義搜索的實名呼叫系統(tǒng)設計[J];計算機與現(xiàn)代化;2011年09期
7 楊克特;陳華鈞;;面向特定領(lǐng)域的語義搜索結(jié)果排序算法[J];計算機應用與軟件;2011年12期
8 馬雷雷;梁汝鵬;連世偉;陳虎;;一種主題本體驅(qū)動的語義搜索方法[J];地理空間信息;2013年04期
9 于彤;陳華鈞;李敬華;;面向中藥新藥研發(fā)的語義搜索系統(tǒng)[J];中國醫(yī)學創(chuàng)新;2013年33期
10 汪志群;;基于云計算的語義搜索引擎探究[J];電子測試;2014年08期
中國重要報紙全文數(shù)據(jù)庫 前7條
1 本報記者 張志乾 實習生 張利冰;中華英才網(wǎng)舉辦創(chuàng)新技術(shù)體驗日活動 籌劃全平臺升級[N];中國貿(mào)易報;2012年
2 高爽;語義搜索正從概念轉(zhuǎn)向應用[N];人民郵電;2014年
3 CUBN記者 鄧麗娟;大數(shù)據(jù)時代亟需技術(shù)革新[N];中國聯(lián)合商報;2012年
4 行云;駱捚和他的技術(shù)“三劍客”[N];中華工商時報;2012年
5 苗得雨;語義搜索PK關(guān)鍵詞搜索[N];電腦報;2008年
6 本報記者 郭平;EMC應對IT五項剛性需求[N];計算機世界;2008年
7 本報記者 王星;應用搜索進化論[N];電腦報;2013年
中國博士學位論文全文數(shù)據(jù)庫 前4條
1 文坤梅;基于本體知識庫推理的語義搜索研究[D];華中科技大學;2007年
2 朱海平;基于概念圖匹配的語義搜索[D];上海交通大學;2006年
3 吳定峰;基于本體的語義搜索模型研究[D];中國農(nóng)業(yè)科學院;2012年
4 陳毅波;基于關(guān)聯(lián)數(shù)據(jù)和用戶本體的個性化知識服務關(guān)鍵技術(shù)研究[D];武漢大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 高杰旺;基于三維分類模型語義搜索的設計與實現(xiàn)[D];電子科技大學;2011年
2 蘭,
本文編號:530478
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/530478.html