基于用戶反饋的智能查詢擴展技術(shù)研究
本文關(guān)鍵詞:基于用戶反饋的智能查詢擴展技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,隨著互聯(lián)網(wǎng)信息技術(shù)的不斷發(fā)展,它已經(jīng)成為人們獲取信息最重要的途徑之一。而海量、異構(gòu)、復(fù)雜的網(wǎng)絡(luò)信息的存在,使人們快速準確地獲取所需信息變得更為困難。搜索引擎作為互聯(lián)網(wǎng)信息技術(shù)的一個重要分支,可以讓人們更有效地獲取所需信息。雖然現(xiàn)有的搜索引擎已能滿足用戶大部分的檢索需求,但仍然存在有一些問題有待優(yōu)化,如由于用戶未能很好地組織查詢以準確表達查詢需求,使查詢與文檔索引之間不匹配,并造成檢索結(jié)果準確率低等問題。本文研究的查詢擴展技術(shù)是解決該問題的有效方式之一,主要的工作包括以下四個方面:通過實驗分析相關(guān)的查詢擴展算法,如基于LSA、Ontology、ESA、Rocchio、Ide、Ide-dec、LCA、LA、LOCOOC、Apriori、NNLM、KLD、CHI1、CHI2等技術(shù)的查詢擴展算法,并進行各個算法之間的可融合分析、加權(quán)組合設(shè)計、參數(shù)調(diào)優(yōu)等工作;通過對相關(guān)查詢擴展算法的研究分析,本文提出了一種基于文檔重排序的混合查詢擴展算法,該算法首先在用戶對初次檢索提供反饋信息的基礎(chǔ)上,通過所提的策略對初檢文檔進行重新排序,然后使用混合的查詢擴展算法對重新排序后的前n篇文檔進行分析;在OHSUMED數(shù)據(jù)集上進行多組對比實驗,驗證了本文提出的基于文檔重排序的混合查詢擴展算法能有效提高檢索性能,其在平均準確率MAP等指標上較一些已有查詢擴展算法有一定的提高;將提出的查詢擴展算法應(yīng)用于已有的一些搜索引擎中,其主要基于Google和Bing開放的API實現(xiàn),首先用戶交互式地提供反饋信息,然后應(yīng)用本文提出的方法進行查詢擴展分析,最后擴展出一些詞語到初始查詢中自動進行二次檢索。
【關(guān)鍵詞】:查詢詞擴展 相關(guān)反饋 文檔重排 混合查詢擴展
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-12
- 1.1 研究背景和意義8-9
- 1.2 查詢擴展技術(shù)研究現(xiàn)狀9-10
- 1.3 課題主要研究內(nèi)容10-11
- 1.4 本文的組織結(jié)構(gòu)11-12
- 第2章 相關(guān)理論知識及主要技術(shù)12-21
- 2.1 信息檢索技術(shù)12-18
- 2.1.1 基本概念12
- 2.1.2 信息檢索模型12-17
- 2.1.3 信息檢索的評價指標17-18
- 2.2 查詢詞擴展技術(shù)18-20
- 2.2.1 基于全局分析的查詢擴展技術(shù)18-19
- 2.2.2 基于局部分析的查詢擴展技術(shù)19
- 2.2.3 基于本體語義的查詢擴展技術(shù)19-20
- 2.2.4 基于日志分析的查詢擴展技術(shù)20
- 2.3 本章小結(jié)20-21
- 第3章 基本查詢擴展技術(shù)研究21-37
- 3.1 基于向量空間模型的查詢擴展技術(shù)21-23
- 3.1.1 向量空間模型21-22
- 3.1.2 基于Rocchio的查詢擴展22-23
- 3.2 基于局部分析的查詢擴展技術(shù)23-25
- 3.3 基于關(guān)聯(lián)規(guī)則的查詢擴展技術(shù)25-28
- 3.3.1 關(guān)聯(lián)規(guī)則算法26-27
- 3.3.2 基于Apriori的查詢擴展27-28
- 3.4 基于語義分析的查詢擴展技術(shù)28-30
- 3.4.1 隱式語義分析技術(shù)28-29
- 3.4.2 顯式語義分析技術(shù)29
- 3.4.3 本體語義詞典分析技術(shù)29-30
- 3.5 基于信息論的查詢擴展技術(shù)30-32
- 3.5.1 信息熵理論30-31
- 3.5.2 基于分布分析的查詢擴展31-32
- 3.6 基于NNLM的查詢擴展技術(shù)32-36
- 3.7 本章小結(jié)36-37
- 第4章 基于文檔重排的混合查詢擴展技術(shù)研究37-42
- 4.1 文檔重排序策略37-39
- 4.2 混合查詢擴展策略39-41
- 4.3 基于文檔重排的混合查詢擴展算法設(shè)計41
- 4.4 本章小結(jié)41-42
- 第5章 查詢擴展實驗分析與系統(tǒng)實現(xiàn)42-58
- 5.1 數(shù)據(jù)集介紹與預(yù)處理42-44
- 5.1.1 OHSUMED數(shù)據(jù)集介紹42-44
- 5.1.2 數(shù)據(jù)預(yù)處理44
- 5.2 實驗系統(tǒng)總體設(shè)計44-46
- 5.3 實驗系統(tǒng)詳細設(shè)計46-47
- 5.3.1 文檔重排序模塊設(shè)計46
- 5.3.2 查詢擴展模塊設(shè)計46-47
- 5.4 實驗系統(tǒng)實現(xiàn)與結(jié)果分析47-51
- 5.4.1 開發(fā)平臺及工具48
- 5.4.2 各算法實驗結(jié)果對比與分析48-51
- 5.5 查詢擴展技術(shù)的實際應(yīng)用分析51-57
- 5.6 本章小結(jié)57-58
- 結(jié)論58-59
- 參考文獻59-64
- 致謝64
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 陽小華;蔣輝;馬家宇;;基于任務(wù)上下文的查詢擴展方法[J];鄭州大學(xué)學(xué)報(理學(xué)版);2010年01期
2 吳煈;張奇;黃萱菁;;基于整數(shù)線性規(guī)劃的查詢擴展[J];計算機研究與發(fā)展;2013年08期
3 何燕;;基于用戶反饋的查詢擴展研究[J];情報理論與實踐;2013年08期
4 黃偉群;;基于用戶視角的交互式查詢擴展研究[J];圖書情報工作;2014年05期
5 黃名選;嚴小衛(wèi);張師超;;查詢擴展技術(shù)進展與展望[J];計算機應(yīng)用與軟件;2007年11期
6 林國俊;葉飛躍;耿冬;鄭國良;;基于語義的概念查詢擴展[J];計算機工程與設(shè)計;2009年06期
7 鞏玉璽;王大玲;;一種改進的基于偽相關(guān)反饋的查詢擴展[J];微計算機信息;2009年15期
8 黃名選;張師超;嚴小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴展[J];計算機工程;2009年10期
9 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹的查詢擴展[J];計算機工程;2009年14期
10 羅小聰;;基于專用雙語詞典的查詢擴展[J];現(xiàn)代計算機(專業(yè)版);2009年10期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴展的數(shù)字檔案檢索策略[A];廣西計算機學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年
2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴展[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 林建方;李生;鄭德權(quán);;基于詞語搭配關(guān)系的查詢擴展方法[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
4 丁國棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴展方法[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
5 李東園;白宇;蔡東風;;基于用戶日志分析的查詢擴展研究[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
6 張志強;孟慶海;謝曉芹;;個性化的社會標簽查詢擴展技術(shù)研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年
7 王秉卿;張奇;吳立德;黃萱菁;;機器學(xué)習的查詢擴展在博客檢索中的應(yīng)用[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
8 王秉卿;黃萱菁;;基于線性模型的查詢擴展方法[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
9 晉松;林鴻飛;蘇綏;;基于標簽共現(xiàn)的查詢擴展研究[A];中國計算機語言學(xué)研究前沿進展(2007-2009)[C];2009年
10 郭文;史曉東;陳毅東;;跨語言信息檢索中的查詢擴展[A];第四屆全國學(xué)生計算語言學(xué)研討會會議論文集[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 鐘威 何擁軍;數(shù)字檔案信息擴展查詢功能需求分析及實現(xiàn)方式[N];中國檔案報;2011年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 仲兆滿;事件本體及其在查詢擴展中的應(yīng)用[D];上海大學(xué);2011年
2 王俊義;正負相關(guān)反饋與查詢擴展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 吳德鈺;基于標簽篩選的文檔排序方法研究[D];華中師范大學(xué);2015年
2 李維銀;基于有監(jiān)督學(xué)習的查詢擴展技術(shù)研究[D];北京理工大學(xué);2015年
3 鐘廷偉;生物醫(yī)學(xué)文本的標注與檢索研究[D];電子科技大學(xué);2015年
4 王宇;煤礦安全事件本體構(gòu)建及其查詢擴展的研究與應(yīng)用[D];北京工業(yè)大學(xué);2015年
5 崔倩倩;基于文檔重構(gòu)的查詢擴展[D];北京工業(yè)大學(xué);2015年
6 陳建榮;基于用戶反饋的智能查詢擴展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年
7 燕澤權(quán);基于主題模型的查詢擴展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年
8 姚小同;查詢擴展技術(shù)研究[D];北京郵電大學(xué);2009年
9 許威;基于概念格的查詢擴展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年
10 胡保祥;基于查詢?nèi)罩镜牟樵償U展研究[D];北京郵電大學(xué);2013年
本文關(guān)鍵詞:基于用戶反饋的智能查詢擴展技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號:391601
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/391601.html