基于用戶反饋的智能查詢擴(kuò)展技術(shù)研究
本文關(guān)鍵詞:基于用戶反饋的智能查詢擴(kuò)展技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來(lái),隨著互聯(lián)網(wǎng)信息技術(shù)的不斷發(fā)展,它已經(jīng)成為人們獲取信息最重要的途徑之一。而海量、異構(gòu)、復(fù)雜的網(wǎng)絡(luò)信息的存在,使人們快速準(zhǔn)確地獲取所需信息變得更為困難。搜索引擎作為互聯(lián)網(wǎng)信息技術(shù)的一個(gè)重要分支,可以讓人們更有效地獲取所需信息。雖然現(xiàn)有的搜索引擎已能滿足用戶大部分的檢索需求,但仍然存在有一些問(wèn)題有待優(yōu)化,如由于用戶未能很好地組織查詢以準(zhǔn)確表達(dá)查詢需求,使查詢與文檔索引之間不匹配,并造成檢索結(jié)果準(zhǔn)確率低等問(wèn)題。本文研究的查詢擴(kuò)展技術(shù)是解決該問(wèn)題的有效方式之一,主要的工作包括以下四個(gè)方面:通過(guò)實(shí)驗(yàn)分析相關(guān)的查詢擴(kuò)展算法,如基于LSA、Ontology、ESA、Rocchio、Ide、Ide-dec、LCA、LA、LOCOOC、Apriori、NNLM、KLD、CHI1、CHI2等技術(shù)的查詢擴(kuò)展算法,并進(jìn)行各個(gè)算法之間的可融合分析、加權(quán)組合設(shè)計(jì)、參數(shù)調(diào)優(yōu)等工作;通過(guò)對(duì)相關(guān)查詢擴(kuò)展算法的研究分析,本文提出了一種基于文檔重排序的混合查詢擴(kuò)展算法,該算法首先在用戶對(duì)初次檢索提供反饋信息的基礎(chǔ)上,通過(guò)所提的策略對(duì)初檢文檔進(jìn)行重新排序,然后使用混合的查詢擴(kuò)展算法對(duì)重新排序后的前n篇文檔進(jìn)行分析;在OHSUMED數(shù)據(jù)集上進(jìn)行多組對(duì)比實(shí)驗(yàn),驗(yàn)證了本文提出的基于文檔重排序的混合查詢擴(kuò)展算法能有效提高檢索性能,其在平均準(zhǔn)確率MAP等指標(biāo)上較一些已有查詢擴(kuò)展算法有一定的提高;將提出的查詢擴(kuò)展算法應(yīng)用于已有的一些搜索引擎中,其主要基于Google和Bing開(kāi)放的API實(shí)現(xiàn),首先用戶交互式地提供反饋信息,然后應(yīng)用本文提出的方法進(jìn)行查詢擴(kuò)展分析,最后擴(kuò)展出一些詞語(yǔ)到初始查詢中自動(dòng)進(jìn)行二次檢索。
【關(guān)鍵詞】:查詢?cè)~擴(kuò)展 相關(guān)反饋 文檔重排 混合查詢擴(kuò)展
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-12
- 1.1 研究背景和意義8-9
- 1.2 查詢擴(kuò)展技術(shù)研究現(xiàn)狀9-10
- 1.3 課題主要研究?jī)?nèi)容10-11
- 1.4 本文的組織結(jié)構(gòu)11-12
- 第2章 相關(guān)理論知識(shí)及主要技術(shù)12-21
- 2.1 信息檢索技術(shù)12-18
- 2.1.1 基本概念12
- 2.1.2 信息檢索模型12-17
- 2.1.3 信息檢索的評(píng)價(jià)指標(biāo)17-18
- 2.2 查詢?cè)~擴(kuò)展技術(shù)18-20
- 2.2.1 基于全局分析的查詢擴(kuò)展技術(shù)18-19
- 2.2.2 基于局部分析的查詢擴(kuò)展技術(shù)19
- 2.2.3 基于本體語(yǔ)義的查詢擴(kuò)展技術(shù)19-20
- 2.2.4 基于日志分析的查詢擴(kuò)展技術(shù)20
- 2.3 本章小結(jié)20-21
- 第3章 基本查詢擴(kuò)展技術(shù)研究21-37
- 3.1 基于向量空間模型的查詢擴(kuò)展技術(shù)21-23
- 3.1.1 向量空間模型21-22
- 3.1.2 基于Rocchio的查詢擴(kuò)展22-23
- 3.2 基于局部分析的查詢擴(kuò)展技術(shù)23-25
- 3.3 基于關(guān)聯(lián)規(guī)則的查詢擴(kuò)展技術(shù)25-28
- 3.3.1 關(guān)聯(lián)規(guī)則算法26-27
- 3.3.2 基于Apriori的查詢擴(kuò)展27-28
- 3.4 基于語(yǔ)義分析的查詢擴(kuò)展技術(shù)28-30
- 3.4.1 隱式語(yǔ)義分析技術(shù)28-29
- 3.4.2 顯式語(yǔ)義分析技術(shù)29
- 3.4.3 本體語(yǔ)義詞典分析技術(shù)29-30
- 3.5 基于信息論的查詢擴(kuò)展技術(shù)30-32
- 3.5.1 信息熵理論30-31
- 3.5.2 基于分布分析的查詢擴(kuò)展31-32
- 3.6 基于NNLM的查詢擴(kuò)展技術(shù)32-36
- 3.7 本章小結(jié)36-37
- 第4章 基于文檔重排的混合查詢擴(kuò)展技術(shù)研究37-42
- 4.1 文檔重排序策略37-39
- 4.2 混合查詢擴(kuò)展策略39-41
- 4.3 基于文檔重排的混合查詢擴(kuò)展算法設(shè)計(jì)41
- 4.4 本章小結(jié)41-42
- 第5章 查詢擴(kuò)展實(shí)驗(yàn)分析與系統(tǒng)實(shí)現(xiàn)42-58
- 5.1 數(shù)據(jù)集介紹與預(yù)處理42-44
- 5.1.1 OHSUMED數(shù)據(jù)集介紹42-44
- 5.1.2 數(shù)據(jù)預(yù)處理44
- 5.2 實(shí)驗(yàn)系統(tǒng)總體設(shè)計(jì)44-46
- 5.3 實(shí)驗(yàn)系統(tǒng)詳細(xì)設(shè)計(jì)46-47
- 5.3.1 文檔重排序模塊設(shè)計(jì)46
- 5.3.2 查詢擴(kuò)展模塊設(shè)計(jì)46-47
- 5.4 實(shí)驗(yàn)系統(tǒng)實(shí)現(xiàn)與結(jié)果分析47-51
- 5.4.1 開(kāi)發(fā)平臺(tái)及工具48
- 5.4.2 各算法實(shí)驗(yàn)結(jié)果對(duì)比與分析48-51
- 5.5 查詢擴(kuò)展技術(shù)的實(shí)際應(yīng)用分析51-57
- 5.6 本章小結(jié)57-58
- 結(jié)論58-59
- 參考文獻(xiàn)59-64
- 致謝64
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 陽(yáng)小華;蔣輝;馬家宇;;基于任務(wù)上下文的查詢擴(kuò)展方法[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2010年01期
2 吳煈;張奇;黃萱菁;;基于整數(shù)線性規(guī)劃的查詢擴(kuò)展[J];計(jì)算機(jī)研究與發(fā)展;2013年08期
3 何燕;;基于用戶反饋的查詢擴(kuò)展研究[J];情報(bào)理論與實(shí)踐;2013年08期
4 黃偉群;;基于用戶視角的交互式查詢擴(kuò)展研究[J];圖書(shū)情報(bào)工作;2014年05期
5 黃名選;嚴(yán)小衛(wèi);張師超;;查詢擴(kuò)展技術(shù)進(jìn)展與展望[J];計(jì)算機(jī)應(yīng)用與軟件;2007年11期
6 林國(guó)俊;葉飛躍;耿冬;鄭國(guó)良;;基于語(yǔ)義的概念查詢擴(kuò)展[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年06期
7 鞏玉璽;王大玲;;一種改進(jìn)的基于偽相關(guān)反饋的查詢擴(kuò)展[J];微計(jì)算機(jī)信息;2009年15期
8 黃名選;張師超;嚴(yán)小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年10期
9 張超盟;李戰(zhàn)懷;溫宗臣;;局部上下文分析剪枝概念樹(shù)的查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年14期
10 羅小聰;;基于專用雙語(yǔ)詞典的查詢擴(kuò)展[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年10期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 黃明初;鐘威;何擁軍;蒙斌;;基于查詢擴(kuò)展的數(shù)字檔案檢索策略[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
2 呂碧波;趙軍;;基于相關(guān)文檔池建模的查詢擴(kuò)展[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
3 林建方;李生;鄭德權(quán);;基于詞語(yǔ)搭配關(guān)系的查詢擴(kuò)展方法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
4 丁國(guó)棟;白碩;王斌;;一種基于局部共現(xiàn)的查詢擴(kuò)展方法[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年
5 李東園;白宇;蔡?hào)|風(fēng);;基于用戶日志分析的查詢擴(kuò)展研究[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
6 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年
7 王秉卿;張奇;吳立德;黃萱菁;;機(jī)器學(xué)習(xí)的查詢擴(kuò)展在博客檢索中的應(yīng)用[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
8 王秉卿;黃萱菁;;基于線性模型的查詢擴(kuò)展方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
9 晉松;林鴻飛;蘇綏;;基于標(biāo)簽共現(xiàn)的查詢擴(kuò)展研究[A];中國(guó)計(jì)算機(jī)語(yǔ)言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
10 郭文;史曉東;陳毅東;;跨語(yǔ)言信息檢索中的查詢擴(kuò)展[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 鐘威 何擁軍;數(shù)字檔案信息擴(kuò)展查詢功能需求分析及實(shí)現(xiàn)方式[N];中國(guó)檔案報(bào);2011年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年
2 王俊義;正負(fù)相關(guān)反饋與查詢擴(kuò)展技術(shù)的研究[D];內(nèi)蒙古大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 吳德鈺;基于標(biāo)簽篩選的文檔排序方法研究[D];華中師范大學(xué);2015年
2 李維銀;基于有監(jiān)督學(xué)習(xí)的查詢擴(kuò)展技術(shù)研究[D];北京理工大學(xué);2015年
3 鐘廷偉;生物醫(yī)學(xué)文本的標(biāo)注與檢索研究[D];電子科技大學(xué);2015年
4 王宇;煤礦安全事件本體構(gòu)建及其查詢擴(kuò)展的研究與應(yīng)用[D];北京工業(yè)大學(xué);2015年
5 崔倩倩;基于文檔重構(gòu)的查詢擴(kuò)展[D];北京工業(yè)大學(xué);2015年
6 陳建榮;基于用戶反饋的智能查詢擴(kuò)展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年
7 燕澤權(quán);基于主題模型的查詢擴(kuò)展技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2014年
8 姚小同;查詢擴(kuò)展技術(shù)研究[D];北京郵電大學(xué);2009年
9 許威;基于概念格的查詢擴(kuò)展系統(tǒng)及建格算法研究[D];北京郵電大學(xué);2008年
10 胡保祥;基于查詢?nèi)罩镜牟樵償U(kuò)展研究[D];北京郵電大學(xué);2013年
本文關(guān)鍵詞:基于用戶反饋的智能查詢擴(kuò)展技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):391601
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/391601.html