檢索結(jié)果多樣化及其評測方法研究
本文關(guān)鍵詞:檢索結(jié)果多樣化及其評測方法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:搜索引擎作為用戶訪問互聯(lián)網(wǎng)的入口,其檢索結(jié)果是否能夠滿足用戶查詢需求直接影響著用戶使用互聯(lián)網(wǎng)的體驗。然而,用戶的真實查詢意圖卻很難從查詢詞本身獲取,這是由于當(dāng)前廣泛采用的關(guān)鍵詞查詢與選擇性瀏覽的搜索引擎交互方式使得用戶提交的查詢詞往往簡短甚或歧義。針對這一問題,搜索引擎通常采用對檢索結(jié)果進(jìn)行多樣化處理的策略加以應(yīng)對。檢索結(jié)果多樣化旨在通過在檢索結(jié)果中放置與不同內(nèi)容相關(guān)的網(wǎng)頁,使得該檢索結(jié)果能夠在盡可能靠前的位置滿足不同用戶的信息需求。其研究內(nèi)容主要包括兩個大的方面,即如何準(zhǔn)確、有效地產(chǎn)生多樣化的檢索結(jié)果以及如何合理評價一個經(jīng)過多樣化后的檢索結(jié)果的好壞。圍繞這兩個主要方向,本文從以下幾個方面展開研究工作:1.檢索結(jié)果多樣化方法研究:針對當(dāng)前研究中幾乎都是采用貪心搜索算法來近似解決檢索結(jié)果多樣化中的NP-hard問題,本文提出通過利用文檔之間存在的局部有序性對全搜索過程進(jìn)行無損剪枝,以提高全搜索的效率。根據(jù)搜索引擎用戶在通常情況下只瀏覽檢索結(jié)果第一頁的事實經(jīng)驗,本文進(jìn)一步提出了“關(guān)鍵文檔”與“搜索窗口”的策略來對全搜索過程進(jìn)行剪枝。通過實驗,我們驗證了本文所提出的算法在能夠提供足夠檢索系統(tǒng)進(jìn)行實時計算的效率的同時,可帶來比貪心算法更好的性能。2.多樣化檢索結(jié)果評測方法研究:針對已有的多樣化評測方法在評測檢索結(jié)果時將不同類型的用戶意圖同等看待的問題,本文首先提出在評測多樣化檢索結(jié)果時,用戶不同類型的意圖在滿足程度上應(yīng)當(dāng)具有不同的特征。而后引入衰減函數(shù)來刻畫這樣的特征,且不同類型的意圖對應(yīng)著不同的衰減函數(shù)。最后,本文提出考慮了用戶意圖類型信息的檢索結(jié)果多樣化評測框架,并將用戶意圖的類型具體到信息類與導(dǎo)航類來詳細(xì)討論該框架的特性。通過實驗,我們驗證了由本文提出的衰減函數(shù)所構(gòu)成的多樣化檢索結(jié)果評測方法優(yōu)于現(xiàn)有的方法。3.多樣化檢索結(jié)果評測方法的分析方法研究:針對已有的多樣化評測方法的評測大都從分析評測方法某一方面的特性,如穩(wěn)定性、直觀性等,來比較不同評測方法的優(yōu)劣,本文提出通過比較多樣化評測方法與用戶偏好的相關(guān)性來對多樣化評測方法進(jìn)行分析,并提出了基于用戶偏好的加權(quán)相關(guān)性方法來定量計算。該方法通過計算評測方法與用戶檢索偏好之間的加權(quán)相關(guān)性,克服了其他方法在評測多樣化評測方法時極少考慮到用戶行為信息的缺點。
【關(guān)鍵詞】:檢索結(jié)果多樣化 用戶意圖 全搜索 評測方法
【學(xué)位授予單位】:清華大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要3-4
- Abstract4-9
- 第1章 引言9-21
- 1.1 研究背景9-11
- 1.2 相關(guān)研究11-17
- 1.2.1 查詢詞的用戶意圖挖掘12-13
- 1.2.2 傳統(tǒng)信息檢索模型13-14
- 1.2.3 檢索結(jié)果多樣化方法14-15
- 1.2.4 多樣化檢索結(jié)果的評測方法15-16
- 1.2.5 多樣化檢索結(jié)果評測方法的評測16-17
- 1.3 現(xiàn)有方法存在的問題17-19
- 1.3.1 檢索結(jié)果多樣化方法17-18
- 1.3.2 多樣化檢索結(jié)果的評測方法18
- 1.3.3 多樣化檢索結(jié)果評測方法的評測18-19
- 1.4 論文的研究內(nèi)容19
- 1.5 論文組織結(jié)構(gòu)19-21
- 第2章 檢索結(jié)果多樣化方法研究21-48
- 2.1 本章 引言21-22
- 2.2 相關(guān)工作22-23
- 2.3 預(yù)備知識23-26
- 2.3.1 多樣化檢索結(jié)果評測方法的討論24-26
- 2.3.2 貪心算法的討論26
- 2.4 檢索結(jié)果多樣化任務(wù)中文檔的局部有序性26-28
- 2.5 尋找更多順序?qū)?/span>28-32
- 2.6 帶剪枝的全搜索算法32-39
- 2.6.1 利用順序?qū)θ阉魑臋n候選集合剪枝32-35
- 2.6.2 對全搜索的窮舉過程進(jìn)行剪枝35-39
- 2.7 進(jìn)一步剪枝策略39-41
- 2.7.1 關(guān)鍵位置剪枝策略40
- 2.7.2 搜索窗口剪枝策略40-41
- 2.8 實驗41-46
- 2.8.1 實驗介紹41-43
- 2.8.2 檢索結(jié)果多樣化算法性能實驗43-45
- 2.8.3 檢索結(jié)果多樣化算法效率實驗45-46
- 2.9 本章小結(jié)46-48
- 第3章 多樣化檢索結(jié)果評測方法研究48-66
- 3.1 本章 引言48-49
- 3.2 相關(guān)工作49-54
- 3.2.1 檢索結(jié)果的標(biāo)注50-51
- 3.2.2 現(xiàn)有評測方法51-54
- 3.3 利用用戶意圖的類型信息對多樣化檢索結(jié)果進(jìn)行評測的方法54-56
- 3.3.1 衰減函數(shù)55
- 3.3.2 文檔增益55-56
- 3.3.3 多樣化評測框架56
- 3.3.4 STA-Measure與現(xiàn)有評測方法的關(guān)系56
- 3.4 STA-Measure的應(yīng)用56-58
- 3.4.1 衰減函數(shù)的討論56-58
- 3.5 多樣化檢索結(jié)果評測中的NP-hard問題58-60
- 3.5.1 標(biāo)注文檔集中的順序?qū)?/span>59-60
- 3.6 實驗與評測60-64
- 3.6.1 多樣化檢索評測方法的評測60-62
- 3.6.2 數(shù)據(jù)集62
- 3.6.3 STA-Measure性能分析62-64
- 3.6.4 Pes OP_ES_SWKS算法尋找最優(yōu)排序64
- 3.7 本章小結(jié)64-66
- 第4章 多樣化檢索結(jié)果評測方法的分析方法研究66-86
- 4.1 本章 引言66-68
- 4.2 相關(guān)工作68-69
- 4.3 收集用戶偏好信息69-75
- 4.3.1 用戶偏好收集的在線系統(tǒng)70-73
- 4.3.2 不同等級用戶偏好的比較73-75
- 4.4 評測方法與用戶偏好的相關(guān)性討論75-79
- 4.4.1 評測方法與用戶偏好的相關(guān)性討論75-79
- 4.5 利用用戶偏好對評測方法進(jìn)行評測的方法79-80
- 4.6 MUP與Kendall’s τ 的關(guān)系80-81
- 4.7 實驗81-85
- 4.7.1 實驗數(shù)據(jù)集81
- 4.7.2 對比實驗81-83
- 4.7.3 MUP與直覺性的比較83-85
- 4.8 本章小結(jié)85-86
- 第5章 總結(jié)與展望86-89
- 5.1 研究工作總結(jié)86-87
- 5.2 未來工作87-89
- 參考文獻(xiàn)89-96
- 致謝96-98
- 附錄A 論文中的圖表索引98-100
- 個人簡歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果100-101
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 龔筆宏;;一種新的分類評測方法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
2 閆英杰;林鴻飛;王劍峰;;基于混合策略的中文文摘自動評測方法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
3 李樹平;范書平;李勝東;司巧梅;曹英;;話題跟蹤研究[J];微計算機信息;2012年10期
4 龔筆宏;彭波;;對文本分類評測方法穩(wěn)定性的研究[J];模式識別與人工智能;2008年01期
5 馬颯颯;費揚潔;趙守偉;;安全關(guān)鍵軟件防危性評測方法研究[J];計算機工程與設(shè)計;2008年23期
6 吳新剛;;基于VSTO的Office操作技能自動評測方法[J];中國教育技術(shù)裝備;2009年33期
7 吳辰文;LAN系統(tǒng)性能評測方法研究[J];蘭州理工大學(xué)學(xué)報;2004年02期
8 吳保榮;;漢字編碼優(yōu)劣評測方法的探討[J];湖北經(jīng)濟學(xué)院學(xué)報(人文社會科學(xué)版);2009年06期
9 史洪杰;畢明珠;;淺析色帶帶芯質(zhì)量評測方法[J];辦公自動化;2012年03期
10 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 許良奇;;網(wǎng)絡(luò)輿情系統(tǒng)的信源可信度評測方法的思考[A];中國新聞技術(shù)工作者聯(lián)合會2011年學(xué)術(shù)年會論文集(上篇)[C];2011年
2 張銘;;傳統(tǒng)和數(shù)字電影影像的質(zhì)量評測方法探討[A];中國電影電視技術(shù)學(xué)會影視科技論文集[C];2003年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 陳飛;檢索結(jié)果多樣化及其評測方法研究[D];清華大學(xué);2015年
2 張瓏;漢語普通話發(fā)音質(zhì)量自動評測方法研究[D];哈爾濱工業(yè)大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 袁文清;基于用戶收益的歸并比較評測方法研究[D];北京大學(xué);2013年
2 黃毅;視差型三維顯示系統(tǒng)視覺疲勞度評測方法及應(yīng)用的研究[D];北京理工大學(xué);2015年
3 翟羽佳;IDS評測方法及功能測試研究[D];吉林大學(xué);2006年
本文關(guān)鍵詞:檢索結(jié)果多樣化及其評測方法研究,由筆耕文化傳播整理發(fā)布。
本文編號:288120
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/288120.html