基于用戶查詢意圖識別的個性化搜索方法研究
本文關(guān)鍵詞:基于用戶查詢意圖識別的個性化搜索方法研究
更多相關(guān)文章: 用戶查詢意圖 查詢擴(kuò)展 用戶模型 LDA 個性化搜索
【摘要】:隨著互聯(lián)網(wǎng)信息的快速增長,用戶在使用傳統(tǒng)搜索引擎進(jìn)行信息檢索時,經(jīng)常會獲得海量搜索結(jié)果,這些結(jié)果大多與用戶搜索意圖相去甚遠(yuǎn)。用戶往往對這些信息無所適從,這造成了嚴(yán)重的信息過載。人們迫切希望在信息檢索過程中,搜索引擎能理解其個性化信息需求,返回與其查詢意圖高度匹配的搜索結(jié)果。鑒于此,本文提出了一種基于用戶查詢意圖識別的個性化搜索框架,該搜索框架主要包括以下四個部分:首先,對搜索語料庫上的文檔集進(jìn)行預(yù)處理,并在該語料庫上構(gòu)建統(tǒng)一的概率主題模型C-LDA;其次,針對每個搜索引擎用戶,利用C-LDA求出其搜索歷史文檔的主題概率分布并以此作為其用戶模型;再者,用戶進(jìn)行信息檢索時,利用C-LDA和用戶模型對其查詢意圖進(jìn)行個性化識別;最后,搜索引擎對初始查詢進(jìn)行基于用戶意圖和局部共現(xiàn)的查詢擴(kuò)展,并將最終結(jié)果返回給用戶。本文的創(chuàng)新工作如下:(1)針對現(xiàn)有的基于主題的用戶建模方法準(zhǔn)確度不高的問題,本文提出了一種利用搜索語料庫的公共LDA模型來構(gòu)建用戶模型的方法。通過與直接在用戶搜索歷史文檔中使用概率主題模型的方法相比,NDCG值分別提高了1.7%。(2)針對現(xiàn)在查詢擴(kuò)展中用戶意圖識別較難的問題,提出了一種新的用戶查詢意圖識別方法。即利用查詢主題和用戶模型識別其查詢意圖,而后基于用戶查詢意圖和局部共現(xiàn)方法對其原查詢進(jìn)行查詢擴(kuò)展。通過與基于獨立分量分析的語義聚類的查詢擴(kuò)展方法相比,我們的方法具有更好的性能,其中,Precision@5值提高了7.1%,Precision@10值提高了7.4%。
【關(guān)鍵詞】:用戶查詢意圖 查詢擴(kuò)展 用戶模型 LDA 個性化搜索
【學(xué)位授予單位】:湘潭大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-8
- 第1章 緒論8-13
- 1.1 研究背景及意義8
- 1.2 國內(nèi)外研究現(xiàn)狀8-11
- 1.2.1 用戶建建模8-9
- 1.2.2 用戶查詢意圖識別9-10
- 1.2.3 查詢擴(kuò)展10-11
- 1.3 主要研究內(nèi)容11-12
- 1.4 論文結(jié)構(gòu)12-13
- 第2章 個性化搜索相關(guān)理論與技術(shù)13-22
- 2.1 Lucene13-16
- 2.2 用戶模型16-18
- 2.3 主題模型18-21
- 2.3.1 主題模型概述18-19
- 2.3.2 LDA模型19-21
- 2.4 小結(jié)21-22
- 第3章 用戶模型的構(gòu)建與更新22-27
- 3.1 引言22-23
- 3.2 構(gòu)建C-LDA模型23-24
- 3.2.1 文檔預(yù)處理23
- 3.2.2 生成C-LDA模型23-24
- 3.3 用戶建模24-25
- 3.4 用戶模型更新25-26
- 3.5 小結(jié)26-27
- 第4章 基于用戶意圖的個性化查詢擴(kuò)展27-33
- 4.1 引言27-28
- 4.2 用戶查詢意圖識別28-29
- 4.3 基于用戶查詢意圖的相關(guān)文檔排序29-31
- 4.4 基于用戶意圖和局部共現(xiàn)的查詢擴(kuò)展31-32
- 4.5 小結(jié)32-33
- 第5章 系統(tǒng)實現(xiàn)與結(jié)果評估33-46
- 5.1. 實驗環(huán)境33
- 5.2 測評集和測評指標(biāo)33-36
- 5.3 基于Lucene的個性化搜索引擎設(shè)計36-41
- 5.3.1 基于Lucene的搜索引擎實現(xiàn)36-38
- 5.3.2 個性化搜索38-41
- 5.4 主題模型的構(gòu)建41
- 5.5 基于用戶查詢意圖識別的個性化搜索41-45
- 5.5.1 用戶建模42-43
- 5.5.2 基于用戶意圖的個性化查詢擴(kuò)展43-45
- 5.6 小結(jié)45-46
- 第6章 總結(jié)與展望46-48
- 6.1 論文總結(jié)46
- 6.2 未來工作展望46-48
- 參考文獻(xiàn)48-51
- 致謝51-52
- 攻讀碩士學(xué)位期間發(fā)表的論文和參與的科研項目52
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 袁柳;張龍波;;個性化搜索中的用戶特征模型研究[J];計算機(jī)工程與應(yīng)用;2011年15期
2 陳晨;李敏波;;基于本地插件的個性化搜索研究[J];計算機(jī)應(yīng)用與軟件;2011年05期
3 申艷光;王敏;范永健;;個性化搜索在農(nóng)產(chǎn)品商務(wù)系統(tǒng)中的應(yīng)用研究[J];安徽農(nóng)業(yè)科學(xué);2011年26期
4 斯蒂芬·卡斯;;個性化搜索[J];科技創(chuàng)業(yè);2011年08期
5 桑艷艷;劉培剛;李勇;;擬合用戶偏好的個性化搜索[J];情報科學(xué);2008年08期
6 軒景泉;王瑋;安正鋒;;分布式教學(xué)資源的個性化搜索[J];吉林大學(xué)學(xué)報(信息科學(xué)版);2008年05期
7 俞偉明;打造個性化搜索菜單[J];電腦知識與技術(shù);2004年16期
8 申艷光;王敏;范永健;;面向隱私保護(hù)的個性化搜索結(jié)果排序方法研究[J];數(shù)學(xué)的實踐與認(rèn)識;2011年19期
9 楊軍;武秀川;郭艷燕;;基于跨系統(tǒng)的個性化搜索系統(tǒng)模型設(shè)計[J];微處理機(jī);2013年03期
10 帥劍平;周婭;;基于聚類算法的個性化搜索研究[J];計算機(jī)系統(tǒng)應(yīng)用;2009年01期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 李家舒;曹守峰;范文慶;黃瑋;;基于移動平臺的黃頁個性化搜索建模技術(shù)研究[A];第九屆中國通信學(xué)會學(xué)術(shù)年會論文集[C];2012年
2 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2006)——第2屆中國普適計算學(xué)術(shù)會議(PCC'06)論文集[C];2006年
中國重要報紙全文數(shù)據(jù)庫 前4條
1 李遠(yuǎn);谷歌發(fā)布個性化搜索工具 可選屬性保護(hù)個人隱私權(quán)[N];中華新聞報;2007年
2 Google(谷歌)中國研究院副院長 張智威;社區(qū)個性化搜索漸熱 難在掌握用戶信息[N];中國電子報;2008年
3 孫仲;傳統(tǒng)搜索遭遇巨大挑戰(zhàn) 個性化搜索將成趨勢[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2009年
4 本報記者 吳艷;眼球操控世界:遠(yuǎn)在天邊,近在眼前[N];中國知識產(chǎn)權(quán)報;2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 靳婷;基于上下文與面向社會媒體的信息推薦方法研究[D];復(fù)旦大學(xué);2014年
2 陳冬玲;基于潛在語義的個性化搜索關(guān)鍵技術(shù)研究[D];東北大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 馬凌;基于微博的個性化搜索系統(tǒng)[D];湖南科技大學(xué);2015年
2 林博;基于用戶查詢意圖識別的個性化搜索方法研究[D];湘潭大學(xué);2015年
3 劉俊暉;企業(yè)內(nèi)部個性化搜索系統(tǒng)的研究與實現(xiàn)[D];復(fù)旦大學(xué);2008年
4 杜中國;基于半監(jiān)督聚類的個性化搜索研究[D];青島理工大學(xué);2011年
5 李雪;旅游個性化搜索系統(tǒng)的研究與實現(xiàn)[D];北京郵電大學(xué);2013年
6 陳晨;基于興趣多邊形的個性化搜索系統(tǒng)的研究與實現(xiàn)[D];復(fù)旦大學(xué);2010年
7 陳琛;基于社會化標(biāo)簽的個性化搜索研究[D];揚(yáng)州大學(xué);2008年
8 范慧;以博客內(nèi)容為對象的個性化搜索研究[D];華中科技大學(xué);2010年
9 王敏;個性化搜索中隱私保護(hù)的問題研究[D];河北工程大學(xué);2012年
10 宋懿;電視節(jié)目的個性化搜索研究[D];上海交通大學(xué);2008年
,本文編號:1048323
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1048323.html