一種基于知識(shí)圖譜的用戶搜索意圖挖掘方法的研究
本文關(guān)鍵詞:一種基于知識(shí)圖譜的用戶搜索意圖挖掘方法的研究
更多相關(guān)文章: 知識(shí)圖譜 搜索意圖 搜索引擎 樸素貝葉斯
【摘要】:如何讓計(jì)算機(jī)理解用戶的搜索意圖是一個(gè)非常復(fù)雜的問(wèn)題,因?yàn)?針對(duì)相同查詢,不同人的搜索意圖可能差異巨大;對(duì)同一搜索意圖,不同人使用的查詢可能完全不同。為了實(shí)現(xiàn)對(duì)特定查詢搜索意圖的理解,可以通過(guò)使用分析查詢記錄,建立興趣模型的方法,但這也不能幫助理解新的查詢?cè)~,因?yàn)橛脩舻囊鈭D并不是固定的主題,需求意圖在不斷演變。即使用戶輸入的是同一查詢?cè)~,也并不代表作用戶想知道的是關(guān)于相同主題的信息、資源或網(wǎng)絡(luò)服務(wù)。基于分類(lèi)的搜索意圖挖掘是目前搜索意圖挖掘研究領(lǐng)域的主流,首先建立意圖分類(lèi)體系,然后將查詢文本歸類(lèi)到這些類(lèi)別之中。目前主流的搜索意圖類(lèi)目體系已經(jīng)構(gòu)建得比較完善,但是由于通常情況下用戶的查詢都很短,帶有一定歧義性,分類(lèi)特征有限,在這種情況下進(jìn)行文本分類(lèi)比較困難,目前面對(duì)這種情況還沒(méi)有一種特別有效的分類(lèi)特征提取方法。本文提出一種基于知識(shí)圖譜的搜索意圖挖掘方法,使用知識(shí)圖譜包含的詞間關(guān)聯(lián)來(lái)對(duì)用戶查詢中的關(guān)鍵詞進(jìn)行權(quán)重調(diào)整,從而提高分類(lèi)準(zhǔn)確率,提高搜索意圖挖掘效果。經(jīng)過(guò)實(shí)驗(yàn),與數(shù)種經(jīng)典權(quán)重調(diào)整方法相比較,證實(shí)本文提出的方法能夠有效的提升分類(lèi)準(zhǔn)確率,對(duì)用戶搜索意圖挖掘效果提高有較大幫助。相信,經(jīng)過(guò)后續(xù)研究,使用該方法對(duì)交互式信息檢索和實(shí)時(shí)人機(jī)對(duì)話也將會(huì)有不錯(cuò)的效果。
【關(guān)鍵詞】:知識(shí)圖譜 搜索意圖 搜索引擎 樸素貝葉斯
【學(xué)位授予單位】:國(guó)際關(guān)系學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 引言8-13
- 1.1 選題背景8-9
- 1.2 研究?jī)?nèi)容與本文貢獻(xiàn)9-11
- 1.3 論文結(jié)構(gòu)11-13
- 第2章 研究現(xiàn)狀與相關(guān)理論基礎(chǔ)13-37
- 2.1 知識(shí)圖譜13-26
- 2.1.1 知識(shí)圖譜研究現(xiàn)狀13-16
- 2.1.2 知識(shí)圖譜構(gòu)建方法16-18
- 2.1.3 知識(shí)圖譜的表示方法18-21
- 2.1.4 知識(shí)圖譜的存儲(chǔ)21-22
- 2.1.5 知識(shí)圖譜的一些應(yīng)用場(chǎng)景22-25
- 2.1.6 知識(shí)圖譜研究的挑戰(zhàn)25-26
- 2.2 搜索意圖分類(lèi)26-28
- 2.2.1 搜索意圖概念26-27
- 2.2.2 搜索意圖體系27-28
- 2.2.3 搜索意圖分類(lèi)目的28
- 2.3 中文分詞28-31
- 2.4 文本分類(lèi)31-36
- 2.4.1 文本分類(lèi)方法31-34
- 2.4.2 貝葉斯分類(lèi)器34-36
- 2.5 總結(jié)36-37
- 第3章 基于知識(shí)圖譜的搜索意圖挖掘方法37-45
- 3.1 實(shí)體詞和實(shí)體詞屬性的獲取37-39
- 3.2 知識(shí)圖譜的關(guān)系構(gòu)建39-40
- 3.3 貢獻(xiàn)值和貢獻(xiàn)因子的計(jì)算40
- 3.4 權(quán)重計(jì)算40-42
- 3.5 樸素貝葉斯分類(lèi)器42-43
- 3.6 方法流程43-44
- 3.7 總結(jié)44-45
- 第4章 實(shí)驗(yàn)45-50
- 4.1 評(píng)測(cè)標(biāo)準(zhǔn)45-46
- 4.2 實(shí)驗(yàn)數(shù)據(jù)集46-47
- 4.3 實(shí)驗(yàn)結(jié)果47-50
- 4.3.1 貢獻(xiàn)因子對(duì)準(zhǔn)確率的影響47
- 4.3.2 權(quán)重調(diào)整方法對(duì)準(zhǔn)確率影響47-49
- 4.3.3 問(wèn)題文本長(zhǎng)度對(duì)準(zhǔn)確率的影響49-50
- 第5章 總結(jié)和展望50-52
- 5.1 研究總結(jié)50-51
- 5.2 研究展望51-52
- 參考文獻(xiàn)52-54
- 致謝54
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 錢(qián)穎能;胡運(yùn)發(fā);;用樸素貝葉斯分類(lèi)法選股[J];計(jì)算機(jī)應(yīng)用與軟件;2007年06期
2 歐陽(yáng)澤華;郭華平;范明;;在逐漸縮小的空間上漸進(jìn)學(xué)習(xí)樸素貝葉斯參數(shù)[J];計(jì)算機(jī)應(yīng)用;2012年01期
3 裴亞輝;熊盛武;;樸素貝葉斯及其擴(kuò)展模型[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2007年08期
4 趙彥琦;謝小西;荀宇暢;;樸素貝葉斯分類(lèi)法的應(yīng)用[J];電子制作;2013年07期
5 菅小艷;崔彩霞;;基于樸素貝葉斯的文本分類(lèi)[J];電腦開(kāi)發(fā)與應(yīng)用;2013年12期
6 王實(shí);高文;;增強(qiáng)型樸素貝葉斯學(xué)習(xí)[J];計(jì)算機(jī)科學(xué);2000年04期
7 楊忠強(qiáng);秦亮曦;;一種基于屬性加權(quán)的樸素貝葉斯改進(jìn)算法[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期
8 張彩麗;楊帆;張玉杰;;柴油機(jī)供油系統(tǒng)狀態(tài)的樸素貝葉斯診斷方法研究[J];計(jì)算機(jī)測(cè)量與控制;2008年08期
9 白耀輝;陳明;王舉群;;利用樸素貝葉斯方法實(shí)現(xiàn)異常檢測(cè)[J];計(jì)算機(jī)工程與應(yīng)用;2005年34期
10 王雙成;冷翠平;侯彩虹;;操作風(fēng)險(xiǎn)等級(jí)預(yù)測(cè)的樸素貝葉斯方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年12期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前2條
1 石志偉;吳功宜;;改善樸素貝葉斯在文本分類(lèi)中的穩(wěn)定性[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
2 李海軍;王鉦旋;王利民;苑森淼;;基于主成分分析提升樸素貝葉斯[A];中國(guó)儀器儀表學(xué)會(huì)第六屆青年學(xué)術(shù)會(huì)議論文集[C];2004年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李冬梅;樸素貝葉斯與決策樹(shù)混合分類(lèi)方法的研究[D];大連海事大學(xué);2016年
2 張帆;貝葉斯算法在校園留言板垃圾過(guò)濾中的應(yīng)用研究[D];鄭州大學(xué);2016年
3 石剛;一種基于知識(shí)圖譜的用戶搜索意圖挖掘方法的研究[D];國(guó)際關(guān)系學(xué)院;2016年
4 胡為成;基于遺傳算法的樸素貝葉斯分類(lèi)研究[D];合肥工業(yè)大學(xué);2006年
5 李Pr;基于樸素貝葉斯的文本分類(lèi)研究及其在微博分類(lèi)中的應(yīng)用[D];北京理工大學(xué);2015年
6 劉勇華;基于樸素貝葉斯的中文段落情感分析[D];太原理工大學(xué);2015年
7 周龍;基于樸素貝葉斯的分類(lèi)方法研究[D];安徽大學(xué);2006年
8 王翔;基于樸素貝葉斯和One-R的入侵檢測(cè)問(wèn)題研究[D];合肥工業(yè)大學(xué);2008年
9 周遠(yuǎn)陽(yáng);基于樸素貝葉斯方法的新聞分類(lèi)系統(tǒng)的實(shí)現(xiàn)[D];暨南大學(xué);2012年
10 李忠波;基于改進(jìn)樸素貝葉斯的蛋白質(zhì)提純方法選擇[D];大連理工大學(xué);2014年
,本文編號(hào):815840
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/815840.html