基于搜索引擎的查詢推薦算法研究
發(fā)布時間:2021-12-10 12:08
傳統(tǒng)的基于搜索日志的查詢推薦方法無法快速有效處理和存儲海量日志信息,無法抓住用戶興趣特點。為此,融合網(wǎng)絡(luò)爬蟲、數(shù)據(jù)挖掘和自然語言處理技術(shù)等多種方法,在原有查詢?nèi)罩緮?shù)據(jù)基礎(chǔ)上進(jìn)一步爬取和挖掘,基于騰訊AI意圖分析和自然語言處理技術(shù),提出一種新的推薦詞生成方法。實驗結(jié)果表明,該方法與單純基于查詢意圖的推薦和單純基于相似度計算與聚類的推薦相比,用戶查詢準(zhǔn)確性提升3%,能更加高效準(zhǔn)確地為用戶提供快速檢索服務(wù),提升了搜索引擎的用戶體驗。
【文章來源】:軟件導(dǎo)刊. 2020,19(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
離線階段處理流程2.2實驗環(huán)境搭建
對象相似,不同組中的對象不相似。本實驗采用改進(jìn)的重分二分聚類算法對關(guān)鍵詞進(jìn)行聚類,步驟如下:①挑選一個簇進(jìn)行劃分;②通過K均值算法將挑選出的簇劃分成兩個不同的子集;③重復(fù)步驟①和步驟②,直到產(chǎn)生足夠數(shù)量的簇。聚類結(jié)束后,結(jié)合用戶意圖分析篩選出相關(guān)聚類結(jié)果。2.3.4推薦詞生成當(dāng)用戶輸入關(guān)鍵詞查詢時,基于用戶輸入進(jìn)行意圖分析和聚類,給出若干個與用戶輸入關(guān)鍵詞相似度很近的詞。本文搭建ElasticSearch環(huán)境可視化展示數(shù)據(jù),用于直觀展示線上結(jié)果,如圖5所示。圖5ElasticSearch環(huán)境可視化展示3實驗結(jié)果3.1實驗結(jié)果分析基于搜索引擎的查詢推薦技術(shù),因為融合技術(shù)較多且推薦結(jié)果存在不確定性,所以目前為止還沒有評價實驗結(jié)果的統(tǒng)一方法。常用的評價主要分為人工評估和自動評估兩類。人工評估主要對系統(tǒng)推薦的結(jié)果手動進(jìn)行評估和判斷,消耗人力且嚴(yán)重依賴個人偏好;自動評估通常是通過分析查詢之間的語義關(guān)系或其它輔助工具對推薦結(jié)果進(jìn)行評估[15-19]。本文使用P@N(Precision@N)評價指標(biāo)作為評價標(biāo)準(zhǔn),其中P表示正確率,N表示返回的推薦結(jié)果中取前N個結(jié)果。本文對N取值1、3、5、10,分別通過人工評估和自動評估評測本文實驗效果。實驗中隨機(jī)選出500個查詢詞,根據(jù)推薦詞的相關(guān)性進(jìn)行打分,5分表示完全相關(guān),0分表示完全不相關(guān)。(1)人工評估。為保證不受個人偏好影響,實驗取5個人打分的平均值,結(jié)果如表2所示。表2人工評分結(jié)果評分543210P@130316028531P@234012033412P@34007018921P@4467292110(2)自動?
【參考文獻(xiàn)】:
期刊論文
[1]利用嵌入方法實現(xiàn)個性化查詢重構(gòu)[J]. 張曉娟. 情報學(xué)報. 2018(06)
博士論文
[1]基于搜索引擎日志挖掘的搜索滿意度評估方法研究[D]. 范阿琳.浙江大學(xué) 2019
[2]搜索引擎中的實體推薦關(guān)鍵技術(shù)研究[D]. 黃際洲.哈爾濱工業(yè)大學(xué) 2019
碩士論文
[1]面向主題的網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計與實現(xiàn)[D]. 趙康.北京郵電大學(xué) 2019
[2]基于ElasticSearch的分布式搜索引擎的設(shè)計與實現(xiàn)[D]. 張月.北京交通大學(xué) 2019
[3]融合主題模型和詞嵌入的查詢優(yōu)化方法研究[D]. 宋雅迪.北方工業(yè)大學(xué) 2019
本文編號:3532601
【文章來源】:軟件導(dǎo)刊. 2020,19(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
離線階段處理流程2.2實驗環(huán)境搭建
對象相似,不同組中的對象不相似。本實驗采用改進(jìn)的重分二分聚類算法對關(guān)鍵詞進(jìn)行聚類,步驟如下:①挑選一個簇進(jìn)行劃分;②通過K均值算法將挑選出的簇劃分成兩個不同的子集;③重復(fù)步驟①和步驟②,直到產(chǎn)生足夠數(shù)量的簇。聚類結(jié)束后,結(jié)合用戶意圖分析篩選出相關(guān)聚類結(jié)果。2.3.4推薦詞生成當(dāng)用戶輸入關(guān)鍵詞查詢時,基于用戶輸入進(jìn)行意圖分析和聚類,給出若干個與用戶輸入關(guān)鍵詞相似度很近的詞。本文搭建ElasticSearch環(huán)境可視化展示數(shù)據(jù),用于直觀展示線上結(jié)果,如圖5所示。圖5ElasticSearch環(huán)境可視化展示3實驗結(jié)果3.1實驗結(jié)果分析基于搜索引擎的查詢推薦技術(shù),因為融合技術(shù)較多且推薦結(jié)果存在不確定性,所以目前為止還沒有評價實驗結(jié)果的統(tǒng)一方法。常用的評價主要分為人工評估和自動評估兩類。人工評估主要對系統(tǒng)推薦的結(jié)果手動進(jìn)行評估和判斷,消耗人力且嚴(yán)重依賴個人偏好;自動評估通常是通過分析查詢之間的語義關(guān)系或其它輔助工具對推薦結(jié)果進(jìn)行評估[15-19]。本文使用P@N(Precision@N)評價指標(biāo)作為評價標(biāo)準(zhǔn),其中P表示正確率,N表示返回的推薦結(jié)果中取前N個結(jié)果。本文對N取值1、3、5、10,分別通過人工評估和自動評估評測本文實驗效果。實驗中隨機(jī)選出500個查詢詞,根據(jù)推薦詞的相關(guān)性進(jìn)行打分,5分表示完全相關(guān),0分表示完全不相關(guān)。(1)人工評估。為保證不受個人偏好影響,實驗取5個人打分的平均值,結(jié)果如表2所示。表2人工評分結(jié)果評分543210P@130316028531P@234012033412P@34007018921P@4467292110(2)自動?
【參考文獻(xiàn)】:
期刊論文
[1]利用嵌入方法實現(xiàn)個性化查詢重構(gòu)[J]. 張曉娟. 情報學(xué)報. 2018(06)
博士論文
[1]基于搜索引擎日志挖掘的搜索滿意度評估方法研究[D]. 范阿琳.浙江大學(xué) 2019
[2]搜索引擎中的實體推薦關(guān)鍵技術(shù)研究[D]. 黃際洲.哈爾濱工業(yè)大學(xué) 2019
碩士論文
[1]面向主題的網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計與實現(xiàn)[D]. 趙康.北京郵電大學(xué) 2019
[2]基于ElasticSearch的分布式搜索引擎的設(shè)計與實現(xiàn)[D]. 張月.北京交通大學(xué) 2019
[3]融合主題模型和詞嵌入的查詢優(yōu)化方法研究[D]. 宋雅迪.北方工業(yè)大學(xué) 2019
本文編號:3532601
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3532601.html
最近更新
教材專著