基于搜索引擎日志挖掘的搜索滿意度評估方法研究
發(fā)布時間:2024-01-24 08:17
搜索引擎是用戶從互聯(lián)網(wǎng)海量數(shù)據(jù)中獲取所需資源信息的主要途徑之一。隨著互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模急速膨脹,用戶對于高效便捷獲取資源信息的要求越來越高,搜索引擎需要不斷地進行系統(tǒng)優(yōu)化從而為用戶提供更優(yōu)質(zhì)的搜索服務,因此,如何有效評估搜索引擎的質(zhì)量成為了研究界與產(chǎn)業(yè)界關注的焦點。搜索滿意度是一種以用戶為核心、強調(diào)用戶搜索體驗的搜索引擎質(zhì)量評估指標。搜索引擎日志記錄了用戶與搜索引擎交互過程中發(fā)生的一系列行為信息(如提交查詢詞、移動鼠標、點擊結果等),并且搜索滿意度與用戶的搜索行為有很強的關聯(lián)。因此,研究人員提出利用搜索行為來評估用戶的搜索滿意度。本文針對如何有效利用搜索行為序列中的時間間隔信息、如何有效利用鼠標光標移動的軌跡、如何在少量有標注數(shù)據(jù)的情況下訓練出有效的搜索滿意度評估模型三個挑戰(zhàn)對基于搜索引擎日志挖掘的搜索滿意度評估方法進行深入研究,主要內(nèi)容有:1)提出了一種基于長短時記憶循環(huán)神經(jīng)網(wǎng)絡的搜索滿意度評估方法。利用長短時記憶循環(huán)神經(jīng)網(wǎng)絡對搜索行為序列進行建模,實現(xiàn)端對端的學習,并引入虛擬停留行為來表示搜索行為序列中的變長時間;引入一種基于停留時間擾動的數(shù)據(jù)增強策略來增加搜索行為序列的模式變化,從而...
【文章頁數(shù)】:125 頁
【學位級別】:博士
本文編號:3883445
【文章頁數(shù)】:125 頁
【學位級別】:博士
圖1.1本文主要研究內(nèi)容??
圖1.2本文組織結構??
圖3.1本章提出方法的總體框架??本章提出方法的總體框架如圖3.1所示,圖中白色圓圈表示搜索行為,由于??可用的有標注數(shù)據(jù)非常少,因此使用基于DTP的數(shù)據(jù)增強?
圖3.2數(shù)據(jù)集Answercorrect上DTP+LSTM在/idle不同取值下的性能變化??
本文編號:3883445
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3883445.html
最近更新
教材專著