學(xué)術(shù)搜索日志中的個體用戶識別研究
發(fā)布時間:2022-10-08 17:07
[目的/意義]文獻(xiàn)檢索中,特定賬號可能以獨享和共享的方式被使用。在理解用戶信息需求確保個性化服務(wù)的精準(zhǔn)性的問題上,首先要排除共享賬號的群體所產(chǎn)生的各異行為對理解用戶需求造成的干擾。因此,需要識別用戶的行為邊界,即某個賬號的訪問者是個體還是群體。[方法/過程]從科研用戶的日志數(shù)據(jù)中提取行為習(xí)慣和主題偏好兩方面特征,構(gòu)建基于科研用戶小數(shù)據(jù)和隨機(jī)森林分類的個體用戶識別模型,并以國家科技數(shù)字圖書館網(wǎng)站為例進(jìn)行實證研究。[結(jié)果/結(jié)論]實驗表明,提出的方法能夠有效識別學(xué)術(shù)搜索日志中的個體用戶,準(zhǔn)確率約為92.9%,其中主題一致性是區(qū)別個體與群體科研用戶的最重要特征。本研究不僅可以幫助識別個體用戶和機(jī)構(gòu)用戶,優(yōu)化用戶管理,而且為跨設(shè)備的同一用戶判定提供思路。
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引 言
1 相關(guān)研究
2 研究設(shè)計
2.1 研究思路與框架
2.2 提取用戶特征
2.2.1 行為特征提取
2.2.2 主題偏好特征提取
2.3 模型構(gòu)建與評價
3 實驗數(shù)據(jù)處理
3.1 原始數(shù)據(jù)集
3.2 數(shù)據(jù)標(biāo)注
3.3 科研用戶特征選取
3.3.1 行為習(xí)慣特征選取
3.3.2 主題偏好特征選取
4 實驗結(jié)果
4.1 基于隨機(jī)森林分類的個體用戶識別
4.2 與其他算法對比分析
5 結(jié) 語
本文編號:3688100
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引 言
1 相關(guān)研究
2 研究設(shè)計
2.1 研究思路與框架
2.2 提取用戶特征
2.2.1 行為特征提取
2.2.2 主題偏好特征提取
2.3 模型構(gòu)建與評價
3 實驗數(shù)據(jù)處理
3.1 原始數(shù)據(jù)集
3.2 數(shù)據(jù)標(biāo)注
3.3 科研用戶特征選取
3.3.1 行為習(xí)慣特征選取
3.3.2 主題偏好特征選取
4 實驗結(jié)果
4.1 基于隨機(jī)森林分類的個體用戶識別
4.2 與其他算法對比分析
5 結(jié) 語
本文編號:3688100
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3688100.html
最近更新
教材專著