學(xué)術(shù)搜索日志中的個(gè)體用戶識(shí)別研究
發(fā)布時(shí)間:2022-10-08 17:07
[目的/意義]文獻(xiàn)檢索中,特定賬號(hào)可能以獨(dú)享和共享的方式被使用。在理解用戶信息需求確保個(gè)性化服務(wù)的精準(zhǔn)性的問題上,首先要排除共享賬號(hào)的群體所產(chǎn)生的各異行為對(duì)理解用戶需求造成的干擾。因此,需要識(shí)別用戶的行為邊界,即某個(gè)賬號(hào)的訪問者是個(gè)體還是群體。[方法/過程]從科研用戶的日志數(shù)據(jù)中提取行為習(xí)慣和主題偏好兩方面特征,構(gòu)建基于科研用戶小數(shù)據(jù)和隨機(jī)森林分類的個(gè)體用戶識(shí)別模型,并以國(guó)家科技數(shù)字圖書館網(wǎng)站為例進(jìn)行實(shí)證研究。[結(jié)果/結(jié)論]實(shí)驗(yàn)表明,提出的方法能夠有效識(shí)別學(xué)術(shù)搜索日志中的個(gè)體用戶,準(zhǔn)確率約為92.9%,其中主題一致性是區(qū)別個(gè)體與群體科研用戶的最重要特征。本研究不僅可以幫助識(shí)別個(gè)體用戶和機(jī)構(gòu)用戶,優(yōu)化用戶管理,而且為跨設(shè)備的同一用戶判定提供思路。
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引 言
1 相關(guān)研究
2 研究設(shè)計(jì)
2.1 研究思路與框架
2.2 提取用戶特征
2.2.1 行為特征提取
2.2.2 主題偏好特征提取
2.3 模型構(gòu)建與評(píng)價(jià)
3 實(shí)驗(yàn)數(shù)據(jù)處理
3.1 原始數(shù)據(jù)集
3.2 數(shù)據(jù)標(biāo)注
3.3 科研用戶特征選取
3.3.1 行為習(xí)慣特征選取
3.3.2 主題偏好特征選取
4 實(shí)驗(yàn)結(jié)果
4.1 基于隨機(jī)森林分類的個(gè)體用戶識(shí)別
4.2 與其他算法對(duì)比分析
5 結(jié) 語(yǔ)
本文編號(hào):3688100
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引 言
1 相關(guān)研究
2 研究設(shè)計(jì)
2.1 研究思路與框架
2.2 提取用戶特征
2.2.1 行為特征提取
2.2.2 主題偏好特征提取
2.3 模型構(gòu)建與評(píng)價(jià)
3 實(shí)驗(yàn)數(shù)據(jù)處理
3.1 原始數(shù)據(jù)集
3.2 數(shù)據(jù)標(biāo)注
3.3 科研用戶特征選取
3.3.1 行為習(xí)慣特征選取
3.3.2 主題偏好特征選取
4 實(shí)驗(yàn)結(jié)果
4.1 基于隨機(jī)森林分類的個(gè)體用戶識(shí)別
4.2 與其他算法對(duì)比分析
5 結(jié) 語(yǔ)
本文編號(hào):3688100
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3688100.html
最近更新
教材專著