科技情報用戶畫像標簽生成與推薦
發(fā)布時間:2024-01-29 07:33
科技管理部門是科技情報的重要用戶,如何主動地了解科技管理部門的情報需求,成為大數(shù)據(jù)時代快速地提供精準情報服務的重要內(nèi)容,而用戶畫像的方法為這項工作提供了可能。通過多源數(shù)據(jù)的采集與分析,為情報用戶打標簽,用標簽來刻畫用戶特征與需求,并實施推薦;谏鲜瞿康,本文采用自然語言處理的相關方法生成標簽,在文本中抽取出關鍵詞,采用直接抽取、詞對匹配、主題詞抽取、基于TF-IDF的生成方案、組合詞生成方案共五種方法。標簽生成后,根據(jù)詞林表中的詞間關系分析標簽之間的關聯(lián)和相似度。然后采用協(xié)同過濾、基于常識、標簽關聯(lián)等推薦算法為不同的用戶推薦標簽,并建立了初步的用戶畫像。通過研究與實證發(fā)現(xiàn),利用這一套方法能夠有效勾勒出科技管理部門的情報需求特征,對于科技情報工作而言,推薦的內(nèi)容也具備一定的啟示性。
【文章頁數(shù)】:9 頁
本文編號:3887907
【文章頁數(shù)】:9 頁
圖1標簽相似度數(shù)值矩陣
圖2各省份的詞云圖
圖3標簽的分類展示示意圖
本文編號:3887907
本文鏈接:http://sikaile.net/guanlilunwen/keyanlw/3887907.html
最近更新
教材專著