基于文檔多維度的學術文獻推薦研究
發(fā)布時間:2024-07-10 23:03
近年來,學術資源的爆炸性增長使得人們在海量數(shù)據(jù)中快速定位自己需要的信息變得困難。關鍵詞搜索模式雖然可以一定程度緩解信息過載的問題,但是面對海量數(shù)據(jù),關鍵詞搜索的結果依舊規(guī)模龐大,需要用戶在搜索結果中再次甄選所需文獻;谟脩魵v史數(shù)據(jù)的推薦系統(tǒng)能更精準地獲取與用戶興趣相關的文獻,F(xiàn)有文檔推薦系統(tǒng)通常根據(jù)文檔的內(nèi)容和領域相關性或者用戶間協(xié)同過濾等方式完成推薦,較少考慮到用戶的自身學術水平。這使得推薦結果雖然與用戶興趣相關,但部分結果并不符合用戶的學術水平和閱讀需求,導致利用率較低,造成無效推薦。因此,研究針對學術型用戶的學術文獻推薦方法具有重要的實用價值。本文完成的主要工作及成果如下:(1)通過網(wǎng)絡爬蟲技術抓取在線學術文獻(2000年-2020年AAAI會議論文集和百度文庫文獻)作為本研究的數(shù)據(jù)集。(2)依據(jù)維基百科分類詞條目錄構建概念從屬樹,將詞匯在概念從屬樹中所處的樹深度作為該詞匯的概念抽象層次。在學術文獻特征提取的過程中考慮了學術文獻的文檔結構特征和內(nèi)容特征,改進了傳統(tǒng)的詞匯權重計算方法,在TF-IDF算法的基礎上結合了詞匯概念抽象層次和詞匯的段落權重。該種計算方法可以更加合理的提取...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及成果
1.4 本文組織結構
第二章 推薦系統(tǒng)基礎知識和相關理論
2.1 推薦技術發(fā)展歷程
2.1.1 推薦算法
2.1.2 推薦方式和評估方式
2.2 推薦系統(tǒng)模型
2.3 基于維基百科的概念從屬樹構建
2.3.1 維基百科相關背景知識
2.3.2 概念從屬樹的構建
2.4 文檔表示模型
2.5 文檔處理
2.5.1 關鍵詞提取算法
2.5.2 文檔相似度計算
2.6 本章小結
第三章 基于文檔多維度的學術文獻推薦方法
3.1 問題描述
3.2 用戶的文本需求與文檔多維度之間對應關系的研究
3.2.1 文檔多維度選定與剖析
3.2.2 用戶模型
3.3 基于TF-IDF融合文檔特征的特征詞提取方法
3.4 基于文檔多維度的學術文獻推薦方法
3.4.1 基于文檔概念抽象層次的學術文獻推薦
3.4.2 基于文檔難度的學術文獻推薦
3.4.3 基于學習難度跨度的文檔推薦
3.5 本章小結
第四章 實驗與分析
4.1 數(shù)據(jù)集采集及樣本庫的構建
4.2 文檔各維度正確性驗證實驗
4.2.1 樣本集
4.2.2 評估方法
4.2.3 實驗結果與分析
4.3 基于文檔多維度學術文獻推薦方法的實驗與驗證
4.3.1 樣本集
4.3.2 實驗結果與分析
4.4 本章小結
第五章 系統(tǒng)功能與展示
5.1 系統(tǒng)功能
5.2 系統(tǒng)展示
5.3 本章小結
第六章 總結與展望
6.1 總結
6.2 展望
參考文獻
附錄1 攻讀碩士學位期間申請的專利
致謝
本文編號:4004869
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文研究內(nèi)容及成果
1.4 本文組織結構
第二章 推薦系統(tǒng)基礎知識和相關理論
2.1 推薦技術發(fā)展歷程
2.1.1 推薦算法
2.1.2 推薦方式和評估方式
2.2 推薦系統(tǒng)模型
2.3 基于維基百科的概念從屬樹構建
2.3.1 維基百科相關背景知識
2.3.2 概念從屬樹的構建
2.4 文檔表示模型
2.5 文檔處理
2.5.1 關鍵詞提取算法
2.5.2 文檔相似度計算
2.6 本章小結
第三章 基于文檔多維度的學術文獻推薦方法
3.1 問題描述
3.2 用戶的文本需求與文檔多維度之間對應關系的研究
3.2.1 文檔多維度選定與剖析
3.2.2 用戶模型
3.3 基于TF-IDF融合文檔特征的特征詞提取方法
3.4 基于文檔多維度的學術文獻推薦方法
3.4.1 基于文檔概念抽象層次的學術文獻推薦
3.4.2 基于文檔難度的學術文獻推薦
3.4.3 基于學習難度跨度的文檔推薦
3.5 本章小結
第四章 實驗與分析
4.1 數(shù)據(jù)集采集及樣本庫的構建
4.2 文檔各維度正確性驗證實驗
4.2.1 樣本集
4.2.2 評估方法
4.2.3 實驗結果與分析
4.3 基于文檔多維度學術文獻推薦方法的實驗與驗證
4.3.1 樣本集
4.3.2 實驗結果與分析
4.4 本章小結
第五章 系統(tǒng)功能與展示
5.1 系統(tǒng)功能
5.2 系統(tǒng)展示
5.3 本章小結
第六章 總結與展望
6.1 總結
6.2 展望
參考文獻
附錄1 攻讀碩士學位期間申請的專利
致謝
本文編號:4004869
本文鏈接:http://sikaile.net/tushudanganlunwen/4004869.html
教材專著