基于文本挖掘的評(píng)審專家推薦方法研究
發(fā)布時(shí)間:2021-05-11 18:42
互聯(lián)網(wǎng)的出現(xiàn)和科技的進(jìn)步促使科技項(xiàng)目的申報(bào)數(shù)明顯提高,項(xiàng)目的評(píng)審工作顯得至關(guān)重要,項(xiàng)目評(píng)審?fù)枰獜谋姸嗟膶<抑羞x出相關(guān)領(lǐng)域的具有權(quán)威的專家對項(xiàng)目進(jìn)行評(píng)閱和審查工作。傳統(tǒng)的方法是由管理人員從專家?guī)熘羞M(jìn)行推薦,存在耗時(shí)、浪費(fèi)人力甚至因?yàn)閷ρ芯款I(lǐng)域的劃分不熟悉導(dǎo)致的分配不公平的問題,因此項(xiàng)目評(píng)審專家推薦方法的研究是非常必要的。評(píng)審專家推薦的核心思想是利用項(xiàng)目描述文檔和專家信息描述文檔,以及專家歷史評(píng)審等信息進(jìn)行項(xiàng)目和專家的匹配,利用文本挖掘和推薦算法的結(jié)合有效的進(jìn)行評(píng)審專家的推薦。本文主要圍繞項(xiàng)目和專家的向量表示模型、相似性比較方法、推薦算法等關(guān)鍵問題進(jìn)行了研究,提出了一種基于文本挖掘的項(xiàng)目評(píng)審專家推薦方法。該方法主要通過對項(xiàng)目和專家根據(jù)其數(shù)據(jù)特征和重要程度進(jìn)行分類,利用word2vec和LDA的文本挖掘算法進(jìn)行項(xiàng)目和專家的模型構(gòu)建,通過實(shí)驗(yàn)確認(rèn)了模型訓(xùn)練的最佳參數(shù),專家和項(xiàng)目的相似性度量使用本文中提出的基于權(quán)重分配的相似性度量方法,根據(jù)兩類信息對整體信息的貢獻(xiàn)度不同,賦予word2vec和LDA的相似性計(jì)算結(jié)果不同的權(quán)重,通過實(shí)驗(yàn)確認(rèn)了最優(yōu)權(quán)重分配比例。本文提出的推薦算法首先利用限制性條...
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究概況
1.2.1 文本挖掘研究現(xiàn)狀
1.2.2 推薦系統(tǒng)研究現(xiàn)狀
1.3 論文內(nèi)容及組織結(jié)構(gòu)
1.3.1 研究內(nèi)容和創(chuàng)新點(diǎn)
1.3.2 組織結(jié)構(gòu)
第2章 相關(guān)理論和技術(shù)
2.1 推薦系統(tǒng)概述
2.2 文本挖掘技術(shù)概述
2.2.1 數(shù)據(jù)收集及預(yù)處理
2.2.2 文本特征表示和特征提取
2.2.3 文本挖掘與模式提取
2.2.4 結(jié)果評(píng)價(jià)
2.3 相似性比較方法
2.4 本章總結(jié)
第3章 項(xiàng)目及評(píng)審專家表示模型分析
3.1 項(xiàng)目和專家信息數(shù)據(jù)分析
3.2 項(xiàng)目專家向量表示模型
3.3 基于Word2vec建立向量模型
3.3.1 CBOW模型
3.3.2 Skip-Gram模型
3.4 基于LDA的項(xiàng)目專家主題挖掘
3.4.1 LDA模型求解
3.5 本章小結(jié)
第4章 項(xiàng)目評(píng)審專家推薦方法
4.1 科技項(xiàng)目評(píng)審?fù)扑]方法總體流程
4.2 數(shù)據(jù)信息預(yù)處理
4.3 相似性比較
4.3.1 基于word2vec的相似度計(jì)算
4.3.2 基于LDA的相似度計(jì)算
4.3.3 加權(quán)文本相似度計(jì)算
4.4 專家評(píng)分模型
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析
5.1 LDA模型參數(shù)選擇
5.2 推薦算法結(jié)果分析
5.2.1 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集
5.2.2 評(píng)價(jià)標(biāo)準(zhǔn)
5.2.3 實(shí)驗(yàn)設(shè)計(jì)和結(jié)果
5.3 本章小結(jié)
第6章 結(jié)論
參考文獻(xiàn)
在學(xué)研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于曼哈頓距離的幀間加權(quán)預(yù)測算法[J]. 郭紅偉,朱策,李帥,王永華. 北京航空航天大學(xué)學(xué)報(bào). 2019(12)
[2]基于文本相似度的評(píng)審專家推薦方法研究[J]. 鄭新宇,徐建良. 科技資訊. 2019(17)
[3]融合耦合距離區(qū)分度和強(qiáng)類別特征的短文本相似度計(jì)算方法[J]. 馬慧芳,劉文,李志欣,藺想紅. 電子學(xué)報(bào). 2019(06)
[4]一種基于支持向量機(jī)和主題模型的評(píng)論分析方法[J]. 陳琪,張莉,蔣競,黃新越. 軟件學(xué)報(bào). 2019(05)
[5]基于用戶評(píng)論的深度情感分析和多視圖協(xié)同融合的混合推薦方法[J]. 張宜浩,朱小飛,徐傳運(yùn),董世都. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[6]融合Jensen-Shannon散度的推薦算法[J]. 王永,王永東,鄧江洲,張璞. 計(jì)算機(jī)科學(xué). 2019(02)
[7]WDS:基于詞向量的文本相似函數(shù)[J]. 王路琪,龍軍,袁鑫攀. 計(jì)算機(jī)科學(xué). 2018(S2)
[8]針對新用戶冷啟動(dòng)問題的改進(jìn)Epsilon-greedy算法[J]. 王素琴,張洋,蔣浩,朱登明. 計(jì)算機(jī)工程. 2018(11)
[9]社會(huì)網(wǎng)絡(luò)中基于信任的LDA主題模型領(lǐng)域?qū)<彝扑][J]. 劉電霆,吳麗娜. 廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[10]Text Mining of Rheumatoid Arthritis and Diabetes Mellitus to Understand the Mechanisms of Chinese Medicine in Different Diseases with Same Treatment[J]. ZHAO Ning,ZHENG Guang,LI Jian,ZHAO Hong-yan,LU Cheng,JIANG Miao,ZHANG Chi,GUO Hong-tao,LU Ai-ping. Chinese Journal of Integrative Medicine. 2018(10)
碩士論文
[1]機(jī)構(gòu)知識(shí)庫多維度專家推薦方法研究[D]. 常亮.重慶郵電大學(xué) 2019
[2]面向企業(yè)需求的專家推薦算法研究[D]. 李瑩.北京交通大學(xué) 2018
本文編號(hào):3181911
【文章來源】:沈陽工業(yè)大學(xué)遼寧省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究概況
1.2.1 文本挖掘研究現(xiàn)狀
1.2.2 推薦系統(tǒng)研究現(xiàn)狀
1.3 論文內(nèi)容及組織結(jié)構(gòu)
1.3.1 研究內(nèi)容和創(chuàng)新點(diǎn)
1.3.2 組織結(jié)構(gòu)
第2章 相關(guān)理論和技術(shù)
2.1 推薦系統(tǒng)概述
2.2 文本挖掘技術(shù)概述
2.2.1 數(shù)據(jù)收集及預(yù)處理
2.2.2 文本特征表示和特征提取
2.2.3 文本挖掘與模式提取
2.2.4 結(jié)果評(píng)價(jià)
2.3 相似性比較方法
2.4 本章總結(jié)
第3章 項(xiàng)目及評(píng)審專家表示模型分析
3.1 項(xiàng)目和專家信息數(shù)據(jù)分析
3.2 項(xiàng)目專家向量表示模型
3.3 基于Word2vec建立向量模型
3.3.1 CBOW模型
3.3.2 Skip-Gram模型
3.4 基于LDA的項(xiàng)目專家主題挖掘
3.4.1 LDA模型求解
3.5 本章小結(jié)
第4章 項(xiàng)目評(píng)審專家推薦方法
4.1 科技項(xiàng)目評(píng)審?fù)扑]方法總體流程
4.2 數(shù)據(jù)信息預(yù)處理
4.3 相似性比較
4.3.1 基于word2vec的相似度計(jì)算
4.3.2 基于LDA的相似度計(jì)算
4.3.3 加權(quán)文本相似度計(jì)算
4.4 專家評(píng)分模型
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析
5.1 LDA模型參數(shù)選擇
5.2 推薦算法結(jié)果分析
5.2.1 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集
5.2.2 評(píng)價(jià)標(biāo)準(zhǔn)
5.2.3 實(shí)驗(yàn)設(shè)計(jì)和結(jié)果
5.3 本章小結(jié)
第6章 結(jié)論
參考文獻(xiàn)
在學(xué)研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]一種基于曼哈頓距離的幀間加權(quán)預(yù)測算法[J]. 郭紅偉,朱策,李帥,王永華. 北京航空航天大學(xué)學(xué)報(bào). 2019(12)
[2]基于文本相似度的評(píng)審專家推薦方法研究[J]. 鄭新宇,徐建良. 科技資訊. 2019(17)
[3]融合耦合距離區(qū)分度和強(qiáng)類別特征的短文本相似度計(jì)算方法[J]. 馬慧芳,劉文,李志欣,藺想紅. 電子學(xué)報(bào). 2019(06)
[4]一種基于支持向量機(jī)和主題模型的評(píng)論分析方法[J]. 陳琪,張莉,蔣競,黃新越. 軟件學(xué)報(bào). 2019(05)
[5]基于用戶評(píng)論的深度情感分析和多視圖協(xié)同融合的混合推薦方法[J]. 張宜浩,朱小飛,徐傳運(yùn),董世都. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[6]融合Jensen-Shannon散度的推薦算法[J]. 王永,王永東,鄧江洲,張璞. 計(jì)算機(jī)科學(xué). 2019(02)
[7]WDS:基于詞向量的文本相似函數(shù)[J]. 王路琪,龍軍,袁鑫攀. 計(jì)算機(jī)科學(xué). 2018(S2)
[8]針對新用戶冷啟動(dòng)問題的改進(jìn)Epsilon-greedy算法[J]. 王素琴,張洋,蔣浩,朱登明. 計(jì)算機(jī)工程. 2018(11)
[9]社會(huì)網(wǎng)絡(luò)中基于信任的LDA主題模型領(lǐng)域?qū)<彝扑][J]. 劉電霆,吳麗娜. 廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(04)
[10]Text Mining of Rheumatoid Arthritis and Diabetes Mellitus to Understand the Mechanisms of Chinese Medicine in Different Diseases with Same Treatment[J]. ZHAO Ning,ZHENG Guang,LI Jian,ZHAO Hong-yan,LU Cheng,JIANG Miao,ZHANG Chi,GUO Hong-tao,LU Ai-ping. Chinese Journal of Integrative Medicine. 2018(10)
碩士論文
[1]機(jī)構(gòu)知識(shí)庫多維度專家推薦方法研究[D]. 常亮.重慶郵電大學(xué) 2019
[2]面向企業(yè)需求的專家推薦算法研究[D]. 李瑩.北京交通大學(xué) 2018
本文編號(hào):3181911
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3181911.html
最近更新
教材專著