天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于文本分析的專家推薦系統(tǒng)研究

發(fā)布時(shí)間:2021-06-01 22:08
  在線問答社區(qū)已成為人們解決問題、獲取知識(shí)的重要平臺(tái)。然而用戶在社區(qū)提問時(shí)受限于自己的用語習(xí)慣導(dǎo)致問題描述不準(zhǔn)確,往往難以獲得高質(zhì)量的回答。因此本文提出一種基于文本分析的專家推薦系統(tǒng),該系統(tǒng)能夠針對(duì)用戶所提出的問題,通過改進(jìn)后的Labeled-LDA模型以及BERT模型進(jìn)行建模得出最適合回答該問題的若干專家。在專家文本分類部分,考慮到原Labeled-LDA模型存在過多無用詞干擾,容易造成主題湮沒的缺陷,本文在原模型基礎(chǔ)上結(jié)合TF-IDF算法、卡方檢驗(yàn)算法以及特定領(lǐng)域的特殊名詞庫進(jìn)行改進(jìn),增大能夠代表某一主題的特征詞權(quán)重,提高模型的分類性能。在專家推薦部分,本文先將待回答問題通過改進(jìn)后的Labeled-LDA模型進(jìn)行分類以獲知該問題所屬的領(lǐng)域類別,然后從該類別下的專家列表中依次取出待匹配的專家信息文本。最后采用BERT語言模型將待回答問題與待匹配的專家信息進(jìn)行向量化建模,計(jì)算兩者向量之間的相似度,將相似度系數(shù)較高的專家推薦給該問題的提問者。本文旨在利用上述方法實(shí)現(xiàn)一個(gè)育兒網(wǎng)用戶的專家推薦系統(tǒng)。實(shí)驗(yàn)部分首先通過Scrapy-Redis分布式爬蟲系統(tǒng)獲取育兒網(wǎng)近十年來用戶的問答信息,預(yù)處理后... 

【文章來源】:浙江工業(yè)大學(xué)浙江省

【文章頁數(shù)】:70 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于文本分析的專家推薦系統(tǒng)研究


精確度對(duì)比圖

對(duì)比圖,精確度,對(duì)比圖,模型


浙江工業(yè)大學(xué)碩士學(xué)位論文48圖5-1基于原Labeled-LDA的三種模型精確度對(duì)比圖Figure5-1.ComparisonofthreemodelprecisionbasedontheoriginalLabeled-LDA圖5-2基于改進(jìn)Labeled-LDA的三種模型精確度對(duì)比圖Figure5-2.ComparisonofthreemodelprecisionbasedonimprovedLabeled-LDA通過圖5-1,圖5-2可以看出本文采用改進(jìn)后Labeled-LDA結(jié)合各語言模型在精確度方面比未改進(jìn)的Labeled-LDA均有所提升,說明結(jié)合TF-IDF算法、卡方檢

對(duì)比圖,精確度,對(duì)比圖,模型


浙江工業(yè)大學(xué)碩士學(xué)位論文48圖5-1基于原Labeled-LDA的三種模型精確度對(duì)比圖Figure5-1.ComparisonofthreemodelprecisionbasedontheoriginalLabeled-LDA圖5-2基于改進(jìn)Labeled-LDA的三種模型精確度對(duì)比圖Figure5-2.ComparisonofthreemodelprecisionbasedonimprovedLabeled-LDA通過圖5-1,圖5-2可以看出本文采用改進(jìn)后Labeled-LDA結(jié)合各語言模型在精確度方面比未改進(jìn)的Labeled-LDA均有所提升,說明結(jié)合TF-IDF算法、卡方檢

【參考文獻(xiàn)】:
期刊論文
[1]基于語句相似度的主觀試題自動(dòng)閱卷模型研究[J]. 陳賢武,劉道波.  武漢大學(xué)學(xué)報(bào)(工學(xué)版). 2018(07)
[2]Convolutional neural networks for expert recommendation in community question answering[J]. Jian WANG,Jiqing SUN,Hongfei LIN,Hualei DONG,Shaowu ZHANG.  Science China(Information Sciences). 2017(11)
[3]基于隱馬爾可夫模型的新型SQL注入攻擊檢測方法[J]. 楊連群,孟魁,王斌,韓勇.  信息網(wǎng)絡(luò)安全. 2017(09)
[4]基于加權(quán)余弦相似度的WiFi指紋室內(nèi)定位[J]. 吳赟,蔣新華,齊雁飛,蔣學(xué)芹.  上海師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[5]基于Jaccard相似度和位置行為的協(xié)同過濾推薦算法[J]. 李斌,張博,劉學(xué)軍,章瑋.  計(jì)算機(jī)科學(xué). 2016(12)
[6]基于馬氏距離的文本聚類算法在自動(dòng)閱卷系統(tǒng)中的應(yīng)用[J]. 李翠霞,譚營軍,孔金生.  計(jì)算機(jī)應(yīng)用與軟件. 2015(04)
[7]基于改進(jìn)TFIDF算法的文本分類研究[J]. 鄭霖,徐德華.  計(jì)算機(jī)與現(xiàn)代化. 2014(09)
[8]一種網(wǎng)絡(luò)爬蟲系統(tǒng)中URL去重方法的研究[J]. 成功,李小正,趙全軍.  中國新技術(shù)新產(chǎn)品. 2014(12)
[9]基于共享背景主題的Labeled LDA模型[J]. 江雨燕,李平,王清.  電子學(xué)報(bào). 2013(09)
[10]基于Labeled-LDA模型的文本分類新算法[J]. 李文波,孫樂,張大鯤.  計(jì)算機(jī)學(xué)報(bào). 2008(04)

博士論文
[1]高性能文本分類算法研究[D]. 譚松波.中國科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006

碩士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的新聞文本分類問題研究[D]. 齊凱凡.西安理工大學(xué) 2018
[2]在線問答社區(qū)推薦算法研究[D]. 薛浩.電子科技大學(xué) 2018
[3]基于分布式表示的答案質(zhì)量自動(dòng)評(píng)價(jià)[D]. 吳芳穎.哈爾濱工業(yè)大學(xué) 2017
[4]基于裝備維修的主觀題自動(dòng)測評(píng)研究及應(yīng)用[D]. 亓子森.北京郵電大學(xué) 2017
[5]中文文本分類中卡方統(tǒng)計(jì)特征選擇方法和TF-IDF權(quán)重計(jì)算方法的研究[D]. 姚海英.吉林大學(xué) 2016
[6]基于自然語言處理的主觀題自動(dòng)評(píng)分系統(tǒng)的研究與實(shí)現(xiàn)[D]. 曹建奇.北京工業(yè)大學(xué) 2015
[7]基于統(tǒng)計(jì)和語義信息的中文分詞算法研究[D]. 李良潔.青島科技大學(xué) 2015
[8]基于動(dòng)態(tài)Labeled-LDA模型的微博主題挖掘[D]. 周先琳.合肥工業(yè)大學(xué) 2015
[9]計(jì)算機(jī)自動(dòng)閱卷系統(tǒng)的研究與實(shí)現(xiàn)[D]. 馬維鑫.吉林大學(xué) 2014
[10]分布式書籍網(wǎng)絡(luò)爬蟲系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 趙鵬程.西南交通大學(xué) 2014



本文編號(hào):3210244

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3210244.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f230***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com