基于關(guān)聯(lián)規(guī)則的文本主題深度挖掘應(yīng)用研究
本文關(guān)鍵詞:基于關(guān)聯(lián)規(guī)則的文本主題深度挖掘應(yīng)用研究
更多相關(guān)文章: 關(guān)聯(lián)規(guī)則 主題模型 文本主題
【摘要】:【目的】準(zhǔn)確理解文本信息中潛在的知識關(guān)聯(lián),豐富文本知識挖掘的方法。【方法】將主題模型和關(guān)聯(lián)規(guī)則相結(jié)合,運(yùn)用LDA主題模型抽取文本中的主題集合,在實(shí)現(xiàn)文本降維的同時,實(shí)現(xiàn)文本在語義空間的表達(dá);通過關(guān)聯(lián)規(guī)則進(jìn)一步挖掘文本中主題的語義關(guān)聯(lián)!窘Y(jié)果】設(shè)置合理的支持度和置信度閾值,可以有效地挖掘文本中潛在知識的關(guān)聯(lián),實(shí)現(xiàn)對文本的深入"理解"!揪窒蕖繑(shù)據(jù)預(yù)處理過程中,用戶自定義詞典的設(shè)計會對實(shí)驗(yàn)結(jié)果產(chǎn)生一定的影響!窘Y(jié)論】提出一種非結(jié)構(gòu)化文本信息潛在語義關(guān)聯(lián)挖掘的新思路,改善了針對文本信息知識發(fā)現(xiàn)的效果。
【作者單位】: 華東師范大學(xué)信息管理系;上海圖書館;
【關(guān)鍵詞】: 關(guān)聯(lián)規(guī)則 主題模型 文本主題
【基金】:上海哲學(xué)社會科學(xué)一般項目“基于主題模型的學(xué)科交叉知識發(fā)現(xiàn)研究”(項目編號:2016BTQ002)的研究成果之一
【分類號】:TP391.1
【正文快照】: 1引言隨著信息技術(shù)和互聯(lián)網(wǎng)通信技術(shù)的發(fā)展與普及,產(chǎn)生了大量的文本信息,文本信息的快速增長使得人們在信息處理和檢索中面臨前所未有的挑戰(zhàn)。對文本的理解,不僅有助于信息檢索、內(nèi)容發(fā)現(xiàn)等情報工作的開展,同時對信息的有效分類、組織也提供了借鑒。然而文本信息的組織形式是
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 高瑋軍;馬棟林;張其文;;一種基于本體的文本主題提取方法研究[J];計算機(jī)應(yīng)用與軟件;2012年02期
2 麻志毅,姚天順;基于情境的文本主題求解[J];計算機(jī)研究與發(fā)展;1998年04期
3 王小華;徐寧;諶志群;;基于共詞分析的文本主題詞聚類與主題發(fā)現(xiàn)[J];情報科學(xué);2011年11期
4 張其文;李明;;文本主題的自動提取方法研究與實(shí)現(xiàn)[J];計算機(jī)工程與設(shè)計;2006年15期
5 侯風(fēng)巍;郭東軍;李世磊;徐釗峰;;基于信息反饋的文本主題分類過濾方法[J];通信學(xué)報;2009年S1期
6 劉興林;彭宏;馬千里;;基于增量詞集頻率的文本主題詞提取算法研究[J];計算機(jī)應(yīng)用研究;2010年09期
7 康愷;林坤輝;周昌樂;;基于主題詞頻數(shù)特征的文本主題劃分[J];計算機(jī)應(yīng)用;2006年08期
8 王科,劉淵,羅萬伯,高行宇,高常波;基于中文文本主題跟蹤的網(wǎng)絡(luò)信息分析[J];四川大學(xué)學(xué)報(工程科學(xué)版);2004年01期
9 劉菲;黃萱菁;吳立德;;利用關(guān)聯(lián)規(guī)則挖掘文本主題詞的方法[J];計算機(jī)工程;2008年07期
10 禹龍;田生偉;黃俊;;維吾爾語評論文本主題抽取研究[J];中文信息學(xué)報;2013年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 丁秉公;黃昌寧;黃德根;;文本主題識別研究及應(yīng)用[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 常鵬;基于詞共現(xiàn)的文本主題挖掘模型和算法研究[D];天津大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張文躍;基于改進(jìn)shark-search算法的主題爬蟲的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
2 梁劍;基于LDA文本主題挖掘的個性化推送及其在Spark平臺的實(shí)現(xiàn)[D];華南理工大學(xué);2016年
3 梁文婷;漢語文本主題分析技術(shù)的研究與實(shí)現(xiàn)[D];重慶大學(xué);2008年
4 蔣建慧;文本主題段落內(nèi)部概念關(guān)系抽取技術(shù)研究[D];上海交通大學(xué);2009年
5 郭劍飛;基于LDA多模型中文短文本主題分類體系構(gòu)建與分類[D];哈爾濱工業(yè)大學(xué);2014年
6 田鈺琨;基于主題鏈的海量投訴文本主題抽取方法研究[D];東北師范大學(xué);2012年
7 李宇坤;短文本主題分析的相關(guān)問題研究[D];北京郵電大學(xué);2014年
8 李振;基于LDA和圖割的文本主題分割研究[D];山東大學(xué);2013年
9 施乾坤;基于LDA模型的文本主題挖掘和文本靜態(tài)可視化的研究[D];廣西大學(xué);2013年
10 徐云飛;基于分詞技術(shù)的文本主題關(guān)鍵詞處理系統(tǒng)設(shè)計與實(shí)現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2014年
,本文編號:851597
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/851597.html