文本主題識別關(guān)鍵技術(shù)研究綜述
本文關(guān)鍵詞:文本主題識別關(guān)鍵技術(shù)研究綜述
更多相關(guān)文章: 主題識別 文本分析 主題挖掘 語義分析 多元關(guān)系融合
【摘要】:【目的/意義】文本主題自動識別是多種情報分析,如文獻分類、檢索以及領(lǐng)域前沿識別的基礎(chǔ),因此對文本主題自動識別方法的研究意義顯著!痉椒/過程】系統(tǒng)調(diào)研了當(dāng)前文本主題識別的關(guān)鍵技術(shù),包括主題詞獲取方法、知識單元的關(guān)聯(lián)強度計算以及面向多元關(guān)系融合的主題分析方法及實踐!窘Y(jié)果/結(jié)論】在總結(jié)當(dāng)前文本主題識別方法的不足之處的基礎(chǔ)上,本文提出綜合全面的主題詞獲取方法,并在抽取范圍以及語法、語義層面結(jié)合運用;在主題詞關(guān)聯(lián)計算中,充分利用已有語義詞典和領(lǐng)域本體,將基于語義詞典相似度和知識單元共現(xiàn)分析結(jié)合,并考慮主題關(guān)聯(lián)的多元關(guān)系融合。
【作者單位】: 中國科學(xué)技術(shù)信息研究所;中國科學(xué)院成都文獻情報中心;中國科學(xué)院大學(xué);
【關(guān)鍵詞】: 主題識別 文本分析 主題挖掘 語義分析 多元關(guān)系融合
【基金】:中國博士后基金的研究成果之一 中國科學(xué)院青年創(chuàng)新促進會資助
【分類號】:G254
【正文快照】: 隨著科技文獻的數(shù)量呈超指數(shù)增長,文獻類型也日益豐富,文本主題識別日益演變?yōu)榇髷?shù)據(jù)科技文本識別。此情形下,文本主題自動識別在面臨更高的數(shù)據(jù)維度和更復(fù)雜的數(shù)據(jù)類型時,傳統(tǒng)的文本識別方法可能會失效,不能有效識別交叉主題。鑒于此,主題詞識別過程中需要考慮更多的主題詞抽
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 高瑋軍;馬棟林;張其文;;一種基于本體的文本主題提取方法研究[J];計算機應(yīng)用與軟件;2012年02期
2 麻志毅,姚天順;基于情境的文本主題求解[J];計算機研究與發(fā)展;1998年04期
3 王小華;徐寧;諶志群;;基于共詞分析的文本主題詞聚類與主題發(fā)現(xiàn)[J];情報科學(xué);2011年11期
4 張其文;李明;;文本主題的自動提取方法研究與實現(xiàn)[J];計算機工程與設(shè)計;2006年15期
5 侯風(fēng)巍;郭東軍;李世磊;徐釗峰;;基于信息反饋的文本主題分類過濾方法[J];通信學(xué)報;2009年S1期
6 劉興林;彭宏;馬千里;;基于增量詞集頻率的文本主題詞提取算法研究[J];計算機應(yīng)用研究;2010年09期
7 康愷;林坤輝;周昌樂;;基于主題詞頻數(shù)特征的文本主題劃分[J];計算機應(yīng)用;2006年08期
8 王科,劉淵,羅萬伯,高行宇,高常波;基于中文文本主題跟蹤的網(wǎng)絡(luò)信息分析[J];四川大學(xué)學(xué)報(工程科學(xué)版);2004年01期
9 劉菲;黃萱菁;吳立德;;利用關(guān)聯(lián)規(guī)則挖掘文本主題詞的方法[J];計算機工程;2008年07期
10 禹龍;田生偉;黃俊;;維吾爾語評論文本主題抽取研究[J];中文信息學(xué)報;2013年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 丁秉公;黃昌寧;黃德根;;文本主題識別研究及應(yīng)用[A];第二屆全國學(xué)生計算語言學(xué)研討會論文集[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 常鵬;基于詞共現(xiàn)的文本主題挖掘模型和算法研究[D];天津大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張文躍;基于改進shark-search算法的主題爬蟲的研究與實現(xiàn)[D];內(nèi)蒙古大學(xué);2015年
2 梁劍;基于LDA文本主題挖掘的個性化推送及其在Spark平臺的實現(xiàn)[D];華南理工大學(xué);2016年
3 梁文婷;漢語文本主題分析技術(shù)的研究與實現(xiàn)[D];重慶大學(xué);2008年
4 蔣建慧;文本主題段落內(nèi)部概念關(guān)系抽取技術(shù)研究[D];上海交通大學(xué);2009年
5 郭劍飛;基于LDA多模型中文短文本主題分類體系構(gòu)建與分類[D];哈爾濱工業(yè)大學(xué);2014年
6 田鈺琨;基于主題鏈的海量投訴文本主題抽取方法研究[D];東北師范大學(xué);2012年
7 李宇坤;短文本主題分析的相關(guān)問題研究[D];北京郵電大學(xué);2014年
8 李振;基于LDA和圖割的文本主題分割研究[D];山東大學(xué);2013年
9 施乾坤;基于LDA模型的文本主題挖掘和文本靜態(tài)可視化的研究[D];廣西大學(xué);2013年
10 徐云飛;基于分詞技術(shù)的文本主題關(guān)鍵詞處理系統(tǒng)設(shè)計與實現(xiàn)[D];中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院);2014年
,本文編號:599745
本文鏈接:http://sikaile.net/tushudanganlunwen/599745.html