文本主題識別關鍵技術研究綜述
本文關鍵詞:文本主題識別關鍵技術研究綜述
更多相關文章: 主題識別 文本分析 主題挖掘 語義分析 多元關系融合
【摘要】:【目的/意義】文本主題自動識別是多種情報分析,如文獻分類、檢索以及領域前沿識別的基礎,因此對文本主題自動識別方法的研究意義顯著!痉椒/過程】系統(tǒng)調研了當前文本主題識別的關鍵技術,包括主題詞獲取方法、知識單元的關聯(lián)強度計算以及面向多元關系融合的主題分析方法及實踐!窘Y果/結論】在總結當前文本主題識別方法的不足之處的基礎上,本文提出綜合全面的主題詞獲取方法,并在抽取范圍以及語法、語義層面結合運用;在主題詞關聯(lián)計算中,充分利用已有語義詞典和領域本體,將基于語義詞典相似度和知識單元共現分析結合,并考慮主題關聯(lián)的多元關系融合。
【作者單位】: 中國科學技術信息研究所;中國科學院成都文獻情報中心;中國科學院大學;
【關鍵詞】: 主題識別 文本分析 主題挖掘 語義分析 多元關系融合
【基金】:中國博士后基金的研究成果之一 中國科學院青年創(chuàng)新促進會資助
【分類號】:G254
【正文快照】: 隨著科技文獻的數量呈超指數增長,文獻類型也日益豐富,文本主題識別日益演變?yōu)榇髷祿萍嘉谋咀R別。此情形下,文本主題自動識別在面臨更高的數據維度和更復雜的數據類型時,傳統(tǒng)的文本識別方法可能會失效,不能有效識別交叉主題。鑒于此,主題詞識別過程中需要考慮更多的主題詞抽
【相似文獻】
中國期刊全文數據庫 前10條
1 高瑋軍;馬棟林;張其文;;一種基于本體的文本主題提取方法研究[J];計算機應用與軟件;2012年02期
2 麻志毅,姚天順;基于情境的文本主題求解[J];計算機研究與發(fā)展;1998年04期
3 王小華;徐寧;諶志群;;基于共詞分析的文本主題詞聚類與主題發(fā)現[J];情報科學;2011年11期
4 張其文;李明;;文本主題的自動提取方法研究與實現[J];計算機工程與設計;2006年15期
5 侯風巍;郭東軍;李世磊;徐釗峰;;基于信息反饋的文本主題分類過濾方法[J];通信學報;2009年S1期
6 劉興林;彭宏;馬千里;;基于增量詞集頻率的文本主題詞提取算法研究[J];計算機應用研究;2010年09期
7 康愷;林坤輝;周昌樂;;基于主題詞頻數特征的文本主題劃分[J];計算機應用;2006年08期
8 王科,劉淵,羅萬伯,高行宇,高常波;基于中文文本主題跟蹤的網絡信息分析[J];四川大學學報(工程科學版);2004年01期
9 劉菲;黃萱菁;吳立德;;利用關聯(lián)規(guī)則挖掘文本主題詞的方法[J];計算機工程;2008年07期
10 禹龍;田生偉;黃俊;;維吾爾語評論文本主題抽取研究[J];中文信息學報;2013年04期
中國重要會議論文全文數據庫 前1條
1 丁秉公;黃昌寧;黃德根;;文本主題識別研究及應用[A];第二屆全國學生計算語言學研討會論文集[C];2004年
中國博士學位論文全文數據庫 前1條
1 常鵬;基于詞共現的文本主題挖掘模型和算法研究[D];天津大學;2010年
中國碩士學位論文全文數據庫 前10條
1 張文躍;基于改進shark-search算法的主題爬蟲的研究與實現[D];內蒙古大學;2015年
2 梁劍;基于LDA文本主題挖掘的個性化推送及其在Spark平臺的實現[D];華南理工大學;2016年
3 梁文婷;漢語文本主題分析技術的研究與實現[D];重慶大學;2008年
4 蔣建慧;文本主題段落內部概念關系抽取技術研究[D];上海交通大學;2009年
5 郭劍飛;基于LDA多模型中文短文本主題分類體系構建與分類[D];哈爾濱工業(yè)大學;2014年
6 田鈺琨;基于主題鏈的海量投訴文本主題抽取方法研究[D];東北師范大學;2012年
7 李宇坤;短文本主題分析的相關問題研究[D];北京郵電大學;2014年
8 李振;基于LDA和圖割的文本主題分割研究[D];山東大學;2013年
9 施乾坤;基于LDA模型的文本主題挖掘和文本靜態(tài)可視化的研究[D];廣西大學;2013年
10 徐云飛;基于分詞技術的文本主題關鍵詞處理系統(tǒng)設計與實現[D];中國科學院大學(工程管理與信息技術學院);2014年
,本文編號:599745
本文鏈接:http://sikaile.net/tushudanganlunwen/599745.html