天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于詞頻統(tǒng)計的文本可視化實現(xiàn)

發(fā)布時間:2017-09-24 15:21

  本文關(guān)鍵詞:基于詞頻統(tǒng)計的文本可視化實現(xiàn)


  更多相關(guān)文章: 文本可視化 關(guān)鍵詞提取 四叉樹算法 TF-IDF


【摘要】:隨著海量文本的涌現(xiàn),信息超載和信息提取速度慢等問題促使了文本可視化技術(shù)的出現(xiàn)。文本可視化通過對文本資源的分析,提取信息,并以圖形化方式呈現(xiàn)出來,為人們提供了一種快速獲取文本關(guān)鍵信息的有效手段。在介紹了文本可視化的概念和重要性的基礎上,著重闡述了基于詞頻統(tǒng)計的中文文本可視化的實現(xiàn)方法;谀澄⒉┵~戶的微博數(shù)據(jù),首先使用TF-IDF算法進行關(guān)鍵詞提取,得到帶有權(quán)重的詞語,然后基于SVG技術(shù)和四叉樹算法,實現(xiàn)了文本布局算法。最后得到的可視化效果良好,能全面、直觀地反映出用戶的興趣和關(guān)注點。
【作者單位】: 北京郵電大學網(wǎng)絡與交換國家重點實驗室;
【關(guān)鍵詞】文本可視化 關(guān)鍵詞提取 四叉樹算法 TF-IDF
【分類號】:TP391.1
【正文快照】: 0引言文本信息在生活中無處不在,日常中的書籍、郵件、咨詢、新聞,都是以文本作為載體。隨著信息技術(shù)的發(fā)展,信息量呈現(xiàn)出爆炸增長,人們通過閱讀獲取和理解信息的速度明顯滯后。傳統(tǒng)的文本分析技術(shù),比如文本聚類、語義分析等,能在一定程度上挖掘出文本數(shù)據(jù)中的主要信息,但是人

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 李盛瑜;何文;;一種對聊天文本進行特征選取的方法研究[J];計算機科學;2007年05期

2 蔣志方;祝翠玲;吳強;;一個對不帶類別標記文本進行分類的方法[J];計算機工程;2007年12期

3 趙鋼;;從復雜文本中導入數(shù)據(jù)的方法[J];中國審計;2007年18期

4 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計算機科學;2002年08期

5 李建中,楊艷,張艷秋;并行文本管理原型系統(tǒng)PDoc的功能與總體框架[J];哈爾濱工業(yè)大學學報;2004年09期

6 覃曉;元昌安;彭昱忠;丁超;;基于基因表達式編程的Web文本分類研究[J];網(wǎng)絡安全技術(shù)與應用;2009年03期

7 諶志群;;文本趨勢挖掘綜述[J];情報科學;2010年02期

8 王亞民;劉洋;;含附件文本的分類算法研究[J];情報雜志;2012年08期

9 江偉;潘昊;;基于優(yōu)化的多核學習方法的Web文本分類的研究[J];計算機技術(shù)與發(fā)展;2013年10期

10 陳福海;C++中用>>和<<重載實現(xiàn)文本文件的方便存取[J];現(xiàn)代計算機;1997年05期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 許君;王朝坤;劉立超;王建民;劉璋;;云環(huán)境中的近似復制文本檢測[A];第29屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

2 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國控制與決策學術(shù)年會論文集[C];1997年

3 胡蓉;唐常杰;陳敏敏;欒江;;關(guān)聯(lián)規(guī)則制導的遺傳算法在文本分類中的應用[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2002年

4 李文波;孫樂;黃瑞紅;馮元勇;張大鯤;;基于Labeled-LDA模型的文本分類新算法[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年

5 黃云平;孫樂;李文波;;基于上下文圖模型文本表示的文本分類研究[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年

6 蔣勇;陳曉靜;;一種多方向手寫文本行提取方法[A];第二十七屆中國控制會議論文集[C];2008年

7 李瑞;王朝坤;鄭偉;王建民;王偉平;;基于MapReduce框架的近似復制文本檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2010年

8 胡俊;黃厚寬;;一種基于SVM的可視化文本分類的方法[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年

9 江荻;;藏語文本信息處理的歷程與進展[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術(shù)會議論文集[C];2006年

10 侯松;周斌;賈焰;;分詞結(jié)果的再搭配對文本分類效果的增強[A];全國計算機安全學術(shù)交流會論文集(第二十四卷)[C];2009年

中國重要報紙全文數(shù)據(jù)庫 前1條

1 戴洪玲;向Excel中快速輸入相同文本[N];中國電腦教育報;2004年

中國博士學位論文全文數(shù)據(jù)庫 前10條

1 宋歌;基于聚類森林的文本流分類方法研究[D];哈爾濱工業(yè)大學;2014年

2 韓開旭;基于支持向量機的文本情感分析研究[D];東北石油大學;2014年

3 鄭立洲;短文本信息抽取若干技術(shù)研究[D];中國科學技術(shù)大學;2016年

4 韓磊;漢語句義結(jié)構(gòu)模型分析及其文本表示方法研究[D];北京理工大學;2016年

5 胡明涵;面向領域的文本分類與挖掘關(guān)鍵技術(shù)研究[D];東北大學 ;2009年

6 孫曉華;基于聚類的文本機會發(fā)現(xiàn)關(guān)鍵問題研究[D];哈爾濱工程大學;2010年

7 尚文倩;文本分類及其相關(guān)技術(shù)研究[D];北京交通大學;2007年

8 霍躍紅;典籍英譯譯者文體分析與文本的譯者識別[D];大連理工大學;2010年

9 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復旦大學;2006年

10 李自強;大規(guī)模文本分類的若干問題研究[D];電子科技大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 金傳鑫;氣象文本分類特征選擇方法及其在MapReduce上的實現(xiàn)[D];南京信息工程大學;2015年

2 李少卿;不良文本及其變體信息的檢測過濾技術(shù)研究[D];復旦大學;2014年

3 楊名陽;基于空間文本數(shù)據(jù)的k近鄰連接研究[D];上海交通大學;2015年

4 李天彩;短文本信息流的會話抽取與分析技術(shù)研究[D];解放軍信息工程大學;2015年

5 陳亮宇;面向微博文本的事件抽取[D];東南大學;2015年

6 許慧芳;基于全覆蓋粒計算模型的文本表示和特征提取研究[D];太原理工大學;2016年

7 王煒;面向網(wǎng)絡輿情的文本語義傾向性分類算法研究[D];河北工程大學;2016年

8 任倚天;基于支持向量機的海量文本分類并行化技術(shù)研究[D];北京理工大學;2016年

9 光順利;基于Spark的文本分類的研究[D];長春工業(yè)大學;2016年

10 張高祥;基于SVM的文本信息過濾算法研究[D];吉林大學;2016年



本文編號:912146

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/912146.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0458b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com