文本聚類研究綜述
本文關(guān)鍵詞:文本聚類研究綜述
【摘要】:[目的 /意義]文本聚類技術(shù)是提高搜索引擎性能的有效方法,是對文本信息進行組織的有效手段。[方法 /過程]介紹了文本聚類的研究背景和研究內(nèi)容,總結(jié)了引入本體技術(shù)的文本聚類研究,分析了文本聚類結(jié)果評價的幾種指標,并對文本聚類的方法和結(jié)果評價進行了綜述。[結(jié)果 /結(jié)論]文本聚類的應用領(lǐng)域?qū)⒉粩鄶U大,文本聚類技術(shù)將成為人工智能的一個重要研究課題。
【作者單位】: 福州大學經(jīng)濟與管理學院;
【關(guān)鍵詞】: 文本聚類 本體 評價指標
【基金】:國家自然科學基金項目“中文領(lǐng)域本體學習及半自動構(gòu)建方法研究”(項目編號:71201032)成果之一
【分類號】:TP391.1
【正文快照】: 0引言隨著時代的進步和科技的發(fā)展,互聯(lián)網(wǎng)上的信息非常豐富,成為全球最大的分布式信息庫,網(wǎng)絡正日益成為人們獲取信息的主要途徑,人們享受著互聯(lián)網(wǎng)所帶來的便捷和高效。目前,絕大多數(shù)的信息都表現(xiàn)為文本形式,如何在大量的文本中提取用戶感興趣的、潛在有用的信息是需要解決的
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 彭京;楊冬青;唐世渭;付艷;蔣漢奎;;一種基于語義內(nèi)積空間模型的文本聚類算法[J];計算機學報;2007年08期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 周鑫;郝志峰;蔡瑞初;溫雯;;帶噪聲的文本聚類及其在反垃圾郵件中的應用[J];廣西師范大學學報(自然科學版);2011年02期
2 符保龍;張愛科;;基于均值密度中心估計的k-means聚類文本挖掘方法[J];重慶郵電大學學報(自然科學版);2014年01期
3 吳啟明;易云飛;;文本聚類綜述[J];河池學院學報;2008年02期
4 康健輝;吳渝;鄭繼明;;基于向量空間模型的改進音頻分類算法[J];河南師范大學學報(自然科學版);2008年06期
5 胡金柱;俞小娟;李瓊;周畢吉;;基于規(guī)則庫和聚類分析的復句短語字段的自動識別研究[J];華中師范大學學報(自然科學版);2008年02期
6 陳建超;胡桂武;楊志華;嚴桂奪;;基于全局性確定聚類中心的文本聚類[J];計算機工程與應用;2011年10期
7 金春霞;周海巖;;動態(tài)向量的中文短文本聚類[J];計算機工程與應用;2011年33期
8 唐果;陳宏剛;;基于BBS熱點主題發(fā)現(xiàn)的文本聚類方法[J];計算機工程;2010年07期
9 艾偉;孫四明;張峰;;基于本體的Web文本挖掘與信息檢索[J];計算機工程;2010年22期
10 朱連江;馬炳先;趙學泉;;基于輪廓系數(shù)的聚類有效性分析[J];計算機應用;2010年S2期
中國博士學位論文全文數(shù)據(jù)庫 前7條
1 代勁;云模型在文本挖掘應用中的關(guān)鍵問題研究[D];重慶大學;2011年
2 胡佳妮;文本挖掘中若干關(guān)鍵問題的研究[D];北京郵電大學;2008年
3 劉剛;面向領(lǐng)域的軟件需求一致性驗證方法研究[D];哈爾濱工程大學;2008年
4 田野;基于微博平臺的事件趨勢分析及預測研究[D];武漢大學;2012年
5 王秀紅;文本相似度計算核函數(shù)的構(gòu)造及其在分布式信息檢索中的應用研究[D];江蘇大學;2012年
6 朱朝勇;基于本體的知識庫分類研究[D];中國科學技術(shù)大學;2013年
7 王縱虎;聚類分析優(yōu)化關(guān)鍵技術(shù)研究[D];西安電子科技大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 羅義兵;領(lǐng)域文本相似度計算方法研究[D];山東科技大學;2010年
2 黃輝;基于LSI和SVC的網(wǎng)頁文本分類算法研究[D];長沙理工大學;2010年
3 沙有闖;基于Web文本挖掘的網(wǎng)絡口碑監(jiān)測系統(tǒng)研究[D];安徽大學;2010年
4 吳啟綱;中文文本聚類算法的研究與實現(xiàn)[D];西安電子科技大學;2010年
5 崔弘揚;面向?qū)W科的文獻資源聚類系統(tǒng)研究及應用[D];華中師范大學;2011年
6 謝鳳宏;基于復雜網(wǎng)絡理論的文本聚類和關(guān)鍵詞提取方法研究[D];遼寧師范大學;2011年
7 閆先明;基于變精度粗糙集的網(wǎng)絡隱蔽通道檢測的研究[D];南京理工大學;2011年
8 俞文明;Web中文文本聚類研究[D];杭州電子科技大學;2009年
9 徐東亮;基于聚類分析的網(wǎng)絡論壇輿情信息挖掘技術(shù)研究[D];哈爾濱工業(yè)大學;2010年
10 王燕;網(wǎng)站敏感信息監(jiān)視系統(tǒng)設(shè)計與實現(xiàn)[D];解放軍信息工程大學;2008年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 趙軍;金千里;徐波;;面向文本檢索的語義計算[J];計算機學報;2005年12期
2 卜東波,白碩,李國杰;文本聚類中權(quán)重計算的對偶性策略[J];軟件學報;2002年11期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 趙亞琴;周獻中;;一種基于小生境遺傳算法的中文文本聚類新方法[J];計算機工程;2006年06期
2 劉務華;羅鐵堅;王文杰;;文本聚類技術(shù)的有效性驗證[J];計算機工程;2007年01期
3 丁X;許侃;;基于文本聚類方法的我國科技管理研究領(lǐng)域的計量研究[J];科學學研究;2007年S1期
4 孫愛香;楊鑫華;;關(guān)于文本聚類有效性評價的研究[J];山東理工大學學報(自然科學版);2007年05期
5 丘志宏;宮雷光;;利用上下文提高文本聚類的效果[J];中文信息學報;2007年06期
6 吳啟明;易云飛;;文本聚類綜述[J];河池學院學報;2008年02期
7 李江華;楊書新;劉利峰;;基于概念格的文本聚類[J];計算機應用;2008年09期
8 趙文鵬;;淺談文本聚類研究[J];企業(yè)家天地下半月刊(理論版);2009年02期
9 章成志;;文本聚類結(jié)果描述研究綜述[J];現(xiàn)代圖書情報技術(shù);2009年02期
10 馬娜;;文本聚類研究[J];電腦知識與技術(shù);2009年20期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 趙世奇;劉挺;李生;;一種基于主題的文本聚類方法[A];第三屆學生計算語言學研討會論文集[C];2006年
2 王洪俊;俞士汶;蘇祺;施水才;肖詩斌;;中文文本聚類的特征單元比較[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 胡吉祥;許洪波;劉悅;王斌;程學旗;;基于重復串的短文本聚類研究[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
4 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應用[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
5 王明文;付劍波;羅遠勝;陸旭;;基于協(xié)同聚類的兩階段文本聚類方法研究[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年
6 張猛;王大玲;于戈;;一種基于自動閾值發(fā)現(xiàn)的文本聚類方法[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2004年
7 王樂;田李;賈焰;韓偉紅;;一個并行的文本聚類混合算法[A];第二十四屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2007年
8 王瑩;劉楊;;維基百科的文本聚類方法分析[A];2009年研究生學術(shù)交流會通信與信息技術(shù)論文集[C];2009年
9 張寶艷;王慶輝;;中文文本聚類的研究與實現(xiàn)[A];第一屆學生計算語言學研討會論文集[C];2002年
10 章成志;;基于多語文本聚類的主題層次體系生成研究1)[A];國家自然科學基金委員會管理科學部宏觀管理與政策學科青年基金獲得者交流研討會論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前3條
1 徐森;文本聚類集成關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2010年
2 高茂庭;文本聚類分析若干問題研究[D];天津大學;2007年
3 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學;2009年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 康健;基于Multi-agent和群體智能的藏文網(wǎng)絡輿情管理研究[D];西南交通大學;2015年
2 張培偉;基于改進Single-Pass算法的熱點話題發(fā)現(xiàn)系統(tǒng)的設(shè)計與實現(xiàn)[D];華中師范大學;2015年
3 郭士串;結(jié)合權(quán)重因子與特征向量的文本聚類研究與應用[D];江西理工大學;2015年
4 邵明來;中文文本聚類關(guān)鍵技術(shù)研究[D];廣西大學;2015年
5 王恒靜;基于詞類和搭配的微博輿情文本聚類方法研究[D];江蘇科技大學;2015年
6 吳潔潔;基于RI方法的文本聚類研究[D];南昌大學;2015年
7 樊兆欣;個性化新聞推薦系統(tǒng)關(guān)鍵技術(shù)研究與實現(xiàn)[D];北京理工大學;2015年
8 蘇圣瞳;微博熱點話題發(fā)現(xiàn)系統(tǒng)的設(shè)計與實現(xiàn)[D];復旦大學;2014年
9 孫東普;融合屬性抽取的多粒度專利文本聚類研究[D];大連理工大學;2015年
10 張麗;一種中文文本聚類方法的研究[D];哈爾濱工程大學;2009年
,本文編號:739746
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/739746.html