網絡論壇話題補全與熱度量化研究
發(fā)布時間:2022-01-07 11:46
網絡論壇中存在很多話題,通過這些話題可以了解當前社會的輿情,并可以對其進行監(jiān)控,實施積極引導。對于相應的輿情監(jiān)控系統,主要研究內容包括話題識別和話題監(jiān)控。話題識別是對網絡文本集進行處理,發(fā)現其中包含的話題類別,將文本集中的文本歸入相應的類別。話題監(jiān)控是對相關話題進行監(jiān)測,并進行跟蹤和控制。在網絡話題識別方面,現有的研究中最重要、最基本的技術是文本分類和文本聚類。對于給定的一個話題,如果用分類或聚類的方法在文檔集中得到相應的文本集合,無論是訓練樣本的學習還是聚類個數的給定,或者是決定類別粒度的閾值選取,在網絡論壇的特殊情況下,其結果可能不能夠很準確、全面地描述該話題;谶@些情況,文本提出了面向網絡論壇的話題補全問題,并且實現了一種基于關鍵字的話題補全方法,使得用戶可以根據給定的與某個話題相關的關鍵字對該話題進行較為全面的關鍵字補充。在話題熱度計算方面,現有的研究都是對訪問量、回復量、點擊量等數據進行加權處理來計算相關話題的熱度,這種方式下,權重的選取對最后的話題量化結果影響很大,對同樣的話題、同樣的數據取不同的權重計算出的熱度數值會呈現出顛覆性的變化。本文根據這些情況提出基于用戶活躍程...
【文章來源】:南京財經大學江蘇省
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
網絡話題示例
HTML文檔示例
帖子HTML結構圖
【參考文獻】:
期刊論文
[1]基于情感分布的微博熱點事件發(fā)現[J]. 楊亮,林原,林鴻飛. 中文信息學報. 2012(01)
[2]面向互聯網新聞的話題檢測與追蹤[J]. 許志凱,徐志明,李棟,李生. 智能計算機與應用. 2011(03)
[3]基于BBS的熱點問題發(fā)現[J]. 梅澤勇,王清飛. 情報探索. 2011(03)
[4]基于核的自適應K-Medoid聚類[J]. 孫勝,王元珍. 計算機工程與設計. 2009(03)
[5]網絡熱點事件發(fā)現系統的設計[J]. 劉星星,何婷婷,龔海軍,陳龍. 中文信息學報. 2008(06)
[6]話題檢測與跟蹤的評測及研究綜述[J]. 洪宇,張宇,劉挺,李生. 中文信息學報. 2007(06)
[7]改進的k-平均聚類算法研究[J]. 孫士保,秦克云. 計算機工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息處理中自動分詞技術的研究與展望[J]. 劉遷,賈惠波. 計算機工程與應用. 2006(03)
[10]基于模式聚合和決策樹的文本分類規(guī)則抽取[J]. 王煜,王正歐. 情報科學. 2006(01)
碩士論文
[1]海量web輿情挖掘算法研究[D]. 周民.電子科技大學 2011
[2]微博客熱點話題發(fā)現策略研究[D]. 楊冠超.浙江大學 2011
[3]網絡熱點新聞事件挖掘和跟蹤分析方法的研究與實現[D]. 劉林浩.中南大學 2010
[4]基于聚類分析的網絡論壇輿情信息挖掘技術研究[D]. 徐東亮.哈爾濱工業(yè)大學 2010
[5]網絡輿情熱點發(fā)現與事件跟蹤技術研究[D]. 齊海鳳.哈爾濱工程大學 2008
[6]基于XML的Web信息抽取技術的應用研究[D]. 陳佳.武漢理工大學 2007
本文編號:3574485
【文章來源】:南京財經大學江蘇省
【文章頁數】:57 頁
【學位級別】:碩士
【部分圖文】:
網絡話題示例
HTML文檔示例
帖子HTML結構圖
【參考文獻】:
期刊論文
[1]基于情感分布的微博熱點事件發(fā)現[J]. 楊亮,林原,林鴻飛. 中文信息學報. 2012(01)
[2]面向互聯網新聞的話題檢測與追蹤[J]. 許志凱,徐志明,李棟,李生. 智能計算機與應用. 2011(03)
[3]基于BBS的熱點問題發(fā)現[J]. 梅澤勇,王清飛. 情報探索. 2011(03)
[4]基于核的自適應K-Medoid聚類[J]. 孫勝,王元珍. 計算機工程與設計. 2009(03)
[5]網絡熱點事件發(fā)現系統的設計[J]. 劉星星,何婷婷,龔海軍,陳龍. 中文信息學報. 2008(06)
[6]話題檢測與跟蹤的評測及研究綜述[J]. 洪宇,張宇,劉挺,李生. 中文信息學報. 2007(06)
[7]改進的k-平均聚類算法研究[J]. 孫士保,秦克云. 計算機工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息處理中自動分詞技術的研究與展望[J]. 劉遷,賈惠波. 計算機工程與應用. 2006(03)
[10]基于模式聚合和決策樹的文本分類規(guī)則抽取[J]. 王煜,王正歐. 情報科學. 2006(01)
碩士論文
[1]海量web輿情挖掘算法研究[D]. 周民.電子科技大學 2011
[2]微博客熱點話題發(fā)現策略研究[D]. 楊冠超.浙江大學 2011
[3]網絡熱點新聞事件挖掘和跟蹤分析方法的研究與實現[D]. 劉林浩.中南大學 2010
[4]基于聚類分析的網絡論壇輿情信息挖掘技術研究[D]. 徐東亮.哈爾濱工業(yè)大學 2010
[5]網絡輿情熱點發(fā)現與事件跟蹤技術研究[D]. 齊海鳳.哈爾濱工程大學 2008
[6]基于XML的Web信息抽取技術的應用研究[D]. 陳佳.武漢理工大學 2007
本文編號:3574485
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3574485.html
最近更新
教材專著