網(wǎng)絡(luò)論壇話題補(bǔ)全與熱度量化研究
發(fā)布時(shí)間:2022-01-07 11:46
網(wǎng)絡(luò)論壇中存在很多話題,通過這些話題可以了解當(dāng)前社會(huì)的輿情,并可以對(duì)其進(jìn)行監(jiān)控,實(shí)施積極引導(dǎo)。對(duì)于相應(yīng)的輿情監(jiān)控系統(tǒng),主要研究?jī)?nèi)容包括話題識(shí)別和話題監(jiān)控。話題識(shí)別是對(duì)網(wǎng)絡(luò)文本集進(jìn)行處理,發(fā)現(xiàn)其中包含的話題類別,將文本集中的文本歸入相應(yīng)的類別。話題監(jiān)控是對(duì)相關(guān)話題進(jìn)行監(jiān)測(cè),并進(jìn)行跟蹤和控制。在網(wǎng)絡(luò)話題識(shí)別方面,現(xiàn)有的研究中最重要、最基本的技術(shù)是文本分類和文本聚類。對(duì)于給定的一個(gè)話題,如果用分類或聚類的方法在文檔集中得到相應(yīng)的文本集合,無論是訓(xùn)練樣本的學(xué)習(xí)還是聚類個(gè)數(shù)的給定,或者是決定類別粒度的閾值選取,在網(wǎng)絡(luò)論壇的特殊情況下,其結(jié)果可能不能夠很準(zhǔn)確、全面地描述該話題;谶@些情況,文本提出了面向網(wǎng)絡(luò)論壇的話題補(bǔ)全問題,并且實(shí)現(xiàn)了一種基于關(guān)鍵字的話題補(bǔ)全方法,使得用戶可以根據(jù)給定的與某個(gè)話題相關(guān)的關(guān)鍵字對(duì)該話題進(jìn)行較為全面的關(guān)鍵字補(bǔ)充。在話題熱度計(jì)算方面,現(xiàn)有的研究都是對(duì)訪問量、回復(fù)量、點(diǎn)擊量等數(shù)據(jù)進(jìn)行加權(quán)處理來計(jì)算相關(guān)話題的熱度,這種方式下,權(quán)重的選取對(duì)最后的話題量化結(jié)果影響很大,對(duì)同樣的話題、同樣的數(shù)據(jù)取不同的權(quán)重計(jì)算出的熱度數(shù)值會(huì)呈現(xiàn)出顛覆性的變化。本文根據(jù)這些情況提出基于用戶活躍程...
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)話題示例
HTML文檔示例
帖子HTML結(jié)構(gòu)圖
【參考文獻(xiàn)】:
期刊論文
[1]基于情感分布的微博熱點(diǎn)事件發(fā)現(xiàn)[J]. 楊亮,林原,林鴻飛. 中文信息學(xué)報(bào). 2012(01)
[2]面向互聯(lián)網(wǎng)新聞的話題檢測(cè)與追蹤[J]. 許志凱,徐志明,李棟,李生. 智能計(jì)算機(jī)與應(yīng)用. 2011(03)
[3]基于BBS的熱點(diǎn)問題發(fā)現(xiàn)[J]. 梅澤勇,王清飛. 情報(bào)探索. 2011(03)
[4]基于核的自適應(yīng)K-Medoid聚類[J]. 孫勝,王元珍. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(03)
[5]網(wǎng)絡(luò)熱點(diǎn)事件發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)[J]. 劉星星,何婷婷,龔海軍,陳龍. 中文信息學(xué)報(bào). 2008(06)
[6]話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J]. 洪宇,張宇,劉挺,李生. 中文信息學(xué)報(bào). 2007(06)
[7]改進(jìn)的k-平均聚類算法研究[J]. 孫士保,秦克云. 計(jì)算機(jī)工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J]. 劉遷,賈惠波. 計(jì)算機(jī)工程與應(yīng)用. 2006(03)
[10]基于模式聚合和決策樹的文本分類規(guī)則抽取[J]. 王煜,王正歐. 情報(bào)科學(xué). 2006(01)
碩士論文
[1]海量web輿情挖掘算法研究[D]. 周民.電子科技大學(xué) 2011
[2]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
[3]網(wǎng)絡(luò)熱點(diǎn)新聞事件挖掘和跟蹤分析方法的研究與實(shí)現(xiàn)[D]. 劉林浩.中南大學(xué) 2010
[4]基于聚類分析的網(wǎng)絡(luò)論壇輿情信息挖掘技術(shù)研究[D]. 徐東亮.哈爾濱工業(yè)大學(xué) 2010
[5]網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與事件跟蹤技術(shù)研究[D]. 齊海鳳.哈爾濱工程大學(xué) 2008
[6]基于XML的Web信息抽取技術(shù)的應(yīng)用研究[D]. 陳佳.武漢理工大學(xué) 2007
本文編號(hào):3574485
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)話題示例
HTML文檔示例
帖子HTML結(jié)構(gòu)圖
【參考文獻(xiàn)】:
期刊論文
[1]基于情感分布的微博熱點(diǎn)事件發(fā)現(xiàn)[J]. 楊亮,林原,林鴻飛. 中文信息學(xué)報(bào). 2012(01)
[2]面向互聯(lián)網(wǎng)新聞的話題檢測(cè)與追蹤[J]. 許志凱,徐志明,李棟,李生. 智能計(jì)算機(jī)與應(yīng)用. 2011(03)
[3]基于BBS的熱點(diǎn)問題發(fā)現(xiàn)[J]. 梅澤勇,王清飛. 情報(bào)探索. 2011(03)
[4]基于核的自適應(yīng)K-Medoid聚類[J]. 孫勝,王元珍. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(03)
[5]網(wǎng)絡(luò)熱點(diǎn)事件發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)[J]. 劉星星,何婷婷,龔海軍,陳龍. 中文信息學(xué)報(bào). 2008(06)
[6]話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J]. 洪宇,張宇,劉挺,李生. 中文信息學(xué)報(bào). 2007(06)
[7]改進(jìn)的k-平均聚類算法研究[J]. 孫士保,秦克云. 計(jì)算機(jī)工程. 2007(13)
[8]Design and Implementation of On-Line Hot Topic Discovery Model[J]. YE Hui-min~ 1,2 , CHENG Wei~2 DAI Guan-zhong~ 1 1. School of Automatic Control, Northwestern Polytechnical University, Xi’an 710072, Shaanxi, China; 2. Institute of Artificial Intelligence, Beijing City University , Beijing 100083, China. Wuhan University Journal of Natural Sciences. 2006(01)
[9]中文信息處理中自動(dòng)分詞技術(shù)的研究與展望[J]. 劉遷,賈惠波. 計(jì)算機(jī)工程與應(yīng)用. 2006(03)
[10]基于模式聚合和決策樹的文本分類規(guī)則抽取[J]. 王煜,王正歐. 情報(bào)科學(xué). 2006(01)
碩士論文
[1]海量web輿情挖掘算法研究[D]. 周民.電子科技大學(xué) 2011
[2]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
[3]網(wǎng)絡(luò)熱點(diǎn)新聞事件挖掘和跟蹤分析方法的研究與實(shí)現(xiàn)[D]. 劉林浩.中南大學(xué) 2010
[4]基于聚類分析的網(wǎng)絡(luò)論壇輿情信息挖掘技術(shù)研究[D]. 徐東亮.哈爾濱工業(yè)大學(xué) 2010
[5]網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與事件跟蹤技術(shù)研究[D]. 齊海鳳.哈爾濱工程大學(xué) 2008
[6]基于XML的Web信息抽取技術(shù)的應(yīng)用研究[D]. 陳佳.武漢理工大學(xué) 2007
本文編號(hào):3574485
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3574485.html
最近更新
教材專著