天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向網絡論壇的突發(fā)話題發(fā)現

發(fā)布時間:2018-03-30 18:09

  本文選題:計算機應用 切入點:中文信息處理 出處:《中文信息學報》2010年03期


【摘要】:每天有大量的信息涌現在論壇上,用戶可以通過論壇獲知目前國際國內正在發(fā)生的一些突發(fā)事件。如何使用機器自動化的方法檢測論壇中的突發(fā)話題已經成為搜索引擎以及網絡挖掘系統(tǒng)的一項基礎任務。話題檢測與跟蹤模型(TDT)可以很好的解決話題發(fā)現問題,但是TDT處理的對象是新聞語料,與論壇內容相比,新聞語料更準確、嚴謹、規(guī)范。TDT中使用的方法不適合用語隨意的論壇。因此在網絡論壇這種噪音環(huán)境下的話題檢測面臨著一定的困難與挑戰(zhàn)。文中提出一種基于噪音過濾的話題發(fā)現模型,它從內容和用戶參與度兩個角度來檢測論壇話題。在"水木社區(qū)"的"水木特快"上進行了相關的實驗,實驗結果表明該文提出的模型不僅可以檢測突發(fā)話題,而且可以檢測與這些話題相對應的用戶社區(qū)。
[Abstract]:Every day there is a lot of information coming up in the forum, Users can be informed through the forum of the current international and domestic events that are happening. How to use the method of machine automation to detect unexpected topics in the forum has become a basis for search engines and web mining systems. Topic Detection and tracking Model (TDTT) is a good way to solve the problem of topic discovery. But TDT deals with the news corpus, which is more accurate and rigorous than the content of the forum. The method used in the specification .TDT is not suitable for a random forum. Therefore, topic detection in a noisy environment such as a network forum faces some difficulties and challenges. In this paper, a topic discovery model based on noise filtering is proposed. It detects forum topics from the perspective of content and user participation. Experiments are carried out on Waterwood Express in "Waterwood Community". The experimental results show that the model presented in this paper can not only detect unexpected topics. And you can detect user communities that correspond to these topics.
【作者單位】: 中國科學院計算技術研究所;中國科學院研究生院;
【基金】:國家自然科學基金重點項目資助(60933005) 國家973基礎研究計劃資助項目(2007CB311100) 國家863計劃資助項目(2007AA01Z438)
【分類號】:TP393.094

【共引文獻】

相關期刊論文 前2條

1 公茂果;張嶺軍;馬晶晶;焦李成;;Community Detection in Dynamic Social Networks Based on Multiobjective Immune Algorithm[J];Journal of Computer Science & Technology;2012年03期

2 韓忠明;陳妮;樂嘉錦;段大高;孫踐知;;面向熱點話題時間序列的有效聚類算法研究[J];計算機學報;2012年11期

相關會議論文 前1條

1 陳友;程學旗;楊森;;面向網絡論壇的突發(fā)話題抽取[A];第五屆全國信息檢索學術會議論文集[C];2009年

相關博士學位論文 前3條

1 王澎;人類在線行為的實證和建模[D];中國科學技術大學;2011年

2 鄧建國;Web2.0時代的互聯(lián)網使用行為與網民社會資本之關系考察[D];復旦大學;2007年

3 丁艷輝;面向Web數據集成的數據抽取問題研究[D];山東大學;2010年

相關碩士學位論文 前9條

1 陳傳梓;基于復雜網絡理論的社區(qū)結構挖掘與人類行為模式特征分析[D];浙江大學;2011年

2 譚彩麗;基于主題相關博客的屬性挖掘模型設計[D];北京郵電大學;2011年

3 喬文妤;高校BBS平臺信息有序化研究[D];南京大學;2011年

4 張燦;基于規(guī)則的論壇爬取與抽取一體化[D];華東師范大學;2011年

5 譚卓鵬;異質網絡中的社區(qū)挖掘技術研究[D];哈爾濱工業(yè)大學;2011年

6 鄒愛民;博客技術應用于中職英語寫作教學的探索[D];華東師范大學;2007年

7 李麗娜;以大學生為受眾的思政信息網絡傳播對策研究[D];華東師范大學;2010年

8 李晶;信息傳播網絡學習方法研究[D];吉林大學;2012年

9 李晶;沈陽市農田土壤重金屬污染調查項目質量控制研究[D];吉林大學;2012年

【相似文獻】

相關期刊論文 前10條

1 魏福官;鄭孝安;;一種基于知識的書面漢語自動分詞方法[J];現代電力;1993年04期

2 龍艷花;郭武;戴禮榮;;采用支持向量機的說話者確認中的樣本平衡[J];中文信息學報;2008年03期

3 木合亞提·尼亞孜別克;古力沙吾利;;哈薩克文信息處理的現狀和發(fā)展方向[J];中文信息學報;2010年04期

4 周程遠;朱敏;楊云;;基于詞典的中文分詞算法研究[J];計算機與數字工程;2009年03期

5 羅杰;陳力;夏德麟;王凱;;基于新的關鍵詞提取方法的快速文本分類系統(tǒng)[J];計算機應用研究;2006年04期

6 朱曉旭;李培峰;朱巧明;刁紅軍;;一個適用于手持設備的多層漢字輸入法模型[J];中文信息學報;2006年06期

7 扎西加;珠杰;;面向信息處理的藏文分詞規(guī)范研究[J];中文信息學報;2009年04期

8 干俊偉,黃德根;漢語介詞短語的自動識別[J];中文信息學報;2005年04期

9 劉云峰,齊歡,Xiang’en Hu,Zhiqiang Cai;潛在語義分析權重計算的改進[J];中文信息學報;2005年06期

10 趙海;揭春雨;;基于有效子串標注的中文分詞[J];中文信息學報;2007年05期

相關會議論文 前10條

1 宋蘭;孫茂松;;中文文本全文查重的實驗研究[A];全國第八屆計算語言學聯(lián)合學術會議(JSCL-2005)論文集[C];2005年

2 劉匯丹;芮建武;吳健;;藏文網頁的編碼識別與轉換[A];中文信息處理前沿進展——中國中文信息學會二十五周年學術會議論文集[C];2006年

3 徐印才;任立群;段元慧;任俊泉;;輸血科智能管理系統(tǒng)的開發(fā)與應用[A];第四屆全國臨床檢驗學術會議論文匯編[C];2006年

4 丁力行;;2002年全國暖通空調計算機應用研討會[A];2001年湖南省暖通空調制冷學術年會論文集[C];2001年

5 陳皓;鄭利平;劉曉平;;模板在虛擬現實平臺中的應用[A];計算機技術與應用進展——全國第17屆計算機科學與技術應用(CACIS)學術會議論文集(上冊)[C];2006年

6 于平;李漢彬;高長君;;應用ActiveX技術實現Surfer自動繪制等值線圖[A];中國氣象學會2007年年會天氣預報預警和影響評估技術分會場論文集[C];2007年

7 何大治;謝步瀛;;基于子空間網絡的人員疏散模型[A];中國圖學新進展2007——第一屆中國圖學大會暨第十屆華東六省一市工程圖學學術年會論文集[C];2007年

8 繆崢紅;周新蕾;;安全性關鍵軟件的可靠性測試與安全性分析[A];提高全民科學素質、建設創(chuàng)新型國家——2006中國科協(xié)年會論文集(下冊)[C];2006年

9 石素卿;;京郊新農村發(fā)展電子商務的障礙與對策[A];提高全民科學素質、建設創(chuàng)新型國家——2006中國科協(xié)年會論文集[C];2006年

10 柏艷平;趙銀燕;肖田元;;基于XML的鍵合圖模型交換及重用[A];第十屆中國科協(xié)年會論文集(一)[C];2008年

相關重要報紙文章 前10條

1 陳奕奕 何志武;網絡論壇和報紙評論的互補互動[N];中華新聞報;2004年

2 張愛芹;網絡論壇對突發(fā)事件輿論的引導策略研究[N];中華新聞報;2008年

3 記者 李京華;網絡論壇內容侵權誰擔責[N];經濟參考報;2007年

4 本報記者 李燕鋒;真誠面對面 溝通無距離[N];洛陽日報;2010年

5 范國榮;發(fā)展,應用為本[N];中國計算機報;2002年

6 記者彭文輝;謝亦森“網談”激起強烈反響[N];宜春日報;2009年

7 本報記者 顧一瓊;青年一代 何以爆發(fā)“群體式寂寞”[N];文匯報;2009年

8 ;企業(yè)通信聲音加大[N];網絡世界;2007年

9 鄭黎;慈溪法院:刪帖并非剝奪網友發(fā)表權[N];新華每日電訊;2008年

10 記者 郭奔勝 王恒志;父母新憂:兒女上網過年比見爹娘還親[N];新華每日電訊;2006年

相關博士學位論文 前10條

1 吳承榮;骨干通道上的網絡論壇通信信息監(jiān)測和分析的關鍵技術研究[D];復旦大學;2011年

2 陳守強;丁書文教授用藥規(guī)律的計算機輔助分析[D];山東中醫(yī)藥大學;2005年

3 楊偉;郵運汽車運輸組織優(yōu)化與信息支持系統(tǒng)研究[D];西南交通大學;2005年

4 宋春陽;面向信息處理的現代漢語“名+名”邏輯語義研究[D];上海師范大學;2003年

5 由麗萍;構建現代漢語框架語義知識庫技術研究[D];上海師范大學;2006年

6 周衛(wèi)華;面向中文信息處理的現代漢語動賓語義搭配研究[D];華中師范大學;2007年

7 詹衛(wèi)東;面向中文信息處理的現代漢語短語結構規(guī)則研究[D];北京大學;1999年

8 李蘇紅;基于實體模型的工程圖樣數字化設計的研究[D];吉林大學;2007年

9 劉杰;泄漏發(fā)射的信息重建與防御對策[D];浙江大學;2004年

10 涂蓉;肝CT圖像分析的臨床與計算機應用研究[D];中南大學;2004年

相關碩士學位論文 前10條

1 陶東成;基于Linux和XIM協(xié)議的中文輸入法服務器的實現及其應用[D];蘇州大學;2004年

2 羅忠毅;數字化中醫(yī)古籍的理想模式及其相關問題研究[D];成都中醫(yī)藥大學;2005年

3 王敏;基于改進的隱馬爾科夫模型漢語詞性標注[D];山西大學;2007年

4 黨蘭學;漢字語法語義智能輸入法總體設計與部分實現[D];河南大學;2006年

5 傅成宏;現代漢語兼語結構的自動識別[D];南京師范大學;2007年

6 白曉梅;校園網中文搜索引掣系統(tǒng)的設計與實現[D];吉林大學;2006年

7 曹林峰;中文文字差錯率統(tǒng)計軟件的實現[D];西安電子科技大學;2007年

8 劉桂梅;周有光語文改革思想研究[D];山東師范大學;2005年

9 張玉華;基于碼本的輸入法評測系統(tǒng)的設計和實現[D];蘇州大學;2005年

10 杜瑩;漢字語法語義智能輸入法核心算法及實現技術[D];河南大學;2006年

,

本文編號:1687037

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1687037.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶8dbf5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com