微博事件自動摘要研究
發(fā)布時間:2020-12-22 07:20
在Web2.0時代,微博已成為流行的社交網(wǎng)絡(luò)平臺。微博互動性強、用戶數(shù)量大,社會上的流行熱點事件能夠在微博平臺上迅速傳播,其實時性和現(xiàn)場感遠超傳統(tǒng)媒體。通過微博瀏覽熱點事件已經(jīng)成為現(xiàn)代社會獲取最新資訊的重要途徑。然而,作為一個主打社交的平臺,微博并沒有專門對新聞事件數(shù)據(jù)進行優(yōu)化。人們在微博平臺上只能通過關(guān)鍵詞檢索事件相關(guān)微博。這些微博一方面內(nèi)容冗余度高,另一方面由于微博字數(shù)限制很難給出事件的整體描述以及用戶觀點。再者,搜索引擎的結(jié)果一般通過微博發(fā)布時間或者熱門程度等基本屬性進行排序,并沒有針對微博文本內(nèi)容或者主題進行排序的機制。這些不足致使呈現(xiàn)在用戶面前的事件信息只是一個局部,缺乏完整性。同時,對于一個事件,特別是發(fā)展過程中重點發(fā)生轉(zhuǎn)移的事件,用戶不僅需要了解事件的概況,還希望進一步掌握事件發(fā)展的脈絡(luò)和前因后果。針對這些問題,本文提出了一種面向微博事件的自動摘要生成方法。它包含兩部分內(nèi)容。對于微博事件數(shù)據(jù)如何進行表示的問題,我們設(shè)計了一種微博短文本自動摘要算法。它可以克服傳統(tǒng)的長文本自動摘要方法應(yīng)用于短文本摘要效果不佳的缺點,從事件的整體入手為微博生成摘要。對于事件演化階段的摘要生成問...
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 自動文檔摘要技術(shù)
1.2.2 事件檢測與跟蹤技術(shù)
1.2.3 事件演化技術(shù)
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)工作
2.1 自動文檔摘要
2.1.1 自動文檔摘要定義
2.1.2 自動文檔摘要評價
2.2 事件檢測、跟蹤與表示
2.2.1 事件監(jiān)測與跟蹤技術(shù)
2.2.2 事件表示
2.2.3 事件演化分析
2.3 本章小結(jié)
第3章 微博事件自動摘要算法
3.1 引言
3.2 微博事件摘要自動生成算法框架
3.3 微博事件摘要目動生成算法
3.3.1 句子重要性打分
3.3.2 事件描述摘要生成
3.3.3 情感摘要生成
3.4 實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集
3.4.2 事件描述摘要評價指標
3.4.3 事件描述摘要對比方法
3.4.4 事件描述摘要評測及討論
3.4.5 事件情感摘要評價
3.5 本章小結(jié)
第4章 微博事件演化摘要算法
4.1 引言
4.2 基于層次聚類的微博事件演化摘要算法
4.2.1 算法框架
4.2.2 微博文本時間戳的統(tǒng)一處理
4.2.3 演化特征抽取
4.2.4 基于層次聚類的演化階段識別
4.2.5 事件階段摘要生成
4.3 實驗結(jié)果
4.3.1 數(shù)據(jù)集
4.3.2 評價方式
4.3.3 事件演化摘要評測及討論
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果
【參考文獻】:
期刊論文
[1]互聯(lián)網(wǎng)話題識別與跟蹤系統(tǒng)設(shè)計及實現(xiàn)[J]. 閔可銳,趙迎賓,劉昕,趙澤宇,閆華. 計算機工程. 2008(19)
[2]基于特征選擇的輕量級入侵檢測系統(tǒng)[J]. 陳友,程學(xué)旗,李洋,戴磊. 軟件學(xué)報. 2007(07)
[3]話題識別與跟蹤中的層次化話題識別技術(shù)研究[J]. 于滿泉,駱衛(wèi)華,許洪波,白碩. 計算機研究與發(fā)展. 2006(03)
[4]基于多策略優(yōu)化的分治多層聚類算法的話題發(fā)現(xiàn)研究[J]. 駱衛(wèi)華,于滿泉,許洪波,王斌,程學(xué)旗. 中文信息學(xué)報. 2006(01)
[5]多文檔自動文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報. 2005(06)
博士論文
[1]演進式動態(tài)新聞文檔摘要生成方法研究[D]. 嚴睿.北京大學(xué) 2013
[2]中文新聞話題動態(tài)演化及其關(guān)鍵技術(shù)研究[D]. 趙旭劍.中國科學(xué)技術(shù)大學(xué) 2012
碩士論文
[1]基于時間線的事件組織與摘要技術(shù)的研究與應(yīng)用[D]. 李輝.浙江大學(xué) 2012
[2]針對微博數(shù)據(jù)的事件檢測、跟蹤及摘要生成[D]. 龍睿.上海交通大學(xué) 2012
本文編號:2931370
【文章來源】:中國科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 自動文檔摘要技術(shù)
1.2.2 事件檢測與跟蹤技術(shù)
1.2.3 事件演化技術(shù)
1.3 論文研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)工作
2.1 自動文檔摘要
2.1.1 自動文檔摘要定義
2.1.2 自動文檔摘要評價
2.2 事件檢測、跟蹤與表示
2.2.1 事件監(jiān)測與跟蹤技術(shù)
2.2.2 事件表示
2.2.3 事件演化分析
2.3 本章小結(jié)
第3章 微博事件自動摘要算法
3.1 引言
3.2 微博事件摘要自動生成算法框架
3.3 微博事件摘要目動生成算法
3.3.1 句子重要性打分
3.3.2 事件描述摘要生成
3.3.3 情感摘要生成
3.4 實驗結(jié)果及分析
3.4.1 數(shù)據(jù)集
3.4.2 事件描述摘要評價指標
3.4.3 事件描述摘要對比方法
3.4.4 事件描述摘要評測及討論
3.4.5 事件情感摘要評價
3.5 本章小結(jié)
第4章 微博事件演化摘要算法
4.1 引言
4.2 基于層次聚類的微博事件演化摘要算法
4.2.1 算法框架
4.2.2 微博文本時間戳的統(tǒng)一處理
4.2.3 演化特征抽取
4.2.4 基于層次聚類的演化階段識別
4.2.5 事件階段摘要生成
4.3 實驗結(jié)果
4.3.1 數(shù)據(jù)集
4.3.2 評價方式
4.3.3 事件演化摘要評測及討論
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來工作展望
參考文獻
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果
【參考文獻】:
期刊論文
[1]互聯(lián)網(wǎng)話題識別與跟蹤系統(tǒng)設(shè)計及實現(xiàn)[J]. 閔可銳,趙迎賓,劉昕,趙澤宇,閆華. 計算機工程. 2008(19)
[2]基于特征選擇的輕量級入侵檢測系統(tǒng)[J]. 陳友,程學(xué)旗,李洋,戴磊. 軟件學(xué)報. 2007(07)
[3]話題識別與跟蹤中的層次化話題識別技術(shù)研究[J]. 于滿泉,駱衛(wèi)華,許洪波,白碩. 計算機研究與發(fā)展. 2006(03)
[4]基于多策略優(yōu)化的分治多層聚類算法的話題發(fā)現(xiàn)研究[J]. 駱衛(wèi)華,于滿泉,許洪波,王斌,程學(xué)旗. 中文信息學(xué)報. 2006(01)
[5]多文檔自動文摘綜述[J]. 秦兵,劉挺,李生. 中文信息學(xué)報. 2005(06)
博士論文
[1]演進式動態(tài)新聞文檔摘要生成方法研究[D]. 嚴睿.北京大學(xué) 2013
[2]中文新聞話題動態(tài)演化及其關(guān)鍵技術(shù)研究[D]. 趙旭劍.中國科學(xué)技術(shù)大學(xué) 2012
碩士論文
[1]基于時間線的事件組織與摘要技術(shù)的研究與應(yīng)用[D]. 李輝.浙江大學(xué) 2012
[2]針對微博數(shù)據(jù)的事件檢測、跟蹤及摘要生成[D]. 龍睿.上海交通大學(xué) 2012
本文編號:2931370
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2931370.html
最近更新
教材專著