基于LDA的微博與傳統(tǒng)媒體的話題對比研究
發(fā)布時間:2022-02-23 03:19
在科技日新月異的時代,隨著互聯(lián)網(wǎng)在全世界的普及,人們獲取信息的途徑已經(jīng)從傳統(tǒng)媒體,如報刊、雜志、電視、廣播等途徑轉(zhuǎn)變?yōu)榫W(wǎng)站、論壇、博客等。特別是伴隨著Web2.0時代的到來,微博等即時、社交類的媒體正在飛速發(fā)展。人們從微博上快速地獲取信息已經(jīng)成為了一種趨勢。為了厘清微博這種新媒體形勢與傳統(tǒng)媒體的差別,了解到兩種媒體上討論事件時,哪些話題是普遍的,哪些話題是特有的,相同的話題在內(nèi)容與關(guān)注度上的趨勢有什么樣的不同,相同的話題在表達(dá)上有什么差異。我們借助統(tǒng)計概率模型,結(jié)合傳統(tǒng)媒體與微博在文本上的特征,提出了一種基于LDA話題模型的微博與傳統(tǒng)媒體上話題對比研究的方法。本文提出的方法首先利用LDA模型對特定事件的微博與新聞報道語料按時間先離散進(jìn)行建模,將話題的語義信息抽取出來。接著,本文提出了根據(jù)文檔字?jǐn)?shù)設(shè)置權(quán)值的關(guān)注度計算方法,計算各話題的關(guān)注度,了解每個話題在兩種媒體上被關(guān)注的程度,兩種媒體關(guān)注度高的是哪些話題,哪些話題是特有的。然后,利用Jenson-Shannon距離,計算相同話題在相鄰時間段上的演化度,得到演化路徑,分析演化路徑上話題在內(nèi)容和關(guān)注度上的趨勢變化,并對比相同話題在微博與新...
【文章來源】:上海交通大學(xué)上海市211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1. 研究背景及意義
1.2. 研究目的
1.3. 研究內(nèi)容
1.4. 本章小結(jié)
第二章 相關(guān)研究介紹
2.1. 微博與新聞報道研究概述
2.2. 基于話題模型的話題發(fā)現(xiàn)
2.2.1. 常用的話題模型
2.2.2. 微博上常用的話題模型
2.3. 新聞報道與微博話題對比研究
2.3.1. 新聞報道上的話題研究
2.3.2. 微博上的話題研究
2.3.3. 微博與新聞報道上話題的對比研究
2.4. 本章小結(jié)
第三章 基于 LDA 的話題發(fā)現(xiàn)與相同話題的識別
3.1. 本文的符號
3.2. 話題的發(fā)現(xiàn)
3.2.1. 話題的定義
3.2.2. 話題的生成
3.2.3. 話題的分類
3.3. 相同話題的識別
3.3.1. 同一種媒體上相鄰時間段內(nèi)相同話題的識別
3.3.2. 不同媒體同一時間段上相同話題的識別
3.4. 本章小結(jié)
第四章 微博與新聞報道對比研究
4.1. 關(guān)注度指標(biāo)
4.2. 演化度指標(biāo)
4.2.1. 非相鄰時間段上兩個話題的距離
4.2.2. 演化度指標(biāo)
4.3. 差異度指標(biāo)
4.3.1. 話題在不同詞表上的平滑
4.3.2. 話題分布的距離
4.3.3. 差異度指標(biāo)
4.4. 系統(tǒng)實現(xiàn)
4.5. 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1. 實驗語料與參數(shù)設(shè)置
5.1.1. 語料搜集
5.1.2. 文本預(yù)處理
5.1.3. 中文分詞
5.1.4. 參數(shù)設(shè)置
5.2. 話題發(fā)現(xiàn)(LDA)的實驗
5.3. 關(guān)注度指標(biāo)的實驗
5.4. 演化度指標(biāo)的實驗及趨勢分析
5.5. 相同話題識別的實驗
5.6. 差異度指標(biāo)的實驗
5.7. 本章小結(jié)
第六章 總結(jié)與展望
6.1. 本文的總結(jié)
6.1.1. 本文的主要工作
6.1.2. 本文的主要貢獻(xiàn)
6.2. 未來的展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
碩士論文
[1]基于話題模型的科技文獻(xiàn)話題發(fā)現(xiàn)與趨勢分析[D]. 賀亮.上海交通大學(xué) 2012
[2]基于LDA的新聞線索抽取研究[D]. 閆澤華.上海交通大學(xué) 2012
[3]基于LDA的新聞話題演化研究[D]. 楚克明.上海交通大學(xué) 2010
本文編號:3640764
【文章來源】:上海交通大學(xué)上海市211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1. 研究背景及意義
1.2. 研究目的
1.3. 研究內(nèi)容
1.4. 本章小結(jié)
第二章 相關(guān)研究介紹
2.1. 微博與新聞報道研究概述
2.2. 基于話題模型的話題發(fā)現(xiàn)
2.2.1. 常用的話題模型
2.2.2. 微博上常用的話題模型
2.3. 新聞報道與微博話題對比研究
2.3.1. 新聞報道上的話題研究
2.3.2. 微博上的話題研究
2.3.3. 微博與新聞報道上話題的對比研究
2.4. 本章小結(jié)
第三章 基于 LDA 的話題發(fā)現(xiàn)與相同話題的識別
3.1. 本文的符號
3.2. 話題的發(fā)現(xiàn)
3.2.1. 話題的定義
3.2.2. 話題的生成
3.2.3. 話題的分類
3.3. 相同話題的識別
3.3.1. 同一種媒體上相鄰時間段內(nèi)相同話題的識別
3.3.2. 不同媒體同一時間段上相同話題的識別
3.4. 本章小結(jié)
第四章 微博與新聞報道對比研究
4.1. 關(guān)注度指標(biāo)
4.2. 演化度指標(biāo)
4.2.1. 非相鄰時間段上兩個話題的距離
4.2.2. 演化度指標(biāo)
4.3. 差異度指標(biāo)
4.3.1. 話題在不同詞表上的平滑
4.3.2. 話題分布的距離
4.3.3. 差異度指標(biāo)
4.4. 系統(tǒng)實現(xiàn)
4.5. 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1. 實驗語料與參數(shù)設(shè)置
5.1.1. 語料搜集
5.1.2. 文本預(yù)處理
5.1.3. 中文分詞
5.1.4. 參數(shù)設(shè)置
5.2. 話題發(fā)現(xiàn)(LDA)的實驗
5.3. 關(guān)注度指標(biāo)的實驗
5.4. 演化度指標(biāo)的實驗及趨勢分析
5.5. 相同話題識別的實驗
5.6. 差異度指標(biāo)的實驗
5.7. 本章小結(jié)
第六章 總結(jié)與展望
6.1. 本文的總結(jié)
6.1.1. 本文的主要工作
6.1.2. 本文的主要貢獻(xiàn)
6.2. 未來的展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
碩士論文
[1]基于話題模型的科技文獻(xiàn)話題發(fā)現(xiàn)與趨勢分析[D]. 賀亮.上海交通大學(xué) 2012
[2]基于LDA的新聞線索抽取研究[D]. 閆澤華.上海交通大學(xué) 2012
[3]基于LDA的新聞話題演化研究[D]. 楚克明.上海交通大學(xué) 2010
本文編號:3640764
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3640764.html
最近更新
教材專著