新聞媒體中標(biāo)題黨的分析與檢測(cè)
發(fā)布時(shí)間:2023-03-22 18:39
近年來(lái),隨著新電子媒體平臺(tái)的出現(xiàn),人們閱讀新聞的方式發(fā)生了質(zhì)的改變。這給信息傳播帶來(lái)了一定的機(jī)遇,使得個(gè)性化、碎片化的自媒體的影響力逐漸擴(kuò)大。然而,一些自媒體希望通過(guò)標(biāo)題黨獲取高的點(diǎn)擊率,從而增加網(wǎng)頁(yè)中廣告的閱讀量,進(jìn)而提高自己的收益。這給讀者、社會(huì)以及社交媒體造成了極大的困擾和社會(huì)資源浪費(fèi)。因此,及時(shí)鑒別該類新聞,是非常必要的。目前針對(duì)標(biāo)題黨的研究可分為三類:一類研究者基于標(biāo)題黨特有的語(yǔ)言風(fēng)格,提取標(biāo)題的引誘性特征進(jìn)行判斷,但此類研究較難應(yīng)對(duì)網(wǎng)絡(luò)用語(yǔ)變化,具有時(shí)間段敏感性;一類研究者基于標(biāo)題和正文語(yǔ)義匹配程度,通過(guò)挖掘標(biāo)題和正文的相似關(guān)系,判斷標(biāo)題是否是正文的合理概括,從而對(duì)標(biāo)題黨進(jìn)行檢測(cè),但此類研究無(wú)法識(shí)別出與文本相關(guān)但存在夸張表述的標(biāo)題;還有一類研究者基于社交網(wǎng)站的用戶評(píng)論等行為特征,來(lái)判斷標(biāo)題黨,但此類研究應(yīng)用場(chǎng)景存在諸多限制,且對(duì)模型的提升十分有限。本文從標(biāo)題引誘性文本特征和標(biāo)題與正文匹配程度兩個(gè)角度同時(shí)切入,緩解單獨(dú)使用某種手段時(shí)存在的局限性。本文以新聞媒體平臺(tái)中的標(biāo)題黨檢測(cè)為研究場(chǎng)景。同時(shí)考慮標(biāo)題文本特征和標(biāo)題-正文匹配程度,提出一種多策略檢測(cè)模型與算法,目的是更精確、全...
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 基于標(biāo)題文本特征的標(biāo)題研究
1.2.2 基于標(biāo)題和正文匹配程度的標(biāo)題研究
1.2.3 基于社交網(wǎng)站用戶行為的標(biāo)題研究
1.2.4 基于其它方法的標(biāo)題研究
1.2.5 標(biāo)題黨研究現(xiàn)狀總結(jié)
1.3 本文主要工作
1.3.1 研究目標(biāo)
1.3.2 研究?jī)?nèi)容
1.4 本文的主要貢獻(xiàn)
1.5 本文的組織結(jié)構(gòu)
第二章 數(shù)據(jù)獲取與處理分析
2.1 已有數(shù)據(jù)集分析
2.2 數(shù)據(jù)集擴(kuò)充
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 半監(jiān)督式數(shù)據(jù)集標(biāo)注
2.3 數(shù)據(jù)集分析
2.4 本章小結(jié)
第三章 多策略標(biāo)題黨檢測(cè)模型
3.1 標(biāo)題文本特征提取
3.1.1 研究思路
3.1.2 問(wèn)題定義
3.1.3 BERT字嵌入
3.1.4 位置編碼
3.1.5 卷積模塊定義
3.1.6 深度全卷積殘差網(wǎng)絡(luò)
3.2 標(biāo)題-正文交互匹配度計(jì)算
3.2.1 研究思路
3.2.2 問(wèn)題定義
3.2.3 粗粒度摘要提取
3.2.4 多頭自注意力機(jī)制
3.2.5 注意力模塊定義
3.2.6 深度交互匹配網(wǎng)絡(luò)構(gòu)建
3.3 多策略標(biāo)題黨檢測(cè)模型
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)設(shè)計(jì)與分析
4.1 實(shí)驗(yàn)?zāi)康呐c實(shí)驗(yàn)環(huán)境
4.1.1 實(shí)驗(yàn)?zāi)康?br> 4.1.2 實(shí)驗(yàn)環(huán)境
4.2 實(shí)驗(yàn)設(shè)計(jì)
4.2.1 評(píng)價(jià)指標(biāo)
4.2.2 數(shù)據(jù)集劃分
4.2.3 對(duì)比算法
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 模型參數(shù)設(shè)置
4.3.2 算法收斂情況
4.3.3 檢測(cè)結(jié)果對(duì)比分析
4.3.4 模型時(shí)間段敏感度分析
4.3.5 標(biāo)題-正文模型的可視化分析
4.4 本章小結(jié)
第五章 原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 原型系統(tǒng)設(shè)計(jì)
5.2 原型系統(tǒng)實(shí)現(xiàn)
5.2.1 開(kāi)發(fā)環(huán)境
5.2.2 支撐技術(shù)
5.2.3 技術(shù)細(xì)節(jié)
5.2.4 系統(tǒng)功能展示
5.3 原型系統(tǒng)特點(diǎn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
作者簡(jiǎn)介
本文編號(hào):3767382
【文章頁(yè)數(shù)】:83 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 基于標(biāo)題文本特征的標(biāo)題研究
1.2.2 基于標(biāo)題和正文匹配程度的標(biāo)題研究
1.2.3 基于社交網(wǎng)站用戶行為的標(biāo)題研究
1.2.4 基于其它方法的標(biāo)題研究
1.2.5 標(biāo)題黨研究現(xiàn)狀總結(jié)
1.3 本文主要工作
1.3.1 研究目標(biāo)
1.3.2 研究?jī)?nèi)容
1.4 本文的主要貢獻(xiàn)
1.5 本文的組織結(jié)構(gòu)
第二章 數(shù)據(jù)獲取與處理分析
2.1 已有數(shù)據(jù)集分析
2.2 數(shù)據(jù)集擴(kuò)充
2.2.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.2 半監(jiān)督式數(shù)據(jù)集標(biāo)注
2.3 數(shù)據(jù)集分析
2.4 本章小結(jié)
第三章 多策略標(biāo)題黨檢測(cè)模型
3.1 標(biāo)題文本特征提取
3.1.1 研究思路
3.1.2 問(wèn)題定義
3.1.3 BERT字嵌入
3.1.4 位置編碼
3.1.5 卷積模塊定義
3.1.6 深度全卷積殘差網(wǎng)絡(luò)
3.2 標(biāo)題-正文交互匹配度計(jì)算
3.2.1 研究思路
3.2.2 問(wèn)題定義
3.2.3 粗粒度摘要提取
3.2.4 多頭自注意力機(jī)制
3.2.5 注意力模塊定義
3.2.6 深度交互匹配網(wǎng)絡(luò)構(gòu)建
3.3 多策略標(biāo)題黨檢測(cè)模型
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)設(shè)計(jì)與分析
4.1 實(shí)驗(yàn)?zāi)康呐c實(shí)驗(yàn)環(huán)境
4.1.1 實(shí)驗(yàn)?zāi)康?br> 4.1.2 實(shí)驗(yàn)環(huán)境
4.2 實(shí)驗(yàn)設(shè)計(jì)
4.2.1 評(píng)價(jià)指標(biāo)
4.2.2 數(shù)據(jù)集劃分
4.2.3 對(duì)比算法
4.3 實(shí)驗(yàn)結(jié)果及分析
4.3.1 模型參數(shù)設(shè)置
4.3.2 算法收斂情況
4.3.3 檢測(cè)結(jié)果對(duì)比分析
4.3.4 模型時(shí)間段敏感度分析
4.3.5 標(biāo)題-正文模型的可視化分析
4.4 本章小結(jié)
第五章 原型系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
5.1 原型系統(tǒng)設(shè)計(jì)
5.2 原型系統(tǒng)實(shí)現(xiàn)
5.2.1 開(kāi)發(fā)環(huán)境
5.2.2 支撐技術(shù)
5.2.3 技術(shù)細(xì)節(jié)
5.2.4 系統(tǒng)功能展示
5.3 原型系統(tǒng)特點(diǎn)
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 研究展望
致謝
參考文獻(xiàn)
作者簡(jiǎn)介
本文編號(hào):3767382
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3767382.html
最近更新
教材專著