篇章級事件表示及相關(guān)性計(jì)算
發(fā)布時(shí)間:2023-11-15 17:27
事件抽取一直是學(xué)術(shù)研究的熱點(diǎn),對話或文章的核心信息往往是一個(gè)或者多個(gè)事件。因此,事件提取可以為聚類、推薦、推理等任務(wù)提供關(guān)鍵信息和重要特征。隨著互聯(lián)網(wǎng)信息流的不斷發(fā)展,人們獲取信息的主要來源不再是主動搜索,而是被動推薦。今日頭條、天天快報(bào)等依靠個(gè)性化推薦新聞而提升用戶粘性的產(chǎn)品不斷涌現(xiàn)。此類內(nèi)容推薦通常在分析用戶感興趣的事件的基礎(chǔ)上,推送相同或類似事件的文章。這就首先要對篇章級的事件進(jìn)行提取,并依據(jù)于此對篇章進(jìn)行分類。而當(dāng)前事件提取的主要研究方向?yàn)榫渥蛹壥录奶崛?篇章級事件研究較少,具有很高的研究價(jià)值。本文針對天天快報(bào)新聞?wù)Z料,從標(biāo)題、文章兩個(gè)方面進(jìn)行篇章級事件關(guān)鍵詞的提取以及事件相關(guān)性計(jì)算。本文采用短文本相似度的計(jì)算方法對兩篇新聞的標(biāo)題相似程度進(jìn)行計(jì)算,并將其作為新聞事件相關(guān)性計(jì)算的第一個(gè)指標(biāo)。一篇新聞為了報(bào)導(dǎo)的完整性以及閱讀的流暢性,往往在報(bào)導(dǎo)核心事件外,也會涵蓋事件的歷史信息、相關(guān)事件、相關(guān)人物等內(nèi)容,這些內(nèi)容屬于冗余信息。為了更準(zhǔn)確地提取核心事件,本文在篩選文章的關(guān)鍵信息之后,再對關(guān)鍵事件詞進(jìn)行抽取,并依據(jù)此計(jì)算文章的事件相關(guān)性,并將其作為新聞事件相關(guān)性計(jì)算的第二個(gè)指標(biāo)。將兩...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本摘要方法研究
1.2.2 事件抽取方法研究
1.3 本文的主要研究內(nèi)容
1.4 本文的章節(jié)安排
第2章 關(guān)鍵事件信息篩選
2.1 關(guān)鍵子句篩選及詞語重要性計(jì)算
2.1.1 子句連通圖的構(gòu)建
2.1.2 EM思想基礎(chǔ)
2.1.3 Text Rank算法基礎(chǔ)
2.1.4 基于EM思想的Text Rank算法
2.1.5 模型效果演示
2.2 關(guān)鍵事件詞篩選
2.2.1 句子級事件提取..ZORE
2.2.2 句子級事件多邊形構(gòu)建
2.2.3 句子級事件連通圖的構(gòu)建
2.2.4 隨機(jī)游走(Text Rank)計(jì)算節(jié)點(diǎn)的權(quán)重
2.2.5 模型效果演示
2.3 本章小結(jié)
第3章 關(guān)鍵事件詞詞向量調(diào)整
3.1 基于VERB NET的動詞詞向量調(diào)整
3.1.1 VerbNet簡介
3.1.2 同義約束和吸引約束
3.1.3 同義詞向量調(diào)整模型
3.2 基于DEEP WALK的節(jié)點(diǎn)詞詞向量調(diào)整
3.2.1 DeepWalk算法流程
3.2.2 隨機(jī)游走生成節(jié)點(diǎn)序列
3.2.3 DeepWalk中的Skip-Gram模型
3.3 本章小結(jié)
第4章 標(biāo)題相似度計(jì)算
4.1 模型的假設(shè)
4.2 預(yù)訓(xùn)練SEQ2SEQ模型
4.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第5章 篇章級事件相似度計(jì)算
5.1 相似度計(jì)算模型
5.2 試驗(yàn)結(jié)果與分析
5.2.1 數(shù)據(jù)集及實(shí)驗(yàn)環(huán)境
5.2.2 對比實(shí)驗(yàn)設(shè)計(jì)
5.2.3 結(jié)果及分析
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3864175
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本摘要方法研究
1.2.2 事件抽取方法研究
1.3 本文的主要研究內(nèi)容
1.4 本文的章節(jié)安排
第2章 關(guān)鍵事件信息篩選
2.1 關(guān)鍵子句篩選及詞語重要性計(jì)算
2.1.1 子句連通圖的構(gòu)建
2.1.2 EM思想基礎(chǔ)
2.1.3 Text Rank算法基礎(chǔ)
2.1.4 基于EM思想的Text Rank算法
2.1.5 模型效果演示
2.2 關(guān)鍵事件詞篩選
2.2.1 句子級事件提取..ZORE
2.2.2 句子級事件多邊形構(gòu)建
2.2.3 句子級事件連通圖的構(gòu)建
2.2.4 隨機(jī)游走(Text Rank)計(jì)算節(jié)點(diǎn)的權(quán)重
2.2.5 模型效果演示
2.3 本章小結(jié)
第3章 關(guān)鍵事件詞詞向量調(diào)整
3.1 基于VERB NET的動詞詞向量調(diào)整
3.1.1 VerbNet簡介
3.1.2 同義約束和吸引約束
3.1.3 同義詞向量調(diào)整模型
3.2 基于DEEP WALK的節(jié)點(diǎn)詞詞向量調(diào)整
3.2.1 DeepWalk算法流程
3.2.2 隨機(jī)游走生成節(jié)點(diǎn)序列
3.2.3 DeepWalk中的Skip-Gram模型
3.3 本章小結(jié)
第4章 標(biāo)題相似度計(jì)算
4.1 模型的假設(shè)
4.2 預(yù)訓(xùn)練SEQ2SEQ模型
4.3 實(shí)驗(yàn)結(jié)果及分析
4.4 本章小結(jié)
第5章 篇章級事件相似度計(jì)算
5.1 相似度計(jì)算模型
5.2 試驗(yàn)結(jié)果與分析
5.2.1 數(shù)據(jù)集及實(shí)驗(yàn)環(huán)境
5.2.2 對比實(shí)驗(yàn)設(shè)計(jì)
5.2.3 結(jié)果及分析
5.3 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號:3864175
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3864175.html
最近更新
教材專著