基于信息融合的文本主題分析算法研究
發(fā)布時(shí)間:2023-04-28 21:42
隨著信息技術(shù)的發(fā)展和大數(shù)據(jù)的興起,互聯(lián)網(wǎng)成為了人們發(fā)布和獲取信息的重要來源。其中,用戶產(chǎn)生的大部分信息以文本的形式積累在網(wǎng)絡(luò)中。如何從這些大規(guī)模非結(jié)構(gòu)化文本中,挖掘出潛在的主題知識(shí),是自然語言處理研究的重要問題之一,在輿情監(jiān)測(cè)、評(píng)論分析和內(nèi)容推薦等領(lǐng)域都有廣泛的應(yīng)用。目前,已經(jīng)有許多國(guó)內(nèi)外學(xué)者針對(duì)文本主題挖掘問題提出了一系列算法,但仍然存在以下不足:第一,現(xiàn)有方法沒有有效利用文檔附帶的元數(shù)據(jù)中的輔助信息,比如評(píng)論中的評(píng)分和情感極性,論文中的作者和引用文獻(xiàn)等。這些元數(shù)據(jù)中蘊(yùn)含有豐富的結(jié)構(gòu)信息,且不同類型的元數(shù)據(jù)對(duì)文檔內(nèi)容的影響是有差異的。當(dāng)前方法要么忽略了這些元數(shù)據(jù),要么只利用了特定的一類元數(shù)據(jù),或者對(duì)不同的元數(shù)據(jù)進(jìn)行了同樣的處理,導(dǎo)致無法充分利用元數(shù)據(jù)中的輔助信息。并且,現(xiàn)有方法無法處理元數(shù)據(jù)中包含的噪聲。第二,現(xiàn)有方法沒有考慮單詞的情感信息與單詞主題之間存在的關(guān)聯(lián),而二者其實(shí)是緊密相關(guān)的。針對(duì)以上問題,本文提出了兩個(gè)改進(jìn)后的主題分析算法,分別將元數(shù)據(jù)和情感信息融合到主題挖掘中。本文的主要貢獻(xiàn)如下:(1)針對(duì)包含作者和引用元數(shù)據(jù)的學(xué)術(shù)論文網(wǎng)絡(luò),提出了一種同時(shí)融合作者和引用元數(shù)據(jù)信息的概...
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 概率主題模型
1.2.2 文本情感分析
1.3 研究?jī)?nèi)容
1.4 主要貢獻(xiàn)與創(chuàng)新
1.5 論文的結(jié)構(gòu)安排
第二章 相關(guān)概念與技術(shù)
2.0 概率圖模型
2.0.1 基本概念
2.0.2 Gibbs采樣
2.1 概率主題模型
2.1.1 LDA模型
2.1.2 DMR模型
2.1.3 CIM模型
2.2 注意力機(jī)制
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 基于主題的情感分析
2.4.1 基于單層注意力的主題情感分析算法
2.4.2 基于多層注意力的主題情感分析算法
2.5 本章小結(jié)
第三章 融合作者和引用信息的概率主題模型
3.1 模型動(dòng)機(jī)
3.2 ACTM模型結(jié)構(gòu)描述
3.2.1 作者信息的融合
3.2.2 引用信息的融合
3.3 參數(shù)推斷
3.4 實(shí)驗(yàn)與分析
3.4.1 數(shù)據(jù)集
3.4.2 對(duì)比算法
3.4.3 主題語義一致性評(píng)估實(shí)驗(yàn)
3.4.4 文本分類實(shí)驗(yàn)
3.4.5 參數(shù)敏感性實(shí)驗(yàn)
3.4.6 定性分析
3.5 本章小結(jié)
第四章 融合情感的深度主題分析算法
4.1 模型總體框架
4.2 SSFTM模型
4.2.1 輸入表征模塊
4.2.2 局部主題感知模塊
4.2.3 主題情感表征模塊
4.2.4 MLP分類模塊
4.3 模型訓(xùn)練
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)
4.4.2 對(duì)比算法
4.4.3 實(shí)驗(yàn)設(shè)置
4.4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.5 模型有效性實(shí)驗(yàn)
4.4.6 案例分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 未來工作展望
致謝
參考文獻(xiàn)
本文編號(hào):3804535
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 概率主題模型
1.2.2 文本情感分析
1.3 研究?jī)?nèi)容
1.4 主要貢獻(xiàn)與創(chuàng)新
1.5 論文的結(jié)構(gòu)安排
第二章 相關(guān)概念與技術(shù)
2.0 概率圖模型
2.0.1 基本概念
2.0.2 Gibbs采樣
2.1 概率主題模型
2.1.1 LDA模型
2.1.2 DMR模型
2.1.3 CIM模型
2.2 注意力機(jī)制
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 基于主題的情感分析
2.4.1 基于單層注意力的主題情感分析算法
2.4.2 基于多層注意力的主題情感分析算法
2.5 本章小結(jié)
第三章 融合作者和引用信息的概率主題模型
3.1 模型動(dòng)機(jī)
3.2 ACTM模型結(jié)構(gòu)描述
3.2.1 作者信息的融合
3.2.2 引用信息的融合
3.3 參數(shù)推斷
3.4 實(shí)驗(yàn)與分析
3.4.1 數(shù)據(jù)集
3.4.2 對(duì)比算法
3.4.3 主題語義一致性評(píng)估實(shí)驗(yàn)
3.4.4 文本分類實(shí)驗(yàn)
3.4.5 參數(shù)敏感性實(shí)驗(yàn)
3.4.6 定性分析
3.5 本章小結(jié)
第四章 融合情感的深度主題分析算法
4.1 模型總體框架
4.2 SSFTM模型
4.2.1 輸入表征模塊
4.2.2 局部主題感知模塊
4.2.3 主題情感表征模塊
4.2.4 MLP分類模塊
4.3 模型訓(xùn)練
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)
4.4.2 對(duì)比算法
4.4.3 實(shí)驗(yàn)設(shè)置
4.4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.5 模型有效性實(shí)驗(yàn)
4.4.6 案例分析
4.5 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 未來工作展望
致謝
參考文獻(xiàn)
本文編號(hào):3804535
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3804535.html
最近更新
教材專著