基于強(qiáng)化學(xué)習(xí)的影響力最大化研究
發(fā)布時間:2022-01-14 23:54
社交網(wǎng)絡(luò)分析是人工智能的重要分支,而社交網(wǎng)絡(luò)上的影響力最大化問題自提出以來就受到廣泛關(guān)注,研究學(xué)者為此提出了諸多模型和算法。目前有關(guān)研究主要關(guān)注根據(jù)目標(biāo)影響范圍或者限制條件給出一次性選點(diǎn)的靜態(tài)策略,沒有考慮對于影響力最大化問題的動態(tài)建模問題。然而,在實(shí)時變化的網(wǎng)絡(luò)狀態(tài)中,靜態(tài)策略未必能夠取得好的影響力效果。本文提出基于強(qiáng)化學(xué)習(xí)對影響力最大化問題進(jìn)行研究。強(qiáng)化學(xué)習(xí)算法中智能體根據(jù)與環(huán)境的歷史交互序列進(jìn)行學(xué)習(xí),這些序列具有天然的時間特性,因此強(qiáng)化學(xué)習(xí)算法能夠給出時間層面上滿足限制條件的影響力最大化動態(tài)策略。同時,強(qiáng)化學(xué)習(xí)算法給出的動態(tài)策略能夠應(yīng)對不斷變化的網(wǎng)絡(luò)狀態(tài),根據(jù)網(wǎng)絡(luò)實(shí)時狀態(tài)給出即時的影響力最大化策略。另外,強(qiáng)化學(xué)習(xí)算法支持對獎賞值進(jìn)行靈活設(shè)置,基于此能夠?qū)崿F(xiàn)影響力最大化問題中激活種子節(jié)點(diǎn)的成本控制。本文將影響力最大化問題分為單智能體和存在競爭者的多智能體影響力最大化問題。為單智能體影響力最大化問題求解動態(tài)策略,首先將其建模為具有馬爾科夫性質(zhì)的動態(tài)最優(yōu)規(guī)劃問題,構(gòu)建強(qiáng)化學(xué)習(xí)框架,然后選擇合適的算法進(jìn)行仿真實(shí)驗(yàn)。在與部分經(jīng)典影響力最大化算法的對比中,強(qiáng)化學(xué)習(xí)算法具有明顯優(yōu)勢。影響力最大...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文工作研究路線示意圖
算法關(guān)系圖
強(qiáng)化學(xué)習(xí)中智能體學(xué)習(xí)過程示意圖
【參考文獻(xiàn)】:
期刊論文
[1]一種新的復(fù)雜網(wǎng)絡(luò)影響力最大化發(fā)現(xiàn)方法[J]. 胡慶成,張勇,許信輝,邢春曉,陳池,陳信歡. 物理學(xué)報. 2015(19)
博士論文
[1]社會網(wǎng)絡(luò)信息傳播與影響力最大化研究[D]. 張伯雷.南京大學(xué) 2016
本文編號:3589467
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文工作研究路線示意圖
算法關(guān)系圖
強(qiáng)化學(xué)習(xí)中智能體學(xué)習(xí)過程示意圖
【參考文獻(xiàn)】:
期刊論文
[1]一種新的復(fù)雜網(wǎng)絡(luò)影響力最大化發(fā)現(xiàn)方法[J]. 胡慶成,張勇,許信輝,邢春曉,陳池,陳信歡. 物理學(xué)報. 2015(19)
博士論文
[1]社會網(wǎng)絡(luò)信息傳播與影響力最大化研究[D]. 張伯雷.南京大學(xué) 2016
本文編號:3589467
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3589467.html
最近更新
教材專著