當(dāng)前位置：主頁 > 管理論文 > 領(lǐng)導(dǎo)決策論文 >

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究

發(fā)布時間：2022-01-14 23:54

　　社交網(wǎng)絡(luò)分析是人工智能的重要分支,而社交網(wǎng)絡(luò)上的影響力最大化問題自提出以來就受到廣泛關(guān)注,研究學(xué)者為此提出了諸多模型和算法。目前有關(guān)研究主要關(guān)注根據(jù)目標(biāo)影響范圍或者限制條件給出一次性選點(diǎn)的靜態(tài)策略,沒有考慮對于影響力最大化問題的動態(tài)建模問題。然而,在實(shí)時變化的網(wǎng)絡(luò)狀態(tài)中,靜態(tài)策略未必能夠取得好的影響力效果。本文提出基于強(qiáng)化學(xué)習(xí)對影響力最大化問題進(jìn)行研究。強(qiáng)化學(xué)習(xí)算法中智能體根據(jù)與環(huán)境的歷史交互序列進(jìn)行學(xué)習(xí),這些序列具有天然的時間特性,因此強(qiáng)化學(xué)習(xí)算法能夠給出時間層面上滿足限制條件的影響力最大化動態(tài)策略。同時,強(qiáng)化學(xué)習(xí)算法給出的動態(tài)策略能夠應(yīng)對不斷變化的網(wǎng)絡(luò)狀態(tài),根據(jù)網(wǎng)絡(luò)實(shí)時狀態(tài)給出即時的影響力最大化策略。另外,強(qiáng)化學(xué)習(xí)算法支持對獎賞值進(jìn)行靈活設(shè)置,基于此能夠?qū)崿F(xiàn)影響力最大化問題中激活種子節(jié)點(diǎn)的成本控制。本文將影響力最大化問題分為單智能體和存在競爭者的多智能體影響力最大化問題。為單智能體影響力最大化問題求解動態(tài)策略,首先將其建模為具有馬爾科夫性質(zhì)的動態(tài)最優(yōu)規(guī)劃問題,構(gòu)建強(qiáng)化學(xué)習(xí)框架,然后選擇合適的算法進(jìn)行仿真實(shí)驗(yàn)。在與部分經(jīng)典影響力最大化算法的對比中,強(qiáng)化學(xué)習(xí)算法具有明顯優(yōu)勢。影響力最大...

【文章來源】：電子科技大學(xué)四川省 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：84 頁

【學(xué)位級別】：碩士

【部分圖文】：

本文工作研究路線示意圖

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究

算法關(guān)系圖

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究

強(qiáng)化學(xué)習(xí)中智能體學(xué)習(xí)過程示意圖

【參考文獻(xiàn)】：
期刊論文
[1]一種新的復(fù)雜網(wǎng)絡(luò)影響力最大化發(fā)現(xiàn)方法[J]. 胡慶成,張勇,許信輝,邢春曉,陳池,陳信歡. 物理學(xué)報. 2015(19)

博士論文
[1]社會網(wǎng)絡(luò)信息傳播與影響力最大化研究[D]. 張伯雷.南京大學(xué) 2016

本文編號：3589467

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/guanlilunwen/lindaojc/3589467.html

上一篇：基于決策者信任水平和組合賦權(quán)的不完全偏好復(fù)雜大群體應(yīng)急決策方法
下一篇：模糊程度和決策角色對模糊規(guī)避的影響

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究