天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究

發(fā)布時(shí)間:2022-01-14 23:54
  社交網(wǎng)絡(luò)分析是人工智能的重要分支,而社交網(wǎng)絡(luò)上的影響力最大化問(wèn)題自提出以來(lái)就受到廣泛關(guān)注,研究學(xué)者為此提出了諸多模型和算法。目前有關(guān)研究主要關(guān)注根據(jù)目標(biāo)影響范圍或者限制條件給出一次性選點(diǎn)的靜態(tài)策略,沒(méi)有考慮對(duì)于影響力最大化問(wèn)題的動(dòng)態(tài)建模問(wèn)題。然而,在實(shí)時(shí)變化的網(wǎng)絡(luò)狀態(tài)中,靜態(tài)策略未必能夠取得好的影響力效果。本文提出基于強(qiáng)化學(xué)習(xí)對(duì)影響力最大化問(wèn)題進(jìn)行研究。強(qiáng)化學(xué)習(xí)算法中智能體根據(jù)與環(huán)境的歷史交互序列進(jìn)行學(xué)習(xí),這些序列具有天然的時(shí)間特性,因此強(qiáng)化學(xué)習(xí)算法能夠給出時(shí)間層面上滿足限制條件的影響力最大化動(dòng)態(tài)策略。同時(shí),強(qiáng)化學(xué)習(xí)算法給出的動(dòng)態(tài)策略能夠應(yīng)對(duì)不斷變化的網(wǎng)絡(luò)狀態(tài),根據(jù)網(wǎng)絡(luò)實(shí)時(shí)狀態(tài)給出即時(shí)的影響力最大化策略。另外,強(qiáng)化學(xué)習(xí)算法支持對(duì)獎(jiǎng)賞值進(jìn)行靈活設(shè)置,基于此能夠?qū)崿F(xiàn)影響力最大化問(wèn)題中激活種子節(jié)點(diǎn)的成本控制。本文將影響力最大化問(wèn)題分為單智能體和存在競(jìng)爭(zhēng)者的多智能體影響力最大化問(wèn)題。為單智能體影響力最大化問(wèn)題求解動(dòng)態(tài)策略,首先將其建模為具有馬爾科夫性質(zhì)的動(dòng)態(tài)最優(yōu)規(guī)劃問(wèn)題,構(gòu)建強(qiáng)化學(xué)習(xí)框架,然后選擇合適的算法進(jìn)行仿真實(shí)驗(yàn)。在與部分經(jīng)典影響力最大化算法的對(duì)比中,強(qiáng)化學(xué)習(xí)算法具有明顯優(yōu)勢(shì)。影響力最大... 

【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:84 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究


本文工作研究路線示意圖

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究


算法關(guān)系圖

基于強(qiáng)化學(xué)習(xí)的影響力最大化研究


強(qiáng)化學(xué)習(xí)中智能體學(xué)習(xí)過(guò)程示意圖

【參考文獻(xiàn)】:
期刊論文
[1]一種新的復(fù)雜網(wǎng)絡(luò)影響力最大化發(fā)現(xiàn)方法[J]. 胡慶成,張勇,許信輝,邢春曉,陳池,陳信歡.  物理學(xué)報(bào). 2015(19)

博士論文
[1]社會(huì)網(wǎng)絡(luò)信息傳播與影響力最大化研究[D]. 張伯雷.南京大學(xué) 2016



本文編號(hào):3589467

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/3589467.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8d10e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com