基于前景理論的多Agent辯論協(xié)商策略研究
本文關鍵詞:基于前景理論的多Agent辯論協(xié)商策略研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:協(xié)商的目的是為了通過雙方不斷的溝通來化解利益沖突,促進協(xié)商達成。基于多Agent的自動協(xié)商充分利用了Agent的智能性和交互性,可以更好地實現(xiàn)復雜的電子商務交易過程,已經(jīng)成為協(xié)商領域研究的前沿。有效的協(xié)商策略是多Agent協(xié)商的基礎,不僅可以幫助協(xié)商者做出決策,而且可以提高協(xié)商效益,促進電子商務交易一致性;诙郃gent的辯論協(xié)商是協(xié)商領域較新的方向,引入辯論后,協(xié)商不再局限于固定的形式,從而可以提高協(xié)商的靈活性和適應性。然而通過探索國內(nèi)外研究成果發(fā)現(xiàn),現(xiàn)有的辯論協(xié)商研究多集中在形式化層面,缺乏對辯論的產(chǎn)生、評估和決策策略的系統(tǒng)化研究。鑒于此,本文將前景理論引入到多Agent辯論協(xié)商研究中,充分發(fā)揮前景理論在處理不確定性決策方面的優(yōu)勢,改變傳統(tǒng)效用最大化的決策過程;融入?yún)f(xié)商Agent的心理偏好以及決策行為;并設定基于前景理論的多Agent辯論協(xié)商模型,該模型設定了本文中所應用的基本元素,并且規(guī)定了Agent之間的辯論交互規(guī)則,很好地控制了辯論協(xié)商的進程;規(guī)定了交易雙方對待當前提議的相對損失和收益的態(tài)度,進一步設定提議參考點;诖,制定了基于前景理論的多Agent辯論協(xié)商策略,有效地學習了對手信念,并能正確預測對手心理偏好,使得決策更符合人的行為,從而促進辯論的達成。除此之外,本文充分考慮機器學習算法的優(yōu)勢,引入一種新型動態(tài)學習方法-PBIL(Population-Based Incremental Learning),它通過競爭學習所獲得的知識來指導選取最優(yōu)解,用來對基于前景理論的辯論協(xié)商策略進行優(yōu)化,并設定市場評價集合對算法學習速率進行調(diào)整,形成新的具有自適應能力的APBIL算法,對協(xié)商過程進行優(yōu)化。本文研究是對協(xié)商領域的一種新的探索,首先從協(xié)商策略和運行機制方面融入了人的主觀決策行為因素,使得協(xié)商結(jié)果更符合實際決策,為后續(xù)的自適應辯論協(xié)商策略提供一種新的思路,從而應對實際協(xié)商中動態(tài)、靈活和不確定性的需求。
【關鍵詞】:辯論協(xié)商 前景理論 協(xié)商策略 APBIL算法
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:C934
【目錄】:
- 摘要4-5
- Abstract5-9
- 第1章 緒論9-19
- 1.1 研究背景及研究意義9-10
- 1.1.1 研究背景9-10
- 1.1.2 研究意義10
- 1.2 國內(nèi)外研究現(xiàn)狀及分析10-15
- 1.2.1 多Agent辯論協(xié)商研究現(xiàn)狀10-12
- 1.2.2 前景理論決策研究現(xiàn)狀12-14
- 1.2.3 自適應協(xié)商策略研究現(xiàn)狀14-15
- 1.3 多Agent辯論協(xié)商存在問題15
- 1.4 本文的研究內(nèi)容15-16
- 1.5 本文的研究路線16-19
- 第2章 相關研究理論19-25
- 2.1 基礎研究理論19-21
- 2.1.1 辯論協(xié)商理論19
- 2.1.2 效用理論19-20
- 2.1.3 前景理論20-21
- 2.2 基于多Agent的辯論協(xié)商研究21-24
- 2.2.1 基于多Agent的辯論協(xié)商策略21-22
- 2.2.2 基于多Agent的辯論協(xié)商機制22-23
- 2.2.3 基于多Agent的辯論協(xié)商模型23-24
- 2.3 本章小結(jié)24-25
- 第3章 基于前景理論的多Agent辯論協(xié)商模型25-39
- 3.1 基于前景理論的辯論協(xié)商參數(shù)25-27
- 3.1.1 相關參數(shù)分析與設置25-26
- 3.1.2 參數(shù)的基本約束26-27
- 3.2 基于多Agent的辯論協(xié)商模型交互規(guī)則27-30
- 3.2.1 基于多Agent的辯論協(xié)商交互語義27-29
- 3.2.2 基于多Agent的辯論協(xié)商交互規(guī)則29-30
- 3.3 基于前景理論的多Agent辯論協(xié)商機制30-32
- 3.4 基于前景理論的多Agent辯論協(xié)商模型32-35
- 3.4.1 協(xié)商中的前景值33
- 3.4.2 價值函數(shù)33-34
- 3.4.3 權重函數(shù)34
- 3.4.4 指標矩陣34
- 3.4.5 參考點選擇34-35
- 3.5 基于前景理論的多Agent辯論協(xié)商策略35-38
- 3.5.1 基于前景理論的多Agent辯論協(xié)商決策邏輯35-36
- 3.5.2 基于前景理論的多Agent辯論協(xié)商策略流程36
- 3.5.3 基于前景理論的多Agent辯論協(xié)商策略36-38
- 3.6 本章小結(jié)38-39
- 第4章 基于APBIL的多Agent辯論協(xié)商策略優(yōu)化39-47
- 4.1 PBIL算法基本原理39-40
- 4.2 基于APBIL算法的多Agent辯論協(xié)商過程設置40-44
- 4.2.1 市場環(huán)境的評價集合40-41
- 4.2.2 環(huán)境影響因子41-42
- 4.2.3 自適應PBIL(Adaptive PBIL, APBIL)算法42-43
- 4.2.4 APBIL算法步驟43-44
- 4.3 基于APBIL算法的多Agent辯論協(xié)商策略優(yōu)化44-46
- 4.3.1 提議表示44
- 4.3.2 適應度函數(shù)44
- 4.3.3 優(yōu)化流程44-46
- 4.4 本章小結(jié)46-47
- 第5章 基于前景理論的多Agent辯論協(xié)商策略功能實現(xiàn)47-59
- 5.1 多Agent辯論協(xié)商案例設置47-49
- 5.2 基于前景理論的多Agent辯論協(xié)商策略功能實現(xiàn)49-57
- 5.2.1 信息處理49-51
- 5.2.2 前景理論策略推理過程51-53
- 5.2.3 改進PBIL策略優(yōu)化實現(xiàn)53-57
- 5.3 本章小結(jié)57-59
- 結(jié)論59-61
- 參考文獻61-65
- 攻讀碩士學位期間所發(fā)表的學術論文65-67
- 攻讀碩士學位期間所參與的課題67-69
- 致謝69
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 關一航;從“前景理論”看心理學在經(jīng)濟領域中的運用[J];經(jīng)濟師;2004年07期
2 劉志遠;劉超;;基于實驗研究的惡性增資行為解釋:自辨理論還是前景理論?[J];中國會計評論;2004年02期
3 胡奕明;;關于“基于實驗研究的惡性增資行為解釋:自辨理論還是前景理論?”一文的評論[J];中國會計評論;2004年02期
4 李黎明,張榮;淺析“前景理論”分析框架[J];商業(yè)時代;2005年23期
5 楊錫蓉;舒強;;從前景理論看經(jīng)濟學的發(fā)展方向[J];商場現(xiàn)代化;2007年11期
6 張迎春;;前景理論及其應用[J];消費導刊;2008年16期
7 曾進;;企業(yè)風險傾向的跨國比較——基于前景理論視角[J];科學學與科學技術管理;2009年05期
8 黃恒振;楊博文;;前景理論下的風險管理決策模型研究[J];價值工程;2009年08期
9 任穎;;前景理論和現(xiàn)代管理實踐[J];經(jīng)營管理者;2010年05期
10 劉華;黃熠琳;張?zhí)烀?;前景理論及其個人納稅遵從研究概述[J];國外社會科學;2010年03期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 劉詠梅;彭民;李立;;基于前景理論的隨機市場需求訂貨模型研究[A];2009中國控制與決策會議論文集(2)[C];2009年
2 張潔;朱建軍;劉思峰;;基于前景理論的隨機概率信息群集結(jié)模型研究[A];第十三屆中國管理科學學術年會論文集[C];2011年
3 李貴萍;;基于前景理論的單周期定價與訂購聯(lián)合決策模型[A];第十五屆中國管理科學學術年會論文集(下)[C];2013年
4 胡軍華;周益文;;基于前景理論的多準則決策方法[A];2009中國控制與決策會議論文集(2)[C];2009年
5 王亮;王應明;;基于前景理論的動態(tài)參考點應急決策方法研究[A];“兩型社會”建設與管理創(chuàng)新——第十五屆中國管理科學學術年會論文集(上)[C];2013年
6 李慶勝;劉思峰;;基于前景理論的隨機區(qū)間灰數(shù)VIKOR決策方法[A];第25屆全國灰色系統(tǒng)會議論文集[C];2014年
7 張旭;陳森發(fā);;惡劣天氣下的用戶出行路徑選擇行為建模[A];江蘇省系統(tǒng)工程學會第十一屆學術年會論文集[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前7條
1 李翔;用“前景理論”提升績效管理[N];中國石化報;2007年
2 采寫:本報記者陳春艷 評點:本報記者馬海鄰;用幸福衡量財富[N];解放日報;2003年
3 美國加州州立大學(長堤)商學院教授 美國華裔教授學者學會(南加州)秘書長 孫滌;天啊,千萬別輸![N];上海證券報;2012年
4 胡希寧 鮑永升 薛世斌;諾貝爾經(jīng)濟學獎為什么授予心理學家?[N];學習時報;2003年
5 美國加州州立大學(長堤)商學院教授 美國華裔教授學者學會(南加州)秘書長 孫滌;為怕輸而“扭曲風險”[N];上海證券報;2012年
6 本報記者 陳雪頻;奚愷元:如何由發(fā)展經(jīng)濟來提高幸福[N];第一財經(jīng)日報;2005年
7 潘啟雯;陷入“極端悖論”時,你將怎樣抉擇[N];北京日報;2009年
中國博士學位論文全文數(shù)據(jù)庫 前7條
1 張海峰;前景理論、波動不對稱與資產(chǎn)定價[D];天津大學;2011年
2 趙國慶;基于前景理論的消費—儲蓄與退休行為研究[D];天津大學;2008年
3 宋華東;基于前景理論的資產(chǎn)證券化模型與實證研究[D];大連理工大學;2011年
4 林民旺;選擇戰(zhàn)爭:基于規(guī)避損失的戰(zhàn)爭決策理論[D];外交學院;2008年
5 申紅艷;基于動態(tài)建模的網(wǎng)絡聯(lián)盟企業(yè)協(xié)同創(chuàng)新研究[D];華中科技大學;2013年
6 徐紅利;基于有限理性的城市交通系統(tǒng)均衡與擁擠收費策略研究[D];南京大學;2011年
7 孫多勇;突發(fā)性社會公共危機事件下個體與群體行為決策研究[D];國防科學技術大學;2005年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 王旭;基于前景理論的B2C消費者行為決策模型研究[D];華南理工大學;2015年
2 劉靜;基于數(shù)字概率和文字概率的前景構建方法[D];昆明理工大學;2015年
3 龐易明;基于前景理論的代建制尋租博弈分析[D];西南交通大學;2014年
4 錢昆;基于前景理論的出行者出行方式選擇模型研究[D];南京財經(jīng)大學;2015年
5 蘇羿宇;基于前景理論的企業(yè)投資決策分析方法及應用[D];華北電力大學;2015年
6 洪鐘冠;建設項目規(guī)劃設計投標方案選擇和確定[D];華僑大學;2015年
7 潘曉鋒;基于有限理性的方式劃分和交通分配組合模型[D];大連理工大學;2015年
8 魏曉蕾;基于前景理論的我國中小企業(yè)償債意愿研究[D];電子科技大學;2014年
9 李靜;基于前景理論的多Agent辯論協(xié)商策略研究[D];北京工業(yè)大學;2015年
10 尹毫企;基于前景理論的城市公共交通方式選擇模型研究[D];長安大學;2012年
本文關鍵詞:基于前景理論的多Agent辯論協(xié)商策略研究,由筆耕文化傳播整理發(fā)布。
本文編號:408417
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/408417.html