基于關系映射的遷移模型研究及應用
發(fā)布時間:2022-08-13 15:16
隨著機器學習的不斷發(fā)展,遷移學習也受到越來越多的研究者的關注。遷移學習之所以受到重視是因為在提高算法的自適應能力,解決領域數據不足的問題,減少算法的訓練時間等方面都可以發(fā)揮重要的作用。遷移學習在解決原始問題時引入源領域,借助源領域的知識來幫助解決目標領域的問題,這個目標領域就是原始問題對應的領域。遷移學習的源領域和目標領域可以是同構的,也就是源領域與目標領域的數據分布、特征空間和輸出空間都相同,反之,如果不是都相同,則被認為是異構的。這意味著異構遷移學習打破了傳統(tǒng)機器學習的獨立同分布假設,因此學習起來將更為困難。本文研究的是異構領域的遷移模型,我們利用關系映射的思想進行遷移,其本質是構造源領域與目標領域之間的關系,然后借助這種關系進行遷移。我們將關系映射的遷移學習思想與兩種不同的機器學習方法相結合,得到了基于謂詞映射的馬爾科夫邏輯網絡遷移模型和基于雙向關系映射的遷移強化學習模型,分別解決了領域數據不足和算法訓練時間過長的問題。馬爾科夫邏輯網絡是一種依靠邏輯關系進行推理的機器學習模型,我們利用源領域和目標領域一階邏輯公式之間的關系,使用謂詞映射構造目標領域的一階邏輯公式,并利用規(guī)則篩選、...
【文章頁數】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景和意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內外研究現狀
1.2.1 遷移學習研究現狀
1.2.2 馬爾科夫邏輯網絡的遷移研究
1.2.3 強化學習的遷移研究
1.3 主要研究內容
1.4 論文組織結構
第2章 本文相關技術
2.1 馬爾科夫邏輯網絡的遷移
2.1.1 馬爾科夫邏輯網絡
2.1.2 謂詞映射
2.1.3 單實體為中心的實例
2.2 強化學習的遷移
2.1.1 Keepaway測試平臺
2.1.2 強化學習
2.1.3 Tile編碼
2.3 本章小結
第3章 基于謂詞映射的MLN遷移模型
3.1 研究問題描述
3.2 基于謂詞映射的遷移算法設計
3.2.1 邏輯公式的謂詞映射
3.2.2 邏輯公式的數據驗證
3.2.3 邏輯公式的規(guī)則篩選
3.2.4 MLN模型的謂詞覆蓋
3.3 評估方法和數據
3.4 實驗結果及分析
3.4.1 實驗結果
3.4.2 實驗分析
3.5 輿情數據實驗
3.5.1 特征和數據的謂詞化
3.5.2 源領域MLN模型的建立
3.5.3 遷移效果評估
3.6 本章小結
第4章 基于雙向關系映射的TRL模型
4.1 研究問題描述
4.2 基于雙向關系映射的遷移算法
4.2.1 雙向關系映射遷移框架的描述
4.2.2 Keepaway問題建模
4.2.3 基于遷移框架的遷移算法設計
4.3 實驗過程及分析
4.3.1 源領域的訓練周期
4.3.2 DMap-Multi的指導周期
4.3.3 DMap-Best的指導周期
4.4 實驗結果對比
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3677274
【文章頁數】:77 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景和意義
1.1.1 課題研究背景
1.1.2 課題研究意義
1.2 國內外研究現狀
1.2.1 遷移學習研究現狀
1.2.2 馬爾科夫邏輯網絡的遷移研究
1.2.3 強化學習的遷移研究
1.3 主要研究內容
1.4 論文組織結構
第2章 本文相關技術
2.1 馬爾科夫邏輯網絡的遷移
2.1.1 馬爾科夫邏輯網絡
2.1.2 謂詞映射
2.1.3 單實體為中心的實例
2.2 強化學習的遷移
2.1.1 Keepaway測試平臺
2.1.2 強化學習
2.1.3 Tile編碼
2.3 本章小結
第3章 基于謂詞映射的MLN遷移模型
3.1 研究問題描述
3.2 基于謂詞映射的遷移算法設計
3.2.1 邏輯公式的謂詞映射
3.2.2 邏輯公式的數據驗證
3.2.3 邏輯公式的規(guī)則篩選
3.2.4 MLN模型的謂詞覆蓋
3.3 評估方法和數據
3.4 實驗結果及分析
3.4.1 實驗結果
3.4.2 實驗分析
3.5 輿情數據實驗
3.5.1 特征和數據的謂詞化
3.5.2 源領域MLN模型的建立
3.5.3 遷移效果評估
3.6 本章小結
第4章 基于雙向關系映射的TRL模型
4.1 研究問題描述
4.2 基于雙向關系映射的遷移算法
4.2.1 雙向關系映射遷移框架的描述
4.2.2 Keepaway問題建模
4.2.3 基于遷移框架的遷移算法設計
4.3 實驗過程及分析
4.3.1 源領域的訓練周期
4.3.2 DMap-Multi的指導周期
4.3.3 DMap-Best的指導周期
4.4 實驗結果對比
4.5 本章小結
結論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3677274
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3677274.html