基于概率推斷的質(zhì)量控制智能體
發(fā)布時間:2021-02-01 15:18
實體解析(Entity Resolution,ER)是數(shù)據(jù)集成和清洗領(lǐng)域的基礎(chǔ)問題,而不一致性消歧(Inconsistency Reconciliation,IR)通過對現(xiàn)存的不同ER算法產(chǎn)生的不一致記錄對進(jìn)行消歧,進(jìn)一步提升解析效果。但是現(xiàn)有的IR方法有一個局限,即消歧結(jié)果沒有質(zhì)量保障。對此,首次提出了一個基于概率推斷的質(zhì)量控制智能體,記為QCAgent。該智能體不需要訓(xùn)練數(shù)據(jù)集,能夠在滿足給定查準(zhǔn)率的約束條件下輸出查全率最大的消歧結(jié)果。它的核心思想是:首先,使用異常點檢測模型來估算不一致記錄對匹配的概率,并依據(jù)這些概率估算查準(zhǔn)率和查全率,再將計算出的查準(zhǔn)率和查全率作為環(huán)境端的反饋;其次,使用二分搜索算法,選擇滿足查準(zhǔn)率要求且查全率最大的翻轉(zhuǎn)方案,作為QCAgent的下一次行動;然后,用更新后的一致結(jié)果訓(xùn)練異常點模型,并估算查準(zhǔn)率和查全率。按此循環(huán),當(dāng)新估計的查準(zhǔn)率滿足約束條件時,該迭代過程停止。在真實的數(shù)據(jù)集上,實驗結(jié)果表明:QCAgent能夠有效解決消歧結(jié)果的質(zhì)量控制問題。
【文章來源】:計算機(jī)科學(xué). 2019,46(04)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
1 引言
2 相關(guān)工作
3 問題描述
4 基于概率推斷的質(zhì)量控制智能體
4.1 系統(tǒng)框架
4.2 基于概率推斷的質(zhì)量估計
4.3 基于二分搜索的翻轉(zhuǎn)策略選擇
5 實驗驗證
5.1 有效性
5.2 可擴(kuò)展性
結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]深度強(qiáng)化學(xué)習(xí)研究綜述[J]. 趙星宇,丁世飛. 計算機(jī)科學(xué). 2018(07)
[2]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進(jìn). 計算機(jī)學(xué)報. 2018(01)
[3]一種基于離群點檢測的自動實體匹配方法[J]. 樊峰峰,李戰(zhàn)懷,陳群,劉海龍. 計算機(jī)學(xué)報. 2017(10)
本文編號:3012981
【文章來源】:計算機(jī)科學(xué). 2019,46(04)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
1 引言
2 相關(guān)工作
3 問題描述
4 基于概率推斷的質(zhì)量控制智能體
4.1 系統(tǒng)框架
4.2 基于概率推斷的質(zhì)量估計
4.3 基于二分搜索的翻轉(zhuǎn)策略選擇
5 實驗驗證
5.1 有效性
5.2 可擴(kuò)展性
結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]深度強(qiáng)化學(xué)習(xí)研究綜述[J]. 趙星宇,丁世飛. 計算機(jī)科學(xué). 2018(07)
[2]深度強(qiáng)化學(xué)習(xí)綜述[J]. 劉全,翟建偉,章宗長,鐘珊,周倩,章鵬,徐進(jìn). 計算機(jī)學(xué)報. 2018(01)
[3]一種基于離群點檢測的自動實體匹配方法[J]. 樊峰峰,李戰(zhàn)懷,陳群,劉海龍. 計算機(jī)學(xué)報. 2017(10)
本文編號:3012981
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3012981.html
最近更新
教材專著