人機混合的知識圖譜主動搜索
發(fā)布時間:2021-01-20 02:07
在知識圖譜進行有效的搜索可以為智能問答、語義檢索等智能應(yīng)用提供有效支撐.然而,當用戶不能給出明確的查詢意圖時,一個搜索系統(tǒng)要如何精準捕獲用戶的興趣并找到對應(yīng)的查詢目標是項難題.人機混合的主動搜索為緩解用戶和機器之間的理解鴻溝提供了橋梁.人機混合的主動搜索核心在于讓機器主動地向用戶提出相關(guān)的問題,從用戶的反饋中獲取信息,再基于這些信息對檢索候選項進行搜索,形成人機混合的回路,最終精準定位用戶意圖并返回查詢結(jié)果.在知識圖譜表示學習技術(shù)的基礎(chǔ)上,將知識圖譜的搜索任務(wù)建模成向量空間中人機混合的主動搜索任務(wù).具體來說,首先將知識圖譜和用戶的興趣偏好嵌入到同一低維向量空間.然后,機器主動向用戶提問,通過讓用戶對具體實體進行打分的方式獲取相應(yīng)的反饋信息,進而更新用戶偏好在向量空間中的定位.設(shè)計了一種評價方式,基于偏好點與其他實體之間的歐氏距離來度量用戶對某個實體的興趣,最終在人機多輪交互后找到對應(yīng)的目標實體返回給用戶.在實驗部分,對知識圖譜的嵌入過程和主動搜索的過程分別進行了實驗,實驗結(jié)果顯示,所提出的方法具有一定的效果.
【文章來源】:計算機研究與發(fā)展. 2020,57(12)北大核心
【文章頁數(shù)】:13 頁
【部分圖文】:
人機混合的知識圖譜主動搜索實例
在現(xiàn)實情況(即測試環(huán)境)下,模型在定位用戶偏好嵌入之前,只能向用戶提出有限次問題,否則由于用戶解答某個問題所需要的時間以秒為單位,該提問的過程會耗費用戶過多的時間.但在訓練的過程中并沒有時間的限制,因此我們設(shè)計了一種模擬評分模式,該模式在訓練時能夠基于用戶的目標實體嵌入、起點實體嵌入以及問題實體嵌入三者之間的距離關(guān)系來模擬用戶給出的分數(shù).以圖1為例,在訓練時對每一個鄰居進行考量,鄰居如“海倫娜·卡特”和“學院獎”離目標較遙遠,而鄰居如“約翰尼·德普”“《剪刀手愛德華》”則離目標較近或者就是目標本身.對于前者,用戶應(yīng)當不感興趣;對于后者,用戶應(yīng)當感興趣.而即便對2個實體都感興趣,其興趣程度也不盡相同,如,當用戶的目標恰為“《剪刀手愛德華》”時,對實體“約翰尼·德普”的興趣程度顯然會低于這部電影.因此在設(shè)計的評分模式中,我們假設(shè)用戶對某實體的興趣程度隨著該實體與目標實體距離的減小而提高,如圖3所示,黑色點表示起點實體,綠色點表示目標實體.以目標實體為中心,目標實體與起點實體之間的距離的0.5,1,2倍為半徑,將空間劃分為4個不同的區(qū)域,處于這四個區(qū)域的其他實體分別對應(yīng)該區(qū)域的分數(shù)(-2,-1,1,2).基于該評分模式,我們設(shè)置了一種訓練機制,在該機制的作用下,訓練過程中,每一個鄰居實體都會被考慮到,訓練過程也會更為充分.詳細的說明與相關(guān)數(shù)學式為:
主動搜素實驗結(jié)果展示
【參考文獻】:
期刊論文
[1]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:2988148
【文章來源】:計算機研究與發(fā)展. 2020,57(12)北大核心
【文章頁數(shù)】:13 頁
【部分圖文】:
人機混合的知識圖譜主動搜索實例
在現(xiàn)實情況(即測試環(huán)境)下,模型在定位用戶偏好嵌入之前,只能向用戶提出有限次問題,否則由于用戶解答某個問題所需要的時間以秒為單位,該提問的過程會耗費用戶過多的時間.但在訓練的過程中并沒有時間的限制,因此我們設(shè)計了一種模擬評分模式,該模式在訓練時能夠基于用戶的目標實體嵌入、起點實體嵌入以及問題實體嵌入三者之間的距離關(guān)系來模擬用戶給出的分數(shù).以圖1為例,在訓練時對每一個鄰居進行考量,鄰居如“海倫娜·卡特”和“學院獎”離目標較遙遠,而鄰居如“約翰尼·德普”“《剪刀手愛德華》”則離目標較近或者就是目標本身.對于前者,用戶應(yīng)當不感興趣;對于后者,用戶應(yīng)當感興趣.而即便對2個實體都感興趣,其興趣程度也不盡相同,如,當用戶的目標恰為“《剪刀手愛德華》”時,對實體“約翰尼·德普”的興趣程度顯然會低于這部電影.因此在設(shè)計的評分模式中,我們假設(shè)用戶對某實體的興趣程度隨著該實體與目標實體距離的減小而提高,如圖3所示,黑色點表示起點實體,綠色點表示目標實體.以目標實體為中心,目標實體與起點實體之間的距離的0.5,1,2倍為半徑,將空間劃分為4個不同的區(qū)域,處于這四個區(qū)域的其他實體分別對應(yīng)該區(qū)域的分數(shù)(-2,-1,1,2).基于該評分模式,我們設(shè)置了一種訓練機制,在該機制的作用下,訓練過程中,每一個鄰居實體都會被考慮到,訓練過程也會更為充分.詳細的說明與相關(guān)數(shù)學式為:
主動搜素實驗結(jié)果展示
【參考文獻】:
期刊論文
[1]知識圖譜構(gòu)建技術(shù)綜述[J]. 劉嶠,李楊,段宏,劉瑤,秦志光. 計算機研究與發(fā)展. 2016(03)
[2]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
本文編號:2988148
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2988148.html
最近更新
教材專著