基于道路法規(guī)知識圖譜的多輪自動問答研究
發(fā)布時(shí)間:2020-12-23 04:32
[目的/意義]傳統(tǒng)的基于知識圖譜的自動問答研究主要是針對用戶提問直接檢索答案,但由于系統(tǒng)對用戶問題的理解存在歧義,導(dǎo)致得到的答案不夠精確。采用基于知識圖譜的多輪自動問答可以有效地改善這一問題。[方法/過程]本文首先構(gòu)建了以事件為中心的道路法規(guī)本體模型,依據(jù)該模型從道路法規(guī)中抽取實(shí)例圖譜,并設(shè)計(jì)出基于道路法規(guī)知識圖譜的問答框架。然后,對該框架所使用到的模型進(jìn)行測評。最后,進(jìn)行系統(tǒng)的總體測評。[結(jié)果/結(jié)論]從模塊測評結(jié)果來看,本文所提出BCNN_BiLSM模型在事件識別和意圖識別的F1值分別是0.798和0.930,BBi LSTM_CRF模型在本體屬性識別F1值為0.807,總體性能優(yōu)于其他模型。系統(tǒng)的總體測評結(jié)果表明,完整句的準(zhǔn)確率為0.74,缺省句的任務(wù)完成率為0.83。本文提出的基于道路法規(guī)知識圖譜的多輪自動問答可為相關(guān)領(lǐng)域自動問答研究提供參考。
【文章來源】:現(xiàn)代情報(bào). 2020年08期 CSSCI
【文章頁數(shù)】:14 頁
【部分圖文】:
道路法規(guī)本體
根據(jù)上述構(gòu)建的道路法規(guī)本體,本文以《中華人民共和國道路交通安全法》為例,選取第九十一條規(guī)定的部分內(nèi)容進(jìn)行語義描述,該內(nèi)容片段為“飲酒后駕駛機(jī)動車的,處暫扣六個(gè)月機(jī)動車駕駛證,并處一千元以上二千元以下罰款。因飲酒后駕駛機(jī)動車被處罰,再次飲酒后駕駛機(jī)動車的,處十日以下拘留,并處一千元以上二千元以下罰款,吊銷機(jī)動車駕駛證。”[23]。該規(guī)定主要涉及2個(gè)“酒駕”事件,事件涉及的物體主要有“駕駛證”,酒駕事件導(dǎo)致的行政處罰結(jié)果有“暫扣機(jī)動車駕駛證”“吊銷機(jī)動車駕駛證”“拘留”和“罰款”,其中暫扣機(jī)動車駕駛證時(shí)間為6個(gè)月,拘留天數(shù)為10天以下,罰款數(shù)額均為1 000元以上2 000元以下。該法規(guī)的語義描述結(jié)果如圖2所示;谏鲜鲈O(shè)計(jì)的本體,以HTML格式的道路交通法規(guī)相關(guān)文本作為數(shù)據(jù)源,構(gòu)建道路法規(guī)知識圖譜。本研究將知識提取的任務(wù)劃分為實(shí)體提取、關(guān)系提取、屬性和屬性值提取,并將抽取到的知識用三元組的形式表示:1)實(shí)體—關(guān)系—實(shí)體(Ehead,R,Etail),R是實(shí)體Ehead和實(shí)體Etail之間的關(guān)系,如:駕駛?cè)恕{駛—機(jī)動車;2)實(shí)體—屬性—屬性值(Entity-Attribute-Value),屬性是描述實(shí)體的數(shù)據(jù),如“機(jī)動車—定義—以動力裝置驅(qū)動或者牽引,上道路行駛的供人員乘用或者用于運(yùn)送物品以及進(jìn)行工程專項(xiàng)作業(yè)的輪式車輛”,屬性值有數(shù)據(jù)類型的約束,常用的數(shù)據(jù)類型有:文本型、數(shù)字型、邏輯型、枚舉型等。
道路法規(guī)知識圖譜實(shí)現(xiàn)了道路法規(guī)各類知識的關(guān)聯(lián)和整合,以專業(yè)化、結(jié)構(gòu)化的方式對知識進(jìn)行語義表示,是一種高效管理和利用知識的方式。在此基礎(chǔ)上,基于構(gòu)建的知識圖譜提出了一種面向知識庫的多輪自動問答方法。與常見的聊天機(jī)器人(如圖靈、微軟小冰)不同,聊天機(jī)器人主要是無特定目的的對話,本文所構(gòu)建的問答系統(tǒng)更偏向于目標(biāo)驅(qū)動的特定信息獲取,它是一種具有極強(qiáng)的針對性和準(zhǔn)確性的問答系統(tǒng)。問答系統(tǒng)的準(zhǔn)確性一方面取決于知識庫中所蘊(yùn)含的知識的深度和廣度;另一方面取決于系統(tǒng)對用戶自然語言理解提問的理解程度。因此,多輪問答通過系統(tǒng)向用戶進(jìn)行多次追問的方式填充用戶初始提問中缺失的語義信息,從而幫助系統(tǒng)更好地理解用戶的查詢意圖,提高問答系統(tǒng)的準(zhǔn)確率。本研究構(gòu)建的基于知識圖譜的多輪自動問答系統(tǒng)框架如圖3所示,該系統(tǒng)框架主要包含3個(gè)部分:問題理解(Question Understanding,QU)、知識圖譜查詢(Knowledge Graph Matcher,KGM)和問答生成(Asking&Answering Generator,AAG)。問題理解模塊的功能是對用戶輸入的自然語言提問進(jìn)行分詞、詞性標(biāo)注等預(yù)處理,對其中涉及的交通事件、意圖、屬性和屬性值進(jìn)行識別,將用戶輸入的自然語言提問轉(zhuǎn)化成結(jié)構(gòu)化的語義表示。知識圖譜查詢模塊的功能是將問題的語義轉(zhuǎn)換成結(jié)構(gòu)化的查詢,從道路法規(guī)知識圖譜中查詢匹配的相關(guān)信息。查詢到的結(jié)果可能是直接的答案或缺失的信息,如果是答案則可以直接返回,如果是缺失的信息,問答系統(tǒng)會生成一個(gè)追問。3.1 問題理解
【參考文獻(xiàn)】:
碩士論文
[1]基于語義內(nèi)容的交通監(jiān)控視頻檢索研究[D]. 劉吉雙.重慶大學(xué) 2018
[2]面向自動問答的游客問題語義模型研究[D]. 陳文聰.電子科技大學(xué) 2018
[3]住房公積金領(lǐng)域自動問答系統(tǒng)關(guān)鍵技術(shù)研究[D]. 陶杰.哈爾濱工程大學(xué) 2018
[4]基于本體的中醫(yī)冠心病自動問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 溫思琦.沈陽工業(yè)大學(xué) 2017
[5]基于領(lǐng)域本體的客服問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉曉強(qiáng).青島大學(xué) 2016
[6]基于中草藥語義網(wǎng)的自動問答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 錢宏澤.浙江大學(xué) 2016
[7]基于本體和描述邏輯的交通事件語義表現(xiàn)方法研究[D]. 于云.山東理工大學(xué) 2015
[8]基于領(lǐng)域本體中文自動問答系統(tǒng)相關(guān)技術(shù)的研究與實(shí)現(xiàn)[D]. 郭磊.華東理工大學(xué) 2013
本文編號:2933077
【文章來源】:現(xiàn)代情報(bào). 2020年08期 CSSCI
【文章頁數(shù)】:14 頁
【部分圖文】:
道路法規(guī)本體
根據(jù)上述構(gòu)建的道路法規(guī)本體,本文以《中華人民共和國道路交通安全法》為例,選取第九十一條規(guī)定的部分內(nèi)容進(jìn)行語義描述,該內(nèi)容片段為“飲酒后駕駛機(jī)動車的,處暫扣六個(gè)月機(jī)動車駕駛證,并處一千元以上二千元以下罰款。因飲酒后駕駛機(jī)動車被處罰,再次飲酒后駕駛機(jī)動車的,處十日以下拘留,并處一千元以上二千元以下罰款,吊銷機(jī)動車駕駛證。”[23]。該規(guī)定主要涉及2個(gè)“酒駕”事件,事件涉及的物體主要有“駕駛證”,酒駕事件導(dǎo)致的行政處罰結(jié)果有“暫扣機(jī)動車駕駛證”“吊銷機(jī)動車駕駛證”“拘留”和“罰款”,其中暫扣機(jī)動車駕駛證時(shí)間為6個(gè)月,拘留天數(shù)為10天以下,罰款數(shù)額均為1 000元以上2 000元以下。該法規(guī)的語義描述結(jié)果如圖2所示;谏鲜鲈O(shè)計(jì)的本體,以HTML格式的道路交通法規(guī)相關(guān)文本作為數(shù)據(jù)源,構(gòu)建道路法規(guī)知識圖譜。本研究將知識提取的任務(wù)劃分為實(shí)體提取、關(guān)系提取、屬性和屬性值提取,并將抽取到的知識用三元組的形式表示:1)實(shí)體—關(guān)系—實(shí)體(Ehead,R,Etail),R是實(shí)體Ehead和實(shí)體Etail之間的關(guān)系,如:駕駛?cè)恕{駛—機(jī)動車;2)實(shí)體—屬性—屬性值(Entity-Attribute-Value),屬性是描述實(shí)體的數(shù)據(jù),如“機(jī)動車—定義—以動力裝置驅(qū)動或者牽引,上道路行駛的供人員乘用或者用于運(yùn)送物品以及進(jìn)行工程專項(xiàng)作業(yè)的輪式車輛”,屬性值有數(shù)據(jù)類型的約束,常用的數(shù)據(jù)類型有:文本型、數(shù)字型、邏輯型、枚舉型等。
道路法規(guī)知識圖譜實(shí)現(xiàn)了道路法規(guī)各類知識的關(guān)聯(lián)和整合,以專業(yè)化、結(jié)構(gòu)化的方式對知識進(jìn)行語義表示,是一種高效管理和利用知識的方式。在此基礎(chǔ)上,基于構(gòu)建的知識圖譜提出了一種面向知識庫的多輪自動問答方法。與常見的聊天機(jī)器人(如圖靈、微軟小冰)不同,聊天機(jī)器人主要是無特定目的的對話,本文所構(gòu)建的問答系統(tǒng)更偏向于目標(biāo)驅(qū)動的特定信息獲取,它是一種具有極強(qiáng)的針對性和準(zhǔn)確性的問答系統(tǒng)。問答系統(tǒng)的準(zhǔn)確性一方面取決于知識庫中所蘊(yùn)含的知識的深度和廣度;另一方面取決于系統(tǒng)對用戶自然語言理解提問的理解程度。因此,多輪問答通過系統(tǒng)向用戶進(jìn)行多次追問的方式填充用戶初始提問中缺失的語義信息,從而幫助系統(tǒng)更好地理解用戶的查詢意圖,提高問答系統(tǒng)的準(zhǔn)確率。本研究構(gòu)建的基于知識圖譜的多輪自動問答系統(tǒng)框架如圖3所示,該系統(tǒng)框架主要包含3個(gè)部分:問題理解(Question Understanding,QU)、知識圖譜查詢(Knowledge Graph Matcher,KGM)和問答生成(Asking&Answering Generator,AAG)。問題理解模塊的功能是對用戶輸入的自然語言提問進(jìn)行分詞、詞性標(biāo)注等預(yù)處理,對其中涉及的交通事件、意圖、屬性和屬性值進(jìn)行識別,將用戶輸入的自然語言提問轉(zhuǎn)化成結(jié)構(gòu)化的語義表示。知識圖譜查詢模塊的功能是將問題的語義轉(zhuǎn)換成結(jié)構(gòu)化的查詢,從道路法規(guī)知識圖譜中查詢匹配的相關(guān)信息。查詢到的結(jié)果可能是直接的答案或缺失的信息,如果是答案則可以直接返回,如果是缺失的信息,問答系統(tǒng)會生成一個(gè)追問。3.1 問題理解
【參考文獻(xiàn)】:
碩士論文
[1]基于語義內(nèi)容的交通監(jiān)控視頻檢索研究[D]. 劉吉雙.重慶大學(xué) 2018
[2]面向自動問答的游客問題語義模型研究[D]. 陳文聰.電子科技大學(xué) 2018
[3]住房公積金領(lǐng)域自動問答系統(tǒng)關(guān)鍵技術(shù)研究[D]. 陶杰.哈爾濱工程大學(xué) 2018
[4]基于本體的中醫(yī)冠心病自動問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 溫思琦.沈陽工業(yè)大學(xué) 2017
[5]基于領(lǐng)域本體的客服問答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉曉強(qiáng).青島大學(xué) 2016
[6]基于中草藥語義網(wǎng)的自動問答系統(tǒng)的研究與實(shí)現(xiàn)[D]. 錢宏澤.浙江大學(xué) 2016
[7]基于本體和描述邏輯的交通事件語義表現(xiàn)方法研究[D]. 于云.山東理工大學(xué) 2015
[8]基于領(lǐng)域本體中文自動問答系統(tǒng)相關(guān)技術(shù)的研究與實(shí)現(xiàn)[D]. 郭磊.華東理工大學(xué) 2013
本文編號:2933077
本文鏈接:http://www.sikaile.net/kejilunwen/jiaotonggongchenglunwen/2933077.html
最近更新
教材專著