面向食品安全裁判文書的命名實(shí)體識別方法研究
發(fā)布時間:2021-11-11 13:07
針對食品安全領(lǐng)域案件高發(fā)的突出問題,采用條件隨機(jī)場模型對食品安全裁判文書的命名實(shí)體進(jìn)行識別;贖anLP平臺和引入自定義詞典,識別裁判文書中的人名、地名、機(jī)構(gòu)名、食品、毒害物、危害后果等命名實(shí)體,取得了較好的識別效果。實(shí)驗(yàn)結(jié)果表明,基于條件隨機(jī)場模型的命名實(shí)體識別方法是有效的,有助于自動識別食品安全裁判文書中的相關(guān)實(shí)體,構(gòu)建食品安全知識圖譜。
【文章來源】:計算機(jī)時代. 2020,(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
命名實(shí)體識別流程
條件隨機(jī)場定義:設(shè)X、Y為隨機(jī)變量,P(Y|X)表示指定X條件下Y的條件概率分布,如果隨機(jī)變量Y構(gòu)成一個由無向圖G=(V,E)表示的馬爾可夫隨機(jī)場[10],即:P (Ya|X,Yb,a≠b)=P(Ya|X,Yb,a~b),對任意結(jié)點(diǎn)v成立,則稱條件概率分布P(Y|X)為條件隨機(jī)場。式中a~b表示在圖G=(V,E)中與結(jié)點(diǎn)a有邊連接的所有結(jié)點(diǎn)b,a≠b表示結(jié)點(diǎn)a以外的所有結(jié)點(diǎn),Ya,Yb表示結(jié)點(diǎn)a,b對應(yīng)的隨機(jī)變量。在命名實(shí)體識別問題中,線性鏈CRF較為常見,其結(jié)構(gòu)如圖2所示。線性鏈CRF定義:設(shè)X=(X1,X2,…,Xn),Y=(Y1,Y2,…,Yn)均為線性鏈表示的隨機(jī)變量序列,在隨機(jī)變量序列X給定的情況下,隨機(jī)變量序列Y的條件概率分布P(Y|X)構(gòu)成條件隨機(jī)場[10],即:
【參考文獻(xiàn)】:
期刊論文
[1]海量食品安全事件下的命名實(shí)體識別研究[J]. 徐飛,宋英華. 科研管理. 2018(07)
[2]基于條件隨機(jī)場的農(nóng)業(yè)命名實(shí)體識別[J]. 張劍,吳青,羊昕旖,王彬聰,吳宣為,徐向英,呂強(qiáng). 計算機(jī)與現(xiàn)代化. 2018(01)
[3]中文電子病歷命名實(shí)體和實(shí)體關(guān)系語料庫構(gòu)建[J]. 楊錦鋒,關(guān)毅,何彬,曲春燕,于秋濱,劉雅欣,趙永杰. 軟件學(xué)報. 2016(11)
[4]條件隨機(jī)場模型在中文人名識別中的研究與實(shí)現(xiàn)[J]. 唐釗. 現(xiàn)代計算機(jī)(專業(yè)版). 2012(21)
[5]電子病歷中命名實(shí)體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
[6]CRF與規(guī)則相結(jié)合的地理空間命名實(shí)體識別[J]. 鞠久朋,張偉偉,寧建軍,周國棟. 計算機(jī)工程. 2011(07)
[7]基于層疊條件隨機(jī)場的旅游領(lǐng)域命名實(shí)體識別[J]. 郭劍毅,薛征山,余正濤,張志坤,張宜浩,姚賢明. 中文信息學(xué)報. 2009(05)
[8]基于層疊隱馬爾可夫模型的中文命名實(shí)體識別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才. 通信學(xué)報. 2006(02)
[9]基于角色標(biāo)注的中國人名自動識別研究[J]. 張華平,劉群. 計算機(jī)學(xué)報. 2004(01)
本文編號:3488911
【文章來源】:計算機(jī)時代. 2020,(10)
【文章頁數(shù)】:4 頁
【部分圖文】:
命名實(shí)體識別流程
條件隨機(jī)場定義:設(shè)X、Y為隨機(jī)變量,P(Y|X)表示指定X條件下Y的條件概率分布,如果隨機(jī)變量Y構(gòu)成一個由無向圖G=(V,E)表示的馬爾可夫隨機(jī)場[10],即:P (Ya|X,Yb,a≠b)=P(Ya|X,Yb,a~b),對任意結(jié)點(diǎn)v成立,則稱條件概率分布P(Y|X)為條件隨機(jī)場。式中a~b表示在圖G=(V,E)中與結(jié)點(diǎn)a有邊連接的所有結(jié)點(diǎn)b,a≠b表示結(jié)點(diǎn)a以外的所有結(jié)點(diǎn),Ya,Yb表示結(jié)點(diǎn)a,b對應(yīng)的隨機(jī)變量。在命名實(shí)體識別問題中,線性鏈CRF較為常見,其結(jié)構(gòu)如圖2所示。線性鏈CRF定義:設(shè)X=(X1,X2,…,Xn),Y=(Y1,Y2,…,Yn)均為線性鏈表示的隨機(jī)變量序列,在隨機(jī)變量序列X給定的情況下,隨機(jī)變量序列Y的條件概率分布P(Y|X)構(gòu)成條件隨機(jī)場[10],即:
【參考文獻(xiàn)】:
期刊論文
[1]海量食品安全事件下的命名實(shí)體識別研究[J]. 徐飛,宋英華. 科研管理. 2018(07)
[2]基于條件隨機(jī)場的農(nóng)業(yè)命名實(shí)體識別[J]. 張劍,吳青,羊昕旖,王彬聰,吳宣為,徐向英,呂強(qiáng). 計算機(jī)與現(xiàn)代化. 2018(01)
[3]中文電子病歷命名實(shí)體和實(shí)體關(guān)系語料庫構(gòu)建[J]. 楊錦鋒,關(guān)毅,何彬,曲春燕,于秋濱,劉雅欣,趙永杰. 軟件學(xué)報. 2016(11)
[4]條件隨機(jī)場模型在中文人名識別中的研究與實(shí)現(xiàn)[J]. 唐釗. 現(xiàn)代計算機(jī)(專業(yè)版). 2012(21)
[5]電子病歷中命名實(shí)體的智能識別[J]. 葉楓,陳鶯鶯,周根貴,李昊旻,李瑩. 中國生物醫(yī)學(xué)工程學(xué)報. 2011(02)
[6]CRF與規(guī)則相結(jié)合的地理空間命名實(shí)體識別[J]. 鞠久朋,張偉偉,寧建軍,周國棟. 計算機(jī)工程. 2011(07)
[7]基于層疊條件隨機(jī)場的旅游領(lǐng)域命名實(shí)體識別[J]. 郭劍毅,薛征山,余正濤,張志坤,張宜浩,姚賢明. 中文信息學(xué)報. 2009(05)
[8]基于層疊隱馬爾可夫模型的中文命名實(shí)體識別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才. 通信學(xué)報. 2006(02)
[9]基于角色標(biāo)注的中國人名自動識別研究[J]. 張華平,劉群. 計算機(jī)學(xué)報. 2004(01)
本文編號:3488911
本文鏈接:http://www.sikaile.net/falvlunwen/gongjianfalunwen/3488911.html
最近更新
教材專著