天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 法律論文 > 治安法論文 >

基于深度學(xué)習(xí)的檢察辦案輔助量刑規(guī)則挖掘

發(fā)布時(shí)間:2020-05-12 08:10
【摘要】:輔助量刑規(guī)則挖掘是“智慧法院”的核心內(nèi)容之一,也是法學(xué)與人工智能相結(jié)合的研究熱點(diǎn)。輔助量刑可以為法官和檢察官的日常工作提供參考,有助于維護(hù)我國(guó)法律體系的公平和正確性。目前,在我國(guó)多個(gè)建設(shè)“智慧法院”的地方法院的法務(wù)系統(tǒng)中都配有量刑預(yù)測(cè)的模塊。本文針對(duì)法律文書的命名實(shí)體識(shí)別準(zhǔn)確率不高、知識(shí)圖譜的構(gòu)建自動(dòng)性差等問題進(jìn)行了深入的研究。分別對(duì)法律文書的命名實(shí)體識(shí)別、實(shí)體關(guān)系抽取、量刑規(guī)則挖掘等方面展開論述,結(jié)合領(lǐng)域知識(shí)建立LSTM-CRF模型用于法律文書的命名實(shí)體識(shí)別、基于Graph-LSTM模型與注意力機(jī)制(attention)相結(jié)合的命名實(shí)體關(guān)系抽取模型,最后結(jié)合文本特征構(gòu)建基于Graph-LSTM模型的量刑規(guī)則挖掘模型,實(shí)驗(yàn)驗(yàn)證模型準(zhǔn)確率較高,滿足司法領(lǐng)域的要求。首先,通過在基于長(zhǎng)短時(shí)記憶模型(Long Short-Term Memory,LSTM)的命名實(shí)體識(shí)別模型中引入條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)模型,避免了 LSTM不能捕捉詞語標(biāo)簽間約束的問題,特別結(jié)合法律文書的文本特征,構(gòu)造實(shí)體識(shí)別模型,對(duì)比分析不同命名實(shí)體的識(shí)別準(zhǔn)確率以及不同機(jī)器學(xué)習(xí)模型的性能指標(biāo)。第二,建立基于Graph-LSTM模型與attention機(jī)制相結(jié)合的法律文書命名實(shí)體關(guān)系抽取模型。通過分析法律文書的句法依存關(guān)系,得到實(shí)體間的語義語法特征,根據(jù)句法依存結(jié)構(gòu)圖構(gòu)造Graph-LSTM模型。通過遠(yuǎn)程監(jiān)督的方法得到弱標(biāo)簽數(shù)據(jù)集,并引入attention機(jī)制在模型的最后消除噪聲。通過與其他機(jī)器學(xué)習(xí)模型的對(duì)比實(shí)驗(yàn),分析模型性能。最后,設(shè)計(jì)輔助量刑規(guī)則挖掘模型;贕raph-LSTM模型對(duì)法律文書建模,挖掘案件要素特征(X)到刑期(Y)的具有高置信度的關(guān)聯(lián)規(guī)則。在命名實(shí)體識(shí)別工作的基礎(chǔ)上,提取出結(jié)構(gòu)化的情節(jié)信息作為模型輸入,以刑期作為分類結(jié)果,訓(xùn)練Graph-LSTM模型。實(shí)驗(yàn)分析模型的準(zhǔn)確率和五折交叉驗(yàn)證的準(zhǔn)確率隨著迭代次數(shù)的變化,并與其他機(jī)器學(xué)習(xí)進(jìn)行實(shí)驗(yàn)對(duì)比,證明了模型的較高準(zhǔn)確率。
【圖文】:

模型圖,鏈結(jié)構(gòu),模型圖,序列


邐的全局隨機(jī)域。逡逑對(duì)標(biāo)注序列作出馬爾可夫獨(dú)立性假設(shè),無向圖G邋=邋0/,E)的結(jié)構(gòu)是任意的,逡逑一般在序列標(biāo)注問題中,無向圖G中的標(biāo)注序列如圖2-2所示。逡逑CRF相當(dāng)于由規(guī)格化轉(zhuǎn)換概率組成的有限狀態(tài)機(jī),在觀察序列上可以存在逡逑任意依賴。CRF和HMM都是基于相同的指數(shù)形式,因此CRF可以有效的完成逡逑基于非貪婪算法的有限狀態(tài)的推導(dǎo)及訓(xùn)練。CRF模型的訓(xùn)練不需要大量訓(xùn)練數(shù)逡逑據(jù),并且CRF函數(shù)的損失函數(shù)是凸面性的,不會(huì)陷入局部最優(yōu)。逡逑12逡逑

模型結(jié)構(gòu)


華北電力大學(xué)碩士學(xué)位論文逡逑酒后駕駛機(jī)動(dòng)車”。這些實(shí)體間的關(guān)系是人名實(shí)體“駕駛”機(jī)動(dòng)車實(shí)體,抽取出的逡逑實(shí)體可以后續(xù)用于構(gòu)建知識(shí)圖譜,如圖3-1所示。逡逑O邐駕駛邐是否飲酒逡逑^^^^逡逑現(xiàn)代牌轎車邐n邐是逡逑查逡逑獲逡逑地逡逑點(diǎn)逡逑O邋清豐縣城文化路逡逑圖3-1邋LSTM模型結(jié)構(gòu)圖逡逑然而,對(duì)于有著復(fù)雜語義關(guān)系的文本,多元關(guān)系的抽取需要利用更加豐富逡逑的上下文信息。Graph-LSTM包括了邋Liner-chain邋LSTM和Tree-LSTM的結(jié)構(gòu)特逡逑點(diǎn),在應(yīng)對(duì)多元關(guān)系抽取帶來的稀疏性問題具有更好的效果,能產(chǎn)生豐富的語逡逑義信息。單向LSTM拓?fù)浣Y(jié)構(gòu)是固定的,但是句子間的多元關(guān)系抽取,命名實(shí)逡逑體間有著較固定的句法結(jié)構(gòu),對(duì)于句子中的每個(gè)實(shí)體的先驗(yàn)概率不一定是固定逡逑的,如果按照固定的結(jié)構(gòu),需要每個(gè)詞語都要按部就班費(fèi)時(shí)費(fèi)力,可以按照一逡逑定的拓?fù)浣Y(jié)構(gòu)構(gòu)造Graph-LSTM模型來提高抽取性能。逡逑3.3基于神經(jīng)網(wǎng)絡(luò)的法律文書關(guān)系抽取逡逑3.3.1句法依存圖逡逑基于單句的二元關(guān)系抽取方法容易丟失語義信息,比如法律文書中:“被告逡逑人王志明駕駛‘現(xiàn)代牌’轎車在清豐縣城文化路,因涉嫌飲酒后駕駛被民警查逡逑獲。”
【學(xué)位授予單位】:華北電力大學(xué)(北京)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:D918.2;TP391.1;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊杭州;劉凱;顏志軍;李軍蓮;孫海霞;;中文在線健康社區(qū)中的醫(yī)療命名實(shí)體識(shí)別方法研究[J];信息系統(tǒng)學(xué)報(bào);2017年02期

2 劉瀏;王東波;;命名實(shí)體識(shí)別研究綜述[J];情報(bào)學(xué)報(bào);2018年03期

3 朱顥東;楊立志;丁溫雪;馮嘉美;;面向中文微博命名實(shí)體識(shí)別的對(duì)比研究[J];湖北民族學(xué)院學(xué)報(bào)(自然科學(xué)版);2017年01期

4 包敏娜;斯·勞格勞;;基于詞典匹配的蒙古文命名實(shí)體識(shí)別研究[J];中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2017年03期

5 羅芳;熊前興;肖敏;;基于本體的產(chǎn)品命名實(shí)體識(shí)別研究[J];武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版);2011年06期

6 金明;楊歡歡;單廣榮;;藏語命名實(shí)體識(shí)別研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期

7 彭春艷;張暉;包玲玉;陳昌平;;基于條件隨機(jī)域的生物命名實(shí)體識(shí)別[J];計(jì)算機(jī)工程;2009年22期

8 曲曉棠;沈曉紅;;基于最大熵模型的中文命名實(shí)體識(shí)別研究[J];科技信息(學(xué)術(shù)研究);2008年30期

9 向曉雯,史曉東,曾華琳;一個(gè)統(tǒng)計(jì)與規(guī)則相結(jié)合的中文命名實(shí)體識(shí)別系統(tǒng)[J];計(jì)算機(jī)應(yīng)用;2005年10期

10 張曉艷;王挺;陳火旺;;命名實(shí)體識(shí)別研究[J];計(jì)算機(jī)科學(xué);2005年04期

相關(guān)會(huì)議論文 前10條

1 向曉雯;史曉東;曾華琳;;一個(gè)統(tǒng)計(jì)與規(guī)則相結(jié)合的中文命名實(shí)體識(shí)別系統(tǒng)[A];第六屆漢語詞匯語義學(xué)研討會(huì)論文集[C];2005年

2 李治國(guó);周俏麗;;在篇章中面向產(chǎn)品類的命名實(shí)體識(shí)別研究[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

3 付瑞吉;車萬翔;劉挺;;一種基于分類方法的音樂命名實(shí)體識(shí)別技術(shù)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2009年學(xué)術(shù)交流年會(huì)論文集[C];2010年

4 馮元勇;孫樂;張大鯤;李文波;;基于單字提示特征的中文命名實(shí)體識(shí)別快速算法[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

5 劉非凡;趙軍;呂碧波;于浩;夏迎炬;;面向商務(wù)信息抽取的產(chǎn)品命名實(shí)體識(shí)別研究[A];全國(guó)第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會(huì)議(JSCL-2005)論文集[C];2005年

6 陳禹;史曉東;向曉雯;張潤(rùn)延;;基于混合方法的中文命名實(shí)體識(shí)別[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年

7 龐薇;徐波;;基于雙語平行語料的分層次命名實(shí)體抽取[A];第四屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集[C];2008年

8 史樹敏;王志強(qiáng);周浪;馮沖;黃河燕;;基于條件隨機(jī)域的中文命名實(shí)體識(shí)別[A];第三屆學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2006年

9 廖先桃;于海濱;秦兵;劉挺;;HMM與自動(dòng)規(guī)則提取相結(jié)合的中文命名實(shí)體識(shí)別[A];第二屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2004年

10 朱佳暉;張文峰;劉衛(wèi)平;張超;陳淵;;基于雙向LSTM和CRF的軍事命名實(shí)體識(shí)別和鏈接[A];第六屆中國(guó)指揮控制大會(huì)論文集(上冊(cè))[C];2018年

相關(guān)博士學(xué)位論文 前10條

1 徐凱;面向醫(yī)學(xué)命名實(shí)體識(shí)別的深度學(xué)習(xí)方法研究[D];廣東工業(yè)大學(xué);2019年

2 朱鎖玲;命名實(shí)體識(shí)別在方志內(nèi)容挖掘中的應(yīng)用研究[D];南京農(nóng)業(yè)大學(xué);2011年

3 付瑞吉;開放域命名實(shí)體識(shí)別及其層次化類別獲取[D];哈爾濱工業(yè)大學(xué);2014年

4 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年

5 豆增發(fā);生物命名實(shí)體識(shí)別及生物文本分類[D];西安電子科技大學(xué);2013年

6 李彥鵬;特征耦合泛化及其在文體挖掘中的應(yīng)用[D];大連理工大學(xué);2011年

7 何濤;互聯(lián)網(wǎng)廣告投遞中的商品名稱識(shí)別[D];武漢大學(xué);2014年

8 盧延鑫;基于自然語言處理技術(shù)的循證醫(yī)學(xué)信息提取研究[D];復(fù)旦大學(xué);2011年

9 錢偉中;基于判別式模型的蛋白質(zhì)互作用文本挖掘技術(shù)研究[D];電子科技大學(xué);2011年

10 袁鋒;中醫(yī)醫(yī)案文本挖掘的若干關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 張琳t;面向微博文本的命名實(shí)體識(shí)別方法研究[D];北京交通大學(xué);2019年

2 邢新國(guó);基于機(jī)器學(xué)習(xí)與鏈路預(yù)測(cè)的醫(yī)療問答檢測(cè)與推薦系統(tǒng)[D];電子科技大學(xué);2019年

3 張笑天;基于Lattice LSTM的醫(yī)學(xué)文本中文命名實(shí)體識(shí)別研究與實(shí)現(xiàn)[D];電子科技大學(xué);2019年

4 鄒愛玲;基于法律的知識(shí)圖譜構(gòu)建[D];電子科技大學(xué);2019年

5 馬孟鋮;基于詞向量和條件隨機(jī)場(chǎng)的中文命名實(shí)體識(shí)別及分類[D];新疆大學(xué);2019年

6 高翔;面向領(lǐng)域的實(shí)體識(shí)別與關(guān)系抽取設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2019年

7 夏志超;基于神經(jīng)網(wǎng)絡(luò)的命名實(shí)體識(shí)別研究[D];桂林電子科技大學(xué);2019年

8 張春燕;基于概率依賴關(guān)系的命名實(shí)體識(shí)別方法研究[D];北京交通大學(xué);2019年

9 彭鵬;Web文本中癥狀命名實(shí)體識(shí)別系統(tǒng)[D];河南大學(xué);2019年

10 郭月江;利用跨語言特征的柬埔寨語命名實(shí)體識(shí)別研究[D];昆明理工大學(xué);2018年

,

本文編號(hào):2659918

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/falvlunwen/fanzuizhian/2659918.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b0075***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com