天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 法律論文 > 司法論文 >

面向裁判文書的大數(shù)據(jù)質(zhì)量檢測(cè)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-06-16 13:26
【摘要】:在我國智慧法院的建設(shè)背景下,可由計(jì)算機(jī)存儲(chǔ)并處理的司法數(shù)據(jù)量快速增長,人們認(rèn)識(shí)到司法數(shù)據(jù)中蘊(yùn)含著巨大社會(huì)價(jià)值和業(yè)務(wù)價(jià)值。裁判文書作為審判執(zhí)行流程中的關(guān)鍵數(shù)據(jù),不僅整合了司法業(yè)務(wù)流程中的案件信息,更為司法案例檢索、類案推薦、罰金預(yù)測(cè)等新型司法業(yè)務(wù)提供了數(shù)據(jù)基礎(chǔ),其數(shù)據(jù)質(zhì)量決定應(yīng)用效果,只有數(shù)據(jù)質(zhì)量達(dá)標(biāo)才能充分發(fā)揮數(shù)據(jù)價(jià)值。法院裁判文書數(shù)據(jù)以xml格式存儲(chǔ),案情和審判信息用自然語言描述。可法院目前的文書數(shù)據(jù)質(zhì)量檢測(cè)方法僅校驗(yàn)內(nèi)容合規(guī)性,缺乏對(duì)文本上下文的語義分析,沒有從信息層面檢測(cè)數(shù)據(jù)質(zhì)量。鑒于此,本文提出了裁判文書質(zhì)量檢測(cè)體系,分為文書結(jié)構(gòu)化內(nèi)容質(zhì)量和文書非結(jié)構(gòu)化語義質(zhì)量。文書內(nèi)容質(zhì)量指標(biāo)結(jié)合客觀信息論和粗糙集的理論知識(shí),構(gòu)建了信息層面的九個(gè)維度及其度量指標(biāo),包括適配性、廣闊性、細(xì)致性、遍及性、延遲性、持續(xù)性、包容性、豐富性和真實(shí)性;文書語義質(zhì)量指標(biāo)采用自然語言處理方法,對(duì)案情描述進(jìn)行依存句法分析和語義角色標(biāo)注,構(gòu)建了八個(gè)文書語義特征,提出了語義貢獻(xiàn)度模型度量語義質(zhì)量。針對(duì)文書數(shù)據(jù)量龐大的問題,本文使用Hadoop大數(shù)據(jù)生態(tài)組件設(shè)計(jì)并實(shí)現(xiàn)了裁判文書質(zhì)量檢測(cè)的平臺(tái)。平臺(tái)具有數(shù)據(jù)交互、文書解析、質(zhì)量檢測(cè)和訪問權(quán)限管理四個(gè)模塊,可提供大數(shù)據(jù)環(huán)境下的文書分布式存儲(chǔ)和數(shù)據(jù)質(zhì)量檢測(cè)服務(wù)。本文提出的質(zhì)量檢測(cè)體系更全面地度量了裁判文書質(zhì)量,開發(fā)的大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)了文書數(shù)據(jù)量不斷增長下的質(zhì)量檢測(cè)服務(wù),已作為方案提交至最高人民法院信息化服務(wù)中心。
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP311.13;D926.1
【圖文】:

數(shù)據(jù)質(zhì)量,計(jì)算流程


^Usefulness邐可用性與用戶從使用信息中獲得的可用信息量有關(guān)。逡逑數(shù)據(jù)質(zhì)量計(jì)算的一般流程,如圖2.1所示。逡逑9邐__邐(—^,逡逑s邐/邋v邐邐V邐/邐V邐邐)逡逑發(fā)送通知邋邐逡逑圖2.1:數(shù)據(jù)質(zhì)量計(jì)算流程逡逑本文調(diào)研了眾多國際機(jī)構(gòu)和政府部門數(shù)據(jù)質(zhì)量維度,為后續(xù)司法數(shù)據(jù)質(zhì)量逡逑指標(biāo)的構(gòu)建提供參考[22],如表2.2所示。逡逑同時(shí),本文對(duì)司法數(shù)據(jù)中可能涉及到的維度進(jìn)行了調(diào)研,發(fā)現(xiàn)在實(shí)踐中每逡逑個(gè)維度的內(nèi)涵都非常豐富。逡逑表2.3以完備性為例,指出數(shù)據(jù)完備性的內(nèi)涵。逡逑以上的數(shù)據(jù)質(zhì)量指標(biāo)在很多場(chǎng)景下用來度量結(jié)構(gòu)化的數(shù)據(jù)質(zhì)量,對(duì)于非結(jié)逡逑構(gòu)化和半結(jié)構(gòu)化的文本數(shù)據(jù)質(zhì)量,往往使用可讀性進(jìn)行描述?勺x性對(duì)于文本逡逑8逡逑

及時(shí)率,綜合評(píng)價(jià)體系,數(shù)據(jù)質(zhì)量,計(jì)算公式


圖2.2:最高院數(shù)據(jù)質(zhì)量綜合評(píng)價(jià)體系逡逑式2.3為及時(shí)率計(jì)算公式。逡逑Pr(x,邋...邋jc?)邋=邐(A'邋"'Xn)邋x邋100%邐(2.3)逡逑A{x\邋...邋xn)逡逑式中,A為審判信息庫中滿足信息化數(shù)據(jù)錄入時(shí)間要求的案件數(shù),A為審逡逑判信息庫中的全部案件數(shù),為審理法院、案件類型等因變量。文書的逡逑T 間字段記錄了審判時(shí)間。逡逑以上內(nèi)容表明,我國法院的數(shù)據(jù)質(zhì)量檢測(cè)方法使用層次分析法,層層遞進(jìn)逡逑構(gòu)建數(shù)據(jù)質(zhì)量框架。計(jì)算時(shí)將非結(jié)構(gòu)化的裁判文書解析為半結(jié)構(gòu)化的xml格式,逡逑并檢查要素值的內(nèi)容是否符合要求,對(duì)字段進(jìn)行合規(guī)性檢查。逡逑這種檢測(cè)指標(biāo)無法從信息層面和文本固有的語義層面,對(duì)文本進(jìn)行質(zhì)量分逡逑析。為了構(gòu)建更加傘面的文書質(zhì)量檢測(cè)體系,本文采用自然語言處理技術(shù),挖逡逑掘文本的潛在語義特征,構(gòu)建語義質(zhì)量檢測(cè)模型,并使用信息論的知識(shí),從信逡逑

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉冰;龐琳;;國內(nèi)外大數(shù)據(jù)質(zhì)量研究述評(píng)[J];情報(bào)學(xué)報(bào);2019年02期

2 農(nóng)發(fā)行總行信息科技部課題組;邵世敏;楊建華;;提升數(shù)據(jù)質(zhì)量的方法和路徑[J];農(nóng)業(yè)發(fā)展與金融;2019年05期

3 李志華;;論基礎(chǔ)數(shù)據(jù)質(zhì)量在電網(wǎng)企業(yè)ERP實(shí)施的重要性[J];經(jīng)濟(jì)師;2017年12期

4 趙冰;李平;代明睿;;鐵路大數(shù)據(jù)質(zhì)量評(píng)估與優(yōu)化方法研究[J];中國鐵路;2018年02期

5 蔡莉;梁宇;朱揚(yáng)勇;何婧;;數(shù)據(jù)質(zhì)量的歷史沿革和發(fā)展趨勢(shì)[J];計(jì)算機(jī)科學(xué);2018年04期

6 暏成國;;高速公路交調(diào)數(shù)據(jù)質(zhì)量管理系統(tǒng)設(shè)計(jì)[J];中國交通信息化;2018年05期

7 戚斌;;大數(shù)據(jù)時(shí)代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J];信息記錄材料;2018年06期

8 徐志偉;;油田數(shù)據(jù)質(zhì)量監(jiān)督與控制模型研究[J];信息系統(tǒng)工程;2018年06期

9 張曉冉;袁滿;;通用數(shù)據(jù)質(zhì)量評(píng)估模型及本體實(shí)現(xiàn)[J];計(jì)算機(jī)研究與發(fā)展;2018年06期

10 中國殘聯(lián)"動(dòng)態(tài)更新第三方評(píng)估"課題組;陳功;江海霞;鄭翩翩;李佳懌;胡喬文;耿q

本文編號(hào):2716106


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/falvlunwen/gongjianfalunwen/2716106.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶40786***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com