天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 法律論文 > 司法論文 >

面向裁判文書的大數(shù)據(jù)質(zhì)量檢測平臺的設計與實現(xiàn)

發(fā)布時間:2020-06-16 13:26
【摘要】:在我國智慧法院的建設背景下,可由計算機存儲并處理的司法數(shù)據(jù)量快速增長,人們認識到司法數(shù)據(jù)中蘊含著巨大社會價值和業(yè)務價值。裁判文書作為審判執(zhí)行流程中的關(guān)鍵數(shù)據(jù),不僅整合了司法業(yè)務流程中的案件信息,更為司法案例檢索、類案推薦、罰金預測等新型司法業(yè)務提供了數(shù)據(jù)基礎,其數(shù)據(jù)質(zhì)量決定應用效果,只有數(shù)據(jù)質(zhì)量達標才能充分發(fā)揮數(shù)據(jù)價值。法院裁判文書數(shù)據(jù)以xml格式存儲,案情和審判信息用自然語言描述�?煞ㄔ耗壳暗奈臅鴶�(shù)據(jù)質(zhì)量檢測方法僅校驗內(nèi)容合規(guī)性,缺乏對文本上下文的語義分析,沒有從信息層面檢測數(shù)據(jù)質(zhì)量。鑒于此,本文提出了裁判文書質(zhì)量檢測體系,分為文書結(jié)構(gòu)化內(nèi)容質(zhì)量和文書非結(jié)構(gòu)化語義質(zhì)量。文書內(nèi)容質(zhì)量指標結(jié)合客觀信息論和粗糙集的理論知識,構(gòu)建了信息層面的九個維度及其度量指標,包括適配性、廣闊性、細致性、遍及性、延遲性、持續(xù)性、包容性、豐富性和真實性;文書語義質(zhì)量指標采用自然語言處理方法,對案情描述進行依存句法分析和語義角色標注,構(gòu)建了八個文書語義特征,提出了語義貢獻度模型度量語義質(zhì)量。針對文書數(shù)據(jù)量龐大的問題,本文使用Hadoop大數(shù)據(jù)生態(tài)組件設計并實現(xiàn)了裁判文書質(zhì)量檢測的平臺。平臺具有數(shù)據(jù)交互、文書解析、質(zhì)量檢測和訪問權(quán)限管理四個模塊,可提供大數(shù)據(jù)環(huán)境下的文書分布式存儲和數(shù)據(jù)質(zhì)量檢測服務。本文提出的質(zhì)量檢測體系更全面地度量了裁判文書質(zhì)量,開發(fā)的大數(shù)據(jù)平臺實現(xiàn)了文書數(shù)據(jù)量不斷增長下的質(zhì)量檢測服務,已作為方案提交至最高人民法院信息化服務中心。
【學位授予單位】:南京大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP311.13;D926.1
【圖文】:

數(shù)據(jù)質(zhì)量,計算流程


^Usefulness邐可用性與用戶從使用信息中獲得的可用信息量有關(guān)。逡逑數(shù)據(jù)質(zhì)量計算的一般流程,如圖2.1所示。逡逑9邐__邐(—^,逡逑s邐/邋v邐邐V邐/邐V邐邐)逡逑發(fā)送通知邋邐逡逑圖2.1:數(shù)據(jù)質(zhì)量計算流程逡逑本文調(diào)研了眾多國際機構(gòu)和政府部門數(shù)據(jù)質(zhì)量維度,為后續(xù)司法數(shù)據(jù)質(zhì)量逡逑指標的構(gòu)建提供參考[22],如表2.2所示。逡逑同時,本文對司法數(shù)據(jù)中可能涉及到的維度進行了調(diào)研,發(fā)現(xiàn)在實踐中每逡逑個維度的內(nèi)涵都非常豐富。逡逑表2.3以完備性為例,指出數(shù)據(jù)完備性的內(nèi)涵。逡逑以上的數(shù)據(jù)質(zhì)量指標在很多場景下用來度量結(jié)構(gòu)化的數(shù)據(jù)質(zhì)量,對于非結(jié)逡逑構(gòu)化和半結(jié)構(gòu)化的文本數(shù)據(jù)質(zhì)量,往往使用可讀性進行描述�?勺x性對于文本逡逑8逡逑

及時率,綜合評價體系,數(shù)據(jù)質(zhì)量,計算公式


圖2.2:最高院數(shù)據(jù)質(zhì)量綜合評價體系逡逑式2.3為及時率計算公式。逡逑Pr(x,邋...邋jc?)邋=邐(A'邋"'Xn)邋x邋100%邐(2.3)逡逑A{x\邋...邋xn)逡逑式中,A為審判信息庫中滿足信息化數(shù)據(jù)錄入時間要求的案件數(shù),A為審逡逑判信息庫中的全部案件數(shù),為審理法院、案件類型等因變量。文書的逡逑T 間字段記錄了審判時間。逡逑以上內(nèi)容表明,我國法院的數(shù)據(jù)質(zhì)量檢測方法使用層次分析法,層層遞進逡逑構(gòu)建數(shù)據(jù)質(zhì)量框架。計算時將非結(jié)構(gòu)化的裁判文書解析為半結(jié)構(gòu)化的xml格式,逡逑并檢查要素值的內(nèi)容是否符合要求,對字段進行合規(guī)性檢查。逡逑這種檢測指標無法從信息層面和文本固有的語義層面,對文本進行質(zhì)量分逡逑析。為了構(gòu)建更加傘面的文書質(zhì)量檢測體系,本文采用自然語言處理技術(shù),挖逡逑掘文本的潛在語義特征,構(gòu)建語義質(zhì)量檢測模型,并使用信息論的知識,從信逡逑

【相似文獻】

相關(guān)期刊論文 前10條

1 劉冰;龐琳;;國內(nèi)外大數(shù)據(jù)質(zhì)量研究述評[J];情報學報;2019年02期

2 農(nóng)發(fā)行總行信息科技部課題組;邵世敏;楊建華;;提升數(shù)據(jù)質(zhì)量的方法和路徑[J];農(nóng)業(yè)發(fā)展與金融;2019年05期

3 李志華;;論基礎數(shù)據(jù)質(zhì)量在電網(wǎng)企業(yè)ERP實施的重要性[J];經(jīng)濟師;2017年12期

4 趙冰;李平;代明睿;;鐵路大數(shù)據(jù)質(zhì)量評估與優(yōu)化方法研究[J];中國鐵路;2018年02期

5 蔡莉;梁宇;朱揚勇;何婧;;數(shù)據(jù)質(zhì)量的歷史沿革和發(fā)展趨勢[J];計算機科學;2018年04期

6 暏成國;;高速公路交調(diào)數(shù)據(jù)質(zhì)量管理系統(tǒng)設計[J];中國交通信息化;2018年05期

7 戚斌;;大數(shù)據(jù)時代下數(shù)據(jù)質(zhì)量的挑戰(zhàn)[J];信息記錄材料;2018年06期

8 徐志偉;;油田數(shù)據(jù)質(zhì)量監(jiān)督與控制模型研究[J];信息系統(tǒng)工程;2018年06期

9 張曉冉;袁滿;;通用數(shù)據(jù)質(zhì)量評估模型及本體實現(xiàn)[J];計算機研究與發(fā)展;2018年06期

10 中國殘聯(lián)"動態(tài)更新第三方評估"課題組;陳功;江海霞;鄭翩翩;李佳懌;胡喬文;耿q

本文編號:2716106


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/falvlunwen/gongjianfalunwen/2716106.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶40786***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com