0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

饶峰云:《以知识为中心的智慧司法解决方案》的精彩演讲

MqC7_CAAI_1981 来源:lq 2018-12-13 16:27 次阅读

由中国人工智能学会主办,广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官,论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自北京国双科技有限公司技术总监饶峰云主题为《以知识为中心的智慧司法解决方案》的精彩演讲。

饶峰云

北京国双科技有限公司技术总监

以下内容根据速记进行整理

经过饶峰云本人校对

针对各种司法数据、行业支持知识,我们积累了包括文书解析、知识图谱、信息检索等应用服务能力,以文本解析为例,处理超过5 000万的裁判文书,解析出4 700多个司法专业维度和要素,建立了20多万个经审核的问答对体系,聚合并审核了超过3 000个争议焦点、裁判规则等。裁判文书外,还对起诉状、上诉状、答辩状、庭审笔录等其他类型文书做信息抽取、结构化和解析。

面对几百种文书,同时解析几千个维度,需要一个很庞大的工程能力、大数据处理的能力。具体到算法层面:① 文书分段。它和语文的分段不一样,是一个法律意义上的分段,比如要知道这一段是讲诉请段、证据段、裁判结果段等,这是所有的基础。这方面我们用的是深度学习的分类算法来做,准确率还是非常高的。② 命名实体识别。一个文书中涉及到很多人名、地名、机构名等。③ 业务规则和要素体系这些业务规则和要素体系里的法律逻辑都是我们业务专家提取出来的。

要素特征的抽取在语义层面会更抽象一层,也更难做一些。要素来源于法律法规和规范性的指导文件。要素非常有用,它可以起到桥梁作用,把裁判文书中的争议焦点、裁判规则给关联起来。按照法院不同的立场,它有诉请要素、抗辩要素、事实要素和裁判要素四个划分。以上工作有很大一部分是用监督学习的办法来做的。解决的第一步就是要标注数据,这需要大量的人力。

在建立了知识之后,我们怎么用这个知识?通常我们希望能对对知识做检索、问答。我们首先做了一个类案同判的大数据引擎,让法官能够搜索到类似案件别人是怎么判的。为了建立这个类案同判的大数据引擎做了两件事情:① 把几千万的文书全部解析出了很多维度,对各种维度做多维度的剖析,做统计分析;② 寻找类案。最关键的检索部分,就是去检索类似案件。我们也经历了不同版本的迭代,最开始就是最简单的、用文本相似度来做这件事情,文本相似了就是类似案件,结果发现不是很准;再后来用关键段落,最新版本主要是基于要素来做的,案件的要素相同就是类似案件,相同的要素越多就越类似。

我们还做了一个智能问答的版本,是法信的一个升级版本,也是和人民法院出版社一起做的,它有以下几个功能与特点:① 用户意图的识别,比如查法律、法条和案例,用户的意图是用文本分类的做法来做的。② 问题语义解析,这也是比较经典的,比如我们做领域实体识别与槽位填充技术,我要问一个北京市离婚案件哪个律师的胜诉率最高的问题,要把北京市海淀区这个实体识别出来、把这个案由离婚识别出来、把律师胜诉率识别出来,所以这是一个实体识别和槽位填充的技术。③ 单轮问答语义检索。我们有20万单轮的问答对,都是人工编辑审核过的,这其实就是学术上比较常见的FAQ型的问答。④ 对话管理。我们还做了多轮对话,其主要是背后建了一个多轮树状的知识库,最主要的一个技术就是控制它的状态转移图。

我们有20万单轮问答,目前人工梳理了三大领域的多轮问答库。目前做了两个版本,一个是针对法院的专业人士版本;另外一个是to C的对普通老百姓的版本。

进一步来看我们是如何获得法研杯冠军。“定罪量刑”是这次法研杯比赛的题目,赛题是输入一个案件事实的描述,去预测法条、罪名、刑期,因为有100多万现成的裁判文书,它是一个有监督学习的问题。我们用的最多的模型是Recurrent attention network(简称RamNet),其结构如图所示。

RamNet最早是EMNLP 2017的paper,用于实体情感,我们对它做了一些改进,去掉了其中实体部分,改进了recurrent attention的输入输出,并在多个应用场景中都发现它能显著战胜NLP领域常见的BiLSTM + attention网络,我们认为recurrent attention能提取更多的feature,尤其适合类别很多的多类标问题。

此模型有一个信息拓扑结构,因为它同时预测罪名、法条、刑期,所以是一个联合学习的模型来做的,同时预测这三个类别,有三种办法。第一种并行的方法,前面是联合学习的共享层,每一个任务都用一个全链接去做预测;第二种串行的方法,第一个全链接去预测罪名,再把这个全链接的特征接着传递到第二个;第三种用一个图状的,比较复杂,比如先做罪名,罪名会传到法条,又会传到刑期。在实际的比赛模型中,我们用到了第一种和第三种,发现这两种效果好一些。

我们对模型的loss还做了一些优化,传统多类标问题是logistic loss,考虑到罪名、法条和的类标并不是独立的,相互之间有关联,所以尝试了CRF loss,在实践中,模型效果会有一定提升。

我们还引入了业务的规则,尤其是在刑期预测中原来是深入学习提取出来的feature,会把基于业务规则提取出来的feature和统计特征的feature一起再做分类,这样在实验中的效果有很大提升。

前面介绍的是在法研杯比赛中拿第一名用到的模型,基本上都是端到端的深度学习模型;后期应用正在优化,将文本解析、要素体系与模型结合,进一步深化应用能力。

此外还开发了文书生成系统提升法官写文书的效率。做法是给法官提供两种选择,第一种是直接找类案,通过前面类案的做法,找到类案之后,法官直接从类似案件中选模板,把模板套进来,再把解析的东西填到模板中,这是一个做法。第二种是应用知识图谱的推理。我们为文书生成构建的一个案件知识图谱,针对每一个案件类型,定义争议焦点、裁判规则、法律法规、诉辩称、诉讼请求项,这样把它关联起来。法官在审判案件的过程中会去找类案来参酌,但是类案的案件非常多,我们会根据要素,给法官推荐最相似的争议焦点(争议焦点的数量相对是少的)。根据统计做争议焦点的排序,把最相关、最可能的争议焦点放在前面。法官选完争议焦点后,争议焦点和裁判规则有对应关系,裁判规则和法律法规又有对应关系。所以,我们先有一个推荐,推荐完他选择后,需要的文书即可生成。

总结我们的知识智能在司法领域的经验认为,司法领域有大量高质量的语料和知识;司法领域有丰富的NLP技术应用,包括信息抽取、信息检索、知识图谱、问答等;司法领域有丰富的智能应用场景,具有巨大的社会价值。我们希望与更多的学术界人共同探索相关领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    8863

    浏览量

    137292
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120975

原文标题:CIIS2018演讲实录丨饶峰云:以知识为中心的智慧司法解决方案

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    解决方案智慧用电解决方案

    解决方案智慧用电解决方案
    的头像 发表于 11-11 01:00 82次阅读
    【<b class='flag-5'>解决方案</b>】<b class='flag-5'>智慧</b>用电<b class='flag-5'>解决方案</b>

    “小路灯”蕴含“大民生”路灯装上“智慧大脑”智慧路灯解决方案

    “小路灯”蕴含“大民生”路灯装上“智慧大脑”智慧路灯解决方案
    的头像 发表于 10-12 10:14 211次阅读
    “小路灯”蕴含“大民生”<b class='flag-5'>为</b>路灯装上“<b class='flag-5'>智慧</b>大脑”<b class='flag-5'>智慧</b>路灯<b class='flag-5'>解决方案</b>

    智慧路灯杆总体解决方案 智能智慧路灯屏灯杆屏解决方案

    智慧路灯杆总体解决方案 智能智慧路灯屏灯杆屏解决方案
    的头像 发表于 10-11 09:30 308次阅读
    <b class='flag-5'>智慧</b>路灯杆总体<b class='flag-5'>解决方案</b> 智能<b class='flag-5'>智慧</b>路灯屏灯杆屏<b class='flag-5'>解决方案</b>

    科技携三大解决方案亮相WAIC 2024

    2024世界人工智能大会暨人工智能全球治理高级别会议(简称“WAIC 2024”)将在上海世博中心展览馆举行。澎科技将在世博展览馆H1-D1022展位您呈现前沿的技术成果和创新的产品解决方
    的头像 发表于 09-29 10:05 339次阅读

    知声山海大模型助力司法领域智慧化升级

    近期,知声成功助力上海市徐汇区虹梅街道司法所打造基于山海大模型的司法领域应用,极大提升了司法服务的可及性与便利性。这不仅是山海大模型在司法
    的头像 发表于 09-12 14:44 568次阅读

    智慧部队建设整体解决方案

    智慧华盛恒辉部队建设整体解决方案是一个综合性的系统,旨在通过现代信息技术的运用,提升部队的管理效率、战斗力及信息化水平。以下是一个详细的解决方案概述: 一、华盛恒辉总体架构 智慧部队建
    的头像 发表于 09-06 15:18 294次阅读

    华为与光莆股份鸿蒙智慧健康联合解决方案重磅签约

    华为与光莆股份鸿蒙智慧健康联合解决方案重磅签约
    的头像 发表于 05-24 10:08 551次阅读
    华为<b class='flag-5'>云</b>与光莆股份鸿蒙<b class='flag-5'>智慧</b>健康联合<b class='flag-5'>解决方案</b>重磅签约

    岹科技携手IC RESOURCE精彩亮相2024印尼国际电动汽车展

    5月15日-17日,2024印尼电动汽车及制造解决方案展览会(ElectricVehicles&ManufacturingSolutions)雅加达国际博览中心举办。岹科技携手海外合作伙伴
    的头像 发表于 05-22 08:15 891次阅读
    <b class='flag-5'>峰</b>岹科技携手IC RESOURCE<b class='flag-5'>精彩</b>亮相2024印尼国际电动汽车展

    古河科技智慧医院解决方案

    智慧医院作为智慧城市战略规划中—项重要的民生领域应用,发挥着不可或缺的重要作用。古河科技智慧医院解决方案
    的头像 发表于 05-10 14:49 325次阅读
    古河<b class='flag-5'>云</b>科技<b class='flag-5'>智慧</b>医院<b class='flag-5'>解决方案</b>

    智慧工地解决方案具有的特点与优势

    智慧工地解决方案是通过建立体系管理施工过程的信息化手段,利用计算、大数据和物联网等新进技术,实现施工过程的可视化管理,为了确保施工人员的安全和项目的顺利进行,智慧工地已是必不可少的
    的头像 发表于 04-28 17:34 663次阅读

    Micradar毫米波雷达解决方案精彩亮相香港国际春灯展

    4月6日,2024香港国际春季灯饰展(HongkongLightingFair2024)及首届智慧照明博览在香港会议展览中心盛大举行。Micradar帆瑞达毫米波雷达技术
    的头像 发表于 04-12 08:01 705次阅读
    Micradar毫米波雷达<b class='flag-5'>解决方案</b><b class='flag-5'>精彩</b>亮相香港国际春灯展

    软通动力与华为联合发布智慧养殖解决方案

    )合作伙伴身份受邀参会,并携手华为发布了面向农牧行业的联合解决方案——软通动力华为智慧养殖解决方案。该方案旨在解决养殖全流程监管、疾病防控、成本管理以及效率提升等核心挑战,
    的头像 发表于 03-19 22:21 427次阅读
    软通动力与华为联合发布<b class='flag-5'>智慧</b>养殖<b class='flag-5'>解决方案</b>

    智慧卫监监管平台解决方案

    智慧卫监监管平台解决方案 智慧卫监监管平台运用物联网、大数据、计算、人工智能等现场信息技术应用于卫生监督,有效整合在线监测、视频监控等软硬件资源,应用覆盖医院、医疗废物、职业卫生监管
    的头像 发表于 02-04 17:21 549次阅读
    <b class='flag-5'>智慧</b>卫监监管平台<b class='flag-5'>解决方案</b>

    数字化园区升级,智慧园区解决方案

    智慧园区解决方案是集安防、环保、节能、消防和能源管理等功能为一体的综合应用平台,数据中心,实现园区的全方位覆盖、全天候监控和智能化服务。
    的头像 发表于 12-21 14:41 511次阅读
    数字化园区升级,<b class='flag-5'>智慧</b>园区<b class='flag-5'>解决方案</b>

    星网锐捷:目前有很多解决方案基于***开发

    近年来星网锐捷加大行业市场拓展和新产品上市力度,不断提高自主创新领域的技术力量和产品创新能力。产品战略各种智能解决方案的应用场面中心,在智慧
    的头像 发表于 12-04 14:41 592次阅读