饶峰云：《以知识为中心的智慧司法解决方案》的精彩演讲-电子发烧友网

由中国人工智能学会主办，广州易间网络科技有限公司承办的2018第八届中国智能产业高峰论坛11 月17-18日在成都完美收官，论坛在两天的会议里带来了多场精彩报告。

此次小编为大家整理的是来自北京国双科技有限公司技术总监饶峰云主题为《以知识为中心的智慧司法解决方案》的精彩演讲。

饶峰云

北京国双科技有限公司技术总监

以下内容根据速记进行整理

经过饶峰云本人校对

针对各种司法数据、行业支持知识，我们积累了包括文书解析、知识图谱、信息检索等应用服务能力，以文本解析为例，处理超过5 000万的裁判文书，解析出4 700多个司法专业维度和要素，建立了20多万个经审核的问答对体系，聚合并审核了超过3 000个争议焦点、裁判规则等。裁判文书外，还对起诉状、上诉状、答辩状、庭审笔录等其他类型文书做信息抽取、结构化和解析。

面对几百种文书，同时解析几千个维度，需要一个很庞大的工程能力、大数据处理的能力。具体到算法层面：① 文书分段。它和语文的分段不一样，是一个法律意义上的分段，比如要知道这一段是讲诉请段、证据段、裁判结果段等，这是所有的基础。这方面我们用的是深度学习的分类算法来做，准确率还是非常高的。② 命名实体识别。一个文书中涉及到很多人名、地名、机构名等。③ 业务规则和要素体系这些业务规则和要素体系里的法律逻辑都是我们业务专家提取出来的。

要素特征的抽取在语义层面会更抽象一层，也更难做一些。要素来源于法律法规和规范性的指导文件。要素非常有用，它可以起到桥梁作用，把裁判文书中的争议焦点、裁判规则给关联起来。按照法院不同的立场，它有诉请要素、抗辩要素、事实要素和裁判要素四个划分。以上工作有很大一部分是用监督学习的办法来做的。解决的第一步就是要标注数据，这需要大量的人力。

在建立了知识之后，我们怎么用这个知识？通常我们希望能对对知识做检索、问答。我们首先做了一个类案同判的大数据引擎，让法官能够搜索到类似案件别人是怎么判的。为了建立这个类案同判的大数据引擎做了两件事情：① 把几千万的文书全部解析出了很多维度，对各种维度做多维度的剖析，做统计分析；② 寻找类案。最关键的检索部分，就是去检索类似案件。我们也经历了不同版本的迭代，最开始就是最简单的、用文本相似度来做这件事情，文本相似了就是类似案件，结果发现不是很准；再后来用关键段落，最新版本主要是基于要素来做的，案件的要素相同就是类似案件，相同的要素越多就越类似。

我们还做了一个智能问答的版本，是法信的一个升级版本，也是和人民法院出版社一起做的，它有以下几个功能与特点：① 用户意图的识别，比如查法律、法条和案例，用户的意图是用文本分类的做法来做的。② 问题语义解析，这也是比较经典的，比如我们做领域实体识别与槽位填充技术，我要问一个北京市离婚案件哪个律师的胜诉率最高的问题，要把北京市海淀区这个实体识别出来、把这个案由离婚识别出来、把律师胜诉率识别出来，所以这是一个实体识别和槽位填充的技术。③ 单轮问答语义检索。我们有20万单轮的问答对，都是人工编辑审核过的，这其实就是学术上比较常见的FAQ型的问答。④ 对话管理。我们还做了多轮对话，其主要是背后建了一个多轮树状的知识库，最主要的一个技术就是控制它的状态转移图。

我们有20万单轮问答，目前人工梳理了三大领域的多轮问答库。目前做了两个版本，一个是针对法院的专业人士版本；另外一个是to C的对普通老百姓的版本。

进一步来看我们是如何获得法研杯冠军。“定罪量刑”是这次法研杯比赛的题目，赛题是输入一个案件事实的描述，去预测法条、罪名、刑期，因为有100多万现成的裁判文书，它是一个有监督学习的问题。我们用的最多的模型是Recurrent attention network（简称RamNet），其结构如图所示。

RamNet最早是EMNLP 2017的paper，用于实体情感，我们对它做了一些改进，去掉了其中实体部分，改进了recurrent attention的输入输出，并在多个应用场景中都发现它能显著战胜NLP领域常见的BiLSTM + attention网络，我们认为recurrent attention能提取更多的feature，尤其适合类别很多的多类标问题。

此模型有一个信息拓扑结构，因为它同时预测罪名、法条、刑期，所以是一个联合学习的模型来做的，同时预测这三个类别，有三种办法。第一种并行的方法，前面是联合学习的共享层，每一个任务都用一个全链接去做预测；第二种串行的方法，第一个全链接去预测罪名，再把这个全链接的特征接着传递到第二个；第三种用一个图状的，比较复杂，比如先做罪名，罪名会传到法条，又会传到刑期。在实际的比赛模型中，我们用到了第一种和第三种，发现这两种效果好一些。

我们对模型的loss还做了一些优化，传统多类标问题是logistic loss，考虑到罪名、法条和的类标并不是独立的，相互之间有关联，所以尝试了CRF loss，在实践中，模型效果会有一定提升。

我们还引入了业务的规则，尤其是在刑期预测中原来是深入学习提取出来的feature，会把基于业务规则提取出来的feature和统计特征的feature一起再做分类，这样在实验中的效果有很大提升。

前面介绍的是在法研杯比赛中拿第一名用到的模型，基本上都是端到端的深度学习模型；后期应用正在优化，将文本解析、要素体系与模型结合，进一步深化应用能力。

此外还开发了文书生成系统提升法官写文书的效率。做法是给法官提供两种选择，第一种是直接找类案，通过前面类案的做法，找到类案之后，法官直接从类似案件中选模板，把模板套进来，再把解析的东西填到模板中，这是一个做法。第二种是应用知识图谱的推理。我们为文书生成构建的一个案件知识图谱，针对每一个案件类型，定义争议焦点、裁判规则、法律法规、诉辩称、诉讼请求项，这样把它关联起来。法官在审判案件的过程中会去找类案来参酌，但是类案的案件非常多，我们会根据要素，给法官推荐最相似的争议焦点（争议焦点的数量相对是少的）。根据统计做争议焦点的排序，把最相关、最可能的争议焦点放在前面。法官选完争议焦点后，争议焦点和裁判规则有对应关系，裁判规则和法律法规又有对应关系。所以，我们先有一个推荐，推荐完他选择后，需要的文书即可生成。

总结我们的知识智能在司法领域的经验认为，司法领域有大量高质量的语料和知识；司法领域有丰富的NLP技术应用，包括信息抽取、信息检索、知识图谱、问答等；司法领域有丰富的智能应用场景，具有巨大的社会价值。我们希望与更多的学术界人共同探索相关领域。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

大数据

大数据

+关注

关注
64

文章
8896

浏览量
137517
深度学习

深度学习

+关注

关注
73

文章
5507

浏览量
121270

原文标题：CIIS2018演讲实录丨饶峰云：以知识为中心的智慧司法解决方案

文章出处：【微信号：CAAI-1981，微信公众号：中国人工智能学会】欢迎添加关注！文章转载请注明出处。

【解决方案】智慧用电解决方案

【解决方案】智慧用电解决方案

发表于 11-11 01:00 •136次阅读

【<b class='flag-5'>解决方案</b>】<b class='flag-5'>智慧</b>用电<b class='flag-5'>解决方案</b>

“澎峰云”校园行：湖南科技职业学院站，共启校园创新之旅！

分享了最前沿的AI技术，更点燃了学生们对科技的热情和对未来的无限憧憬！技术讲座澎峰科技AI解决方案专家邱凤林老师以其深厚的专业知识和丰富的实战经验，为在场的师生们深入浅出地介绍了

发表于 10-24 11:41 •253次阅读

“澎<b class='flag-5'>峰</b><b class='flag-5'>云</b>”校园行：湖南科技职业学院站，共启校园创新之旅！

“小路灯”蕴含“大民生”为路灯装上“智慧大脑”智慧路灯解决方案

“小路灯”蕴含“大民生”为路灯装上“智慧大脑”智慧路灯解决方案

发表于 10-12 10:14 •275次阅读

“小路灯”蕴含“大民生”<b class='flag-5'>为</b>路灯装上“<b class='flag-5'>智慧</b>大脑”<b class='flag-5'>智慧</b>路灯<b class='flag-5'>解决方案</b>

智慧路灯杆总体解决方案智能智慧路灯屏灯杆屏解决方案

智慧路灯杆总体解决方案 智能智慧路灯屏灯杆屏解决方案

发表于 10-11 09:30 •474次阅读

<b class='flag-5'>智慧</b>路灯杆总体<b class='flag-5'>解决方案</b> 智能<b class='flag-5'>智慧</b>路灯屏灯杆屏<b class='flag-5'>解决方案</b>

澎峰科技携三大解决方案亮相WAIC 2024

2024世界人工智能大会暨人工智能全球治理高级别会议（简称“WAIC 2024”）将在上海世博中心展览馆举行。澎峰科技将在世博展览馆H1-D1022展位为您呈现前沿的技术成果和创新的产品解决方

发表于 09-29 10:05 •376次阅读

云知声山海大模型助力司法领域智慧化升级

近期，云知声成功助力上海市徐汇区虹梅街道司法所打造基于山海大模型的司法领域应用，极大提升了司法服务的可及性与便利性。这不仅是山海大模型在司法

发表于 09-12 14:44 •616次阅读

智慧部队建设整体解决方案

智慧华盛恒辉部队建设整体解决方案是一个综合性的系统，旨在通过现代信息技术的运用，提升部队的管理效率、战斗力及信息化水平。以下是一个详细的解决方案概述：一、华盛恒辉总体架构智慧部队建

发表于 09-06 15:18 •363次阅读

智慧工厂物联网云平台解决方案

，成为越来越多企业打造智慧工厂必须解决的重要问题。对此，数之能提供智慧工厂物联网云平台解决方案，打破信息孤岛，为使企业更快更好地发展提供可

发表于 07-26 11:17 •353次阅读

华为云与光莆股份鸿蒙智慧健康联合解决方案重磅签约

华为云与光莆股份鸿蒙智慧健康联合解决方案重磅签约

发表于 05-24 10:08 •603次阅读

峰岹科技携手IC RESOURCE精彩亮相2024印尼国际电动汽车展

5月15日-17日，2024印尼电动汽车及制造解决方案展览会（ElectricVehicles&ManufacturingSolutions）雅加达国际博览中心举办。峰岹科技携手海外合作伙伴

发表于 05-22 08:15 •1090次阅读

古河云科技智慧医院解决方案

智慧医院作为智慧城市战略规划中—项重要的民生领域应用，发挥着不可或缺的重要作用。古河云科技智慧医院解决方案

发表于 05-10 14:49 •372次阅读

智慧工地解决方案具有的特点与优势

智慧工地解决方案是通过建立体系管理施工过程的信息化手段，利用云计算、大数据和物联网等新进技术，实现施工过程的可视化管理，为了确保施工人员的安全和项目的顺利进行，智慧工地已是必不可少的

发表于 04-28 17:34 •732次阅读

Micradar毫米波雷达解决方案精彩亮相香港国际春灯展

4月6日，2024香港国际春季灯饰展（HongkongLightingFair2024）及首届智慧照明博览在香港会议展览中心盛大举行。Micradar云帆瑞达以毫米波雷达技术

发表于 04-12 08:01 •773次阅读

软通动力与华为联合发布智慧养殖解决方案

）合作伙伴身份受邀参会，并携手华为发布了面向农牧行业的联合解决方案——软通动力华为智慧养殖解决方案。该方案旨在解决养殖全流程监管、疾病防控、成本管理以及效率提升等核心挑战，

发表于 03-19 22:21 •469次阅读

智慧卫监监管平台解决方案

智慧卫监监管平台解决方案 智慧卫监监管平台运用物联网、大数据、云计算、人工智能等现场信息技术应用于卫生监督，有效整合在线监测、视频监控等软硬件资源，应用覆盖医院、医疗废物、职业卫生监管

发表于 02-04 17:21 •592次阅读