0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

哈工大讯飞联合实验室发布的中文ELECTRA系列预训练模型再迎新成员

深度学习自然语言处理 来源:深度学习自然语言处理 作者:哈工大讯飞联合实 2020-12-26 09:49 次阅读

哈工大讯飞联合实验室发布的中文ELECTRA系列预训练模型再迎新成员。我们基于大规模法律文本训练出中文法律领域ELECTRA系列模型,并且在法律领域自然语言处理任务中获得了显著性能提升。欢迎各位读者下载试用相关模型。

项目地址:http://electra.hfl-rc.com

中文法律领域ELECTRA

我们在20G版(原版)中文ELECTRA的基础上加入了高质量2000万裁判文书数据进行了二次预训练,在不丢失大规模通用数据上学习到的语义信息,同时使模型对法律文本更加适配。本次发布以下三个模型:

legal-ELECTRA-large, Chinese:24-layer,1024-hidden, 16-heads, 324M parameters

legal-ELECTRA-base, Chinese:12-layer,768-hidden, 12-heads, 102M parameters

legal-ELECTRA-small, Chinese: 12-layer, 256-hidden, 4-heads, 12M parameters

快速加载

哈工大讯飞联合实验室发布的所有中文预训练语言模型均可通过huggingface transformers库进行快速加载访问,请登录我们的共享页面获取更多信息。

https://huggingface.co/HFL

模型键值如下:

hfl/chinese-legal-electra-large-discriminator

hfl/chinese-legal-electra-large-generator

hfl/chinese-legal-electra-base-discriminator

hfl/chinese-legal-electra-base-generator

hfl/chinese-legal-electra-small-discriminator

hfl/chinese-legal-electra-small-generator

效果评测

我们在罪名预测以及要素抽取任务上进行了基线测试。其中罪名预测任务使用的是CAIL 2018数据,要素抽取任务为in-house实际应用。可以看到本次发布的法律领域ELECTRA模型均相比通用ELECTRA模型获得了显著性能提升。

表1罪名预测任务

e4007c02-4691-11eb-8b86-12bb97331649.png

表2要素抽取任务

e46fa672-4691-11eb-8b86-12bb97331649.png

其他相关资源

TextBrewer知识蒸馏工具

http://textbrewer.hfl-rc.com

中文BERT、RoBERTa、RBT系列模型

http://bert.hfl-rc.com

中文XLNet系列模型

http://xlnet.hfl-rc.com

中文MacBERT模型

http://macbert.hfl-rc.com

责任编辑:xj

原文标题:哈工大讯飞联合实验室发布法律领域ELECTRA预训练模型

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4612

    浏览量

    92901
  • 深度学习
    +关注

    关注

    73

    文章

    5503

    浏览量

    121170
  • 训练模型
    +关注

    关注

    1

    文章

    36

    浏览量

    3826

原文标题:哈工大讯飞联合实验室发布法律领域ELECTRA预训练模型

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    小米与聚光电成立联合实验室

    近日,“小米&聚联合实验室”在惠州聚正式揭牌成立。该实验室将以Mini背光技术创新为主要方向,进一步强化双方在显示终端领域的多元化合作。
    的头像 发表于 11-27 10:45 175次阅读

    科大发布星火4.0 Turbo大模型及星火多语言大模型

    ,科大以其一贯的创新精神,开创性地发布了星火多语言大模型。这一创新之举不仅进一步巩固了科大飞在中文
    的头像 发表于 10-24 13:58 387次阅读

    华工科技联合哈工大实现国内首台激光智能除草机器人落地

    华工科技党委书记、董事长、总裁马新强一行赴哈尔滨对哈尔滨工业大学机器人技术与系统全国重点实验室(后简称哈工大机器人实验室)、爱辉区智能激光除草机器人试点基地进行实地调研,代表华工科技中央研究院同
    的头像 发表于 09-06 10:45 806次阅读

    荣耀与智谱携手共建AI大模型联合实验室

    近日,荣耀终端有限公司与北京智谱华章科技有限公司正式携手,共同宣布成立AI大模型技术联合实验室,并签署了战略合作协议。此次合作标志着双方在人工智能领域的深度合作迈入新阶段,共同致力于为用户带来前所未有的智能体验。
    的头像 发表于 09-03 18:15 1027次阅读

    高鸿信安出席飞腾基础软件联合实验室第三届年会

    7月12日,飞腾基础软件联合实验室(简称“实验室”)第三届年会暨技术交流分享会在深圳顺利召开。大唐高鸿信安(浙江)信息科技有限公司(简称“高鸿信安”)作为实验室
    的头像 发表于 07-15 14:07 558次阅读

    MediaTek与小米集团联合实验室正式揭幕

    MediaTek 宣布携手小米集团持续强化战略合作,共同开启更深层次的多元合作,并为位于小米深圳研发总部的「联合实验室」揭牌。此次「联合实验室」的揭幕将进一步强化双方合作伙伴关系,推动
    的头像 发表于 07-03 14:52 705次阅读

    【大语言模型:原理与工程实践】大语言模型训练

    大语言模型的核心特点在于其庞大的参数量,这赋予了模型强大的学习容量,使其无需依赖微调即可适应各种下游任务,而更倾向于培养通用的处理能力。然而,随着学习容量的增加,对训练数据的需求也相
    发表于 05-07 17:10

    西井科技和香港理工大学签署合作协议,将共建联合创新实验室

    西井科技和香港理工大学签署了人工智能和自动驾驶方面的深度产学研合作协议,将共建联合创新实验室,双方共同探索该领域的前沿技术和应用实践。
    的头像 发表于 04-29 09:42 568次阅读
    西井科技和香港理<b class='flag-5'>工大</b>学签署合作协议,将共建<b class='flag-5'>联合</b>创新<b class='flag-5'>实验室</b>

    AI+教育 深圳市中小学联合实验室正式启用

    4月18日,深圳市中小学人工智能联合实验室在深圳高级中学(集团)南校区启用。 去年,深圳市教育局发布推进中小学人工智能教育工作方案,提出要建成具有深圳特色的人工智能教育课程体系,构建社会资源支持
    发表于 04-22 10:07 239次阅读
    AI+教育 深圳市中小学<b class='flag-5'>联合</b><b class='flag-5'>实验室</b>正式启用

    谷歌模型训练软件有哪些功能和作用

    谷歌模型训练软件主要是指ELECTRA,这是一种新的训练方法,源自谷歌AI。ELECTRA不仅
    的头像 发表于 02-29 17:37 791次阅读

    科大发布星火V3.5”:基于全国产算力训练的全民开放大模型

    科大,作为中国领先的智能语音和人工智能公司,近日宣布推出首个基于全国产算力训练的全民开放大模型
    的头像 发表于 02-04 11:28 1509次阅读

    上海AI实验室发布新一代书生·视觉大模型

    近日,上海人工智能实验室(上海AI实验室)联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型(InternVL)。
    的头像 发表于 02-04 11:25 1117次阅读

    科大星火认知大模型V3.5发布

    近日,科大举办了星火认知大模型V3.5升级发布会。在发布会上,科大
    的头像 发表于 01-31 17:28 1422次阅读

    科大发布星火认知大模型V3.5

    科大近日发布了星火认知大模型V3.5版本,该版本基于全国产化算力底座“星一号”平台进行训练
    的头像 发表于 01-31 14:40 902次阅读

    模型星火V3.5,1月30日正式发布

    2024年1月30日14:00星火升级;这一次首个基于全国产化算力平台训练的全民开放大模型
    的头像 发表于 01-23 09:06 818次阅读