哈工大讯飞联合实验室发布的中文ELECTRA系列预训练模型再迎新成员-电子发烧友网

哈工大讯飞联合实验室发布的中文ELECTRA系列预训练模型再迎新成员。我们基于大规模法律文本训练出中文法律领域ELECTRA系列模型，并且在法律领域自然语言处理任务中获得了显著性能提升。欢迎各位读者下载试用相关模型。

项目地址：http://electra.hfl-rc.com

中文法律领域ELECTRA

我们在20G版（原版）中文ELECTRA的基础上加入了高质量2000万裁判文书数据进行了二次预训练，在不丢失大规模通用数据上学习到的语义信息，同时使模型对法律文本更加适配。本次发布以下三个模型：

legal-ELECTRA-large, Chinese:24-layer,1024-hidden, 16-heads, 324M parameters

legal-ELECTRA-base, Chinese:12-layer,768-hidden, 12-heads, 102M parameters

legal-ELECTRA-small, Chinese: 12-layer, 256-hidden, 4-heads, 12M parameters

快速加载

哈工大讯飞联合实验室发布的所有中文预训练语言模型均可通过huggingface transformers库进行快速加载访问，请登录我们的共享页面获取更多信息。

https://huggingface.co/HFL

模型键值如下：

hfl/chinese-legal-electra-large-discriminator

hfl/chinese-legal-electra-large-generator

hfl/chinese-legal-electra-base-discriminator

hfl/chinese-legal-electra-base-generator

hfl/chinese-legal-electra-small-discriminator

hfl/chinese-legal-electra-small-generator

效果评测

我们在罪名预测以及要素抽取任务上进行了基线测试。其中罪名预测任务使用的是CAIL 2018数据，要素抽取任务为in-house实际应用。可以看到本次发布的法律领域ELECTRA模型均相比通用ELECTRA模型获得了显著性能提升。

表1罪名预测任务

表2要素抽取任务

其他相关资源

TextBrewer知识蒸馏工具

http://textbrewer.hfl-rc.com

中文BERT、RoBERTa、RBT系列模型

http://bert.hfl-rc.com

中文XLNet系列模型

http://xlnet.hfl-rc.com

中文MacBERT模型

http://macbert.hfl-rc.com

责任编辑：xj

原文标题：哈工大讯飞联合实验室发布法律领域ELECTRA预训练模型

文章出处：【微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4612

浏览量
92901
深度学习

深度学习

+关注

关注
73

文章
5503

浏览量
121170
训练模型

训练模型

+关注

关注
1

文章
36

浏览量
3826

原文标题：哈工大讯飞联合实验室发布法律领域ELECTRA预训练模型

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

小米与聚飞光电成立联合实验室

近日，“小米&聚飞联合实验室”在惠州聚飞正式揭牌成立。该实验室将以Mini背光技术创新为主要方向，进一步强化双方在显示终端领域的多元化合作。

发表于 11-27 10:45 •175次阅读

科大讯飞发布讯飞星火4.0 Turbo大模型及星火多语言大模型

，科大讯飞以其一贯的创新精神，开创性地发布了星火多语言大模型。这一创新之举不仅进一步巩固了科大讯飞在中文

发表于 10-24 13:58 •387次阅读

华工科技联合哈工大实现国内首台激光智能除草机器人落地

华工科技党委书记、董事长、总裁马新强一行赴哈尔滨对哈尔滨工业大学机器人技术与系统全国重点实验室（后简称哈工大机器人实验室）、爱辉区智能激光除草机器人试点基地进行实地调研，代表华工科技中央研究院同

发表于 09-06 10:45 •806次阅读

荣耀与智谱携手共建AI大模型联合实验室

近日，荣耀终端有限公司与北京智谱华章科技有限公司正式携手，共同宣布成立AI大模型技术联合实验室，并签署了战略合作协议。此次合作标志着双方在人工智能领域的深度合作迈入新阶段，共同致力于为用户带来前所未有的智能体验。

发表于 09-03 18:15 •1027次阅读

高鸿信安出席飞腾基础软件联合实验室第三届年会

7月12日，飞腾基础软件联合实验室（简称“实验室”）第三届年会暨技术交流分享会在深圳顺利召开。大唐高鸿信安（浙江）信息科技有限公司（简称“高鸿信安”）作为实验室

发表于 07-15 14:07 •558次阅读

MediaTek与小米集团联合实验室正式揭幕

MediaTek 宣布携手小米集团持续强化战略合作，共同开启更深层次的多元合作，并为位于小米深圳研发总部的「联合实验室」揭牌。此次「联合实验室」的揭幕将进一步强化双方合作伙伴关系，推动

发表于 07-03 14:52 •705次阅读

【大语言模型：原理与工程实践】大语言模型的预训练

大语言模型的核心特点在于其庞大的参数量，这赋予了模型强大的学习容量，使其无需依赖微调即可适应各种下游任务，而更倾向于培养通用的处理能力。然而，随着学习容量的增加，对预训练数据的需求也相

发表于 05-07 17:10

西井科技和香港理工大学签署合作协议，将共建联合创新实验室

西井科技和香港理工大学签署了人工智能和自动驾驶方面的深度产学研合作协议，将共建联合创新实验室，双方共同探索该领域的前沿技术和应用实践。

发表于 04-29 09:42 •568次阅读

AI+教育深圳市中小学联合实验室正式启用

4月18日，深圳市中小学人工智能联合实验室在深圳高级中学（集团）南校区启用。去年，深圳市教育局发布推进中小学人工智能教育工作方案，提出要建成具有深圳特色的人工智能教育课程体系，构建社会资源支持

发表于 04-22 10:07 •239次阅读

谷歌模型训练软件有哪些功能和作用

谷歌模型训练软件主要是指ELECTRA，这是一种新的预训练方法，源自谷歌AI。ELECTRA不仅

发表于 02-29 17:37 •791次阅读

科大讯飞发布“讯飞星火V3.5”：基于全国产算力训练的全民开放大模型

科大讯飞，作为中国领先的智能语音和人工智能公司，近日宣布推出首个基于全国产算力训练的全民开放大模型“讯飞

发表于 02-04 11:28 •1509次阅读

上海AI实验室发布新一代书生·视觉大模型

近日，上海人工智能实验室（上海AI实验室）联手多所知名高校及科技公司共同研发出新一代书生·视觉大模型（InternVL）。

发表于 02-04 11:25 •1117次阅读

科大讯飞星火认知大模型V3.5发布

近日，科大讯飞举办了星火认知大模型V3.5升级发布会。在发布会上，科大讯

发表于 01-31 17:28 •1422次阅读

科大讯飞发布星火认知大模型V3.5

科大讯飞近日发布了星火认知大模型V3.5版本，该版本基于全国产化算力底座“飞星一号”平台进行训练

发表于 01-31 14:40 •902次阅读

大模型讯飞星火V3.5，1月30日正式发布

2024年1月30日14:00讯飞星火再升级;这一次首个基于全国产化算力平台训练的全民开放大模型讯

发表于 01-23 09:06 •818次阅读

搜索历史

哈工大讯飞联合实验室发布的中文ELECTRA系列预训练模型再迎新成员

评论

小米与聚飞光电成立联合实验室

科大讯飞发布讯飞星火4.0 Turbo大模型及星火多语言大模型

华工科技联合哈工大实现国内首台激光智能除草机器人落地

荣耀与智谱携手共建AI大模型联合实验室

高鸿信安出席飞腾基础软件联合实验室第三届年会

MediaTek与小米集团联合实验室正式揭幕

【大语言模型：原理与工程实践】大语言模型的预训练

西井科技和香港理工大学签署合作协议，将共建联合创新实验室

AI+教育深圳市中小学联合实验室正式启用

谷歌模型训练软件有哪些功能和作用

科大讯飞发布“讯飞星火V3.5”：基于全国产算力训练的全民开放大模型

上海AI实验室发布新一代书生·视觉大模型

科大讯飞星火认知大模型V3.5发布

科大讯飞发布星火认知大模型V3.5

大模型讯飞星火V3.5，1月30日正式发布