经常会收到一些比较简要的技术咨询,描述了是什么任务,发现用BERT粗暴精调效果不好之后,问我有什么办法可以提升。
在面对第一把梭就失败时,我通常是这么判断的:
- 如果效果差的很离谱,比如二分类准确率在60%以下,那大概率是模型有问题,开始用小数据集debug
- 如果有点效果,但一言难尽,那估计是数据有问题,要不然噪声多,要不然是真的难,可以自己看一下训练集,如果人看完后在几秒内都不能给出答案,就别太指望模型可以做好
在第一把效果还行的情况下,推荐尝试以下策略:
- In-Domain Further Pre-train:利用同领域下的无监督数据继续MLM预训练,这个方法我真的百试不厌,一般用一两百万的数据就能提升1-2个点
- Within-Task Further Pre-Training:利用不同领域的同任务数据预先精调,选通用一些的一般也有提升
- Multi-Task Fine-Tuning:利用不同任务预先精调
- Layer-wise Decreasing Layer Rate:每层学到的知识都是不同的,前面几层会更通用,所以学的时候可以用小一点的学习率,防止灾难性遗忘
- Features from Different layers:把不同层的输出集成起来,不过这个方法不一定有提升
- 长文本处理:截断或使用层次化编码
以上这些方法,都出自复旦邱锡鹏老师的《How to fine-tune BERT for text classification?》,该文进行了各种详细的实验,得出了不少有用的结论,推荐大家去学习。即使有的方法在论文数据集中表现一般,在自己的数据上也可以尝试。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
数据集
+关注
关注
4文章
1205浏览量
24641 -
DEBUG
+关注
关注
3文章
89浏览量
19883 -
nlp
+关注
关注
1文章
487浏览量
22011
发布评论请先 登录
相关推荐
保持电容性负载稳定的六种方法
本帖最后由 gk320830 于 2015-3-8 23:36 编辑
保持电容性负载稳定的六种方法本系列的第10部分是我们所熟悉的《电气工程》杂志(Electrical Engineering
发表于 09-25 09:31
linux下查看网卡流量的六种方法
本文介绍了linux下查看网卡流量的六种方法,linux系统中使用nload、iftop、iostat等工具查看网卡流量,需要的朋友参考下。
发表于 07-25 06:29
六种常见的伺服电机故障以及相对应的电机维修方法
论是哪种伺服电机,使用时间久了,都会产生一些小问题,那今天就给大家带来的是六种常见的电机故障表现。当伺服电机出现小问题,不仅要及时检测出来,而且要找到产生这些故障的原因,伺服电机电机维修师才能对症下药,才可以修理好伺服电机。以下是六种常见的伺服电机故障以及相对应的电机维修
发表于 02-01 06:29
个人制作电路板的六种方法及操作步骤
本文主要介绍了个人制作电路板的六种方法及详细操作步骤。根据电路原理图中所用的元件形状和印刷板面积的大小合理安排元件的密度和各元件的位置。确定元件位置应按照先大后小、先整体后局部的原则进行,使电路中相邻元件就近放置,排列整齐均匀。
发表于 04-25 16:15
•7.1w次阅读
PCB溶液浓度的六种计算方法
在PCB生产过程中,很多工序要用到各种溶液,往往这些溶液对PCB板的产品质量起到决定性的作用。精确的计算好各种溶液的浓度才能确保各种溶液在工艺中起到它应有的作用。下面介绍六种计算方法。
手机NFC的六种实用用法
每当新机发布时,相信不少小伙伴除了会关注手机的性能、拍照、续航、价格之外,而且还会关注手机是否还带NFC功能。随着科技发展,现在手机里的NFC功能已经多达六种了,接下来笔者就来告诉大家NFC究竟那六种实用的用法。
导致开关电源啸叫的六种情况及解决方法
导致开关电源啸叫的六种情况及解决方法(深圳市中远通电源技术开发有限公司怎么样)-导致开关电源啸叫的六种情况及解决方法
发表于 09-24 17:14
•58次下载
测电阻的六种方法 电阻测试方法 电阻好坏测量方法
测电阻的六种方法 电阻测试方法 电阻好坏测量方法 电阻是一种常见的电子元件,它的作用是限制电流的流动,从而保护电路以及电子元器件。在实际中,电阻由于长时间的使用或是外力的损坏,很容易失
抑制电磁干扰的六种常用方法
抑制电磁干扰的六种常用方法 电磁干扰(EMI)是现代电子设备中最常见的问题之一。随着无线技术和电子设备的不断发展,电磁干扰问题变得越来越普遍和严重。电磁干扰会影响到电子设备的性能,甚至可能导致设备
评论