0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

到底该怎么将这些顶尖工具用到我的模型里呢?

DPVg_AI_era 来源:lq 2019-02-24 10:43 次阅读

NLP方向近日各种大神工具层出不穷。然而,实践才是硬道理,如何将它们应用到自己的模型是个关键问题。本文就对此问题进行了介绍。

近期的NLP方向,ELMO、GPT、BERT、Transformer-XL、GPT-2,各种预训练语言模型层出不穷,这些模型在各种NLP任务上一次又一次刷新上线,令人心驰神往。但是当小编翻开他们的paper,每一个上面都写着四个大字:“弱者退散”,到底该怎么将这些顶尖工具用到我的模型里呢?答案是Hugging Face的大神们开源的pytorch-pretrained-BERT。

Github 地址:

https://github.com/huggingface/pytorch-pretrained-BERT

模型简介

近期的各种预训练语言模型,横扫各种NLP任务,这里我们介绍三个最火的预训练模型:

BERT,由Google AI团队,发表于2018年10月11日。它的文章是:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding。

Transformer-XL, 由Google AI和Carnegie Mellon大学,发表于2019年1月9日。它的文章是:Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context。

GPT-2,由OpenAI 团队,发表于2019年2月14日,它的文章是:Language Models are Unsupervised Multitask Learners。

基本上,每一个文章,都在发表的时候,刷新当时的几乎所有NLP任务的State-of-the-Art,然后引发一波热潮。 当然,目前风头正盛的是GPT-2,它前几天刚发表。

开源实现

然而,让小编翻开他们的paper,发现每一个上面都写着四个大字:“弱者退散”,到底该怎么将这些顶尖工具用到我的模型里呢,Hugging Face 的大神们,紧跟前沿,将所有的预训练语言模型都实现并开源了。更令人钦佩的是,它们还做了很多封装,让大家都可以才在这些巨人模型的肩膀上。

Hugging Face开源的库叫pytorch-pretained-bert, 你可以在本文开头找到链接。接下来的部分,我们介绍一下它的安装和使用。

安装使用

你可以直接使用 Pip install 来安装它:

pip install pytorch-pretrained-bert

pytorch-pretrained-bert 内 BERT,GPT,Transformer-XL,GPT-2。

为了获取一句话的BERT表示,我们可以:

拿到表示之后,我们可以在后面,接上自己的模型,比如NER。

我们也可以获取GPT的表示:

Transformer-XL表示:

以及,非常火的,GPT-2的表示:

有了这些表示,我们可以在后面,接入自己的模型,比如:

文本分类

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_classifier.py

阅读理解

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_squad.py

语言模型

https://github.com/huggingface/pytorch-pretrained-BERT/blob/master/examples/run_lm_finetuning.py

等等

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3235

    浏览量

    42359
  • 语言模型
    +关注

    关注

    0

    文章

    502

    浏览量

    10241
  • nlp
    nlp
    +关注

    关注

    1

    文章

    486

    浏览量

    21995

原文标题:BERT、GPT-2这些顶尖工具到底该怎么用到我的模型里?

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    请问AIC3206的一阶滤波的频率到底怎么计算

    请问AIC3206的一阶滤波的频率到底怎么计算? N0缺省是0x7fffff,N1=0,D1=0.算下来H(z)=1.这代表什么意思?有没有什么
    发表于 10-29 08:29

    如何LCD运用到低通滤波电路

    本帖最后由 klysa 于 2011-11-2 17:28 编辑 如题如何LCD运用到低通滤波电路
    发表于 11-02 17:28

    ARM到底是什么啊!!!!我从何学起!怎么学

    ARM到底是什么啊!!!!我从何学起!怎么学!高手给指点指点吧{:soso_e154:}
    发表于 11-02 16:48

    这些仿真工具带有dsp模型

    里面有24的模型,如2407,相信还有人在学这款dsp。具体怎么使用我还没有学会。3、EasyEDA 国产的EDA软件,也是最近在论坛看到的,令我眼前一亮,试用了一下,不得不说真得不错的一个工具。它是
    发表于 06-09 16:12

    谁能帮我完成这些程序到我的dsPic模型

    不会按原样工作,所以我害怕开始修改它以适应我的dsPic模型。然后我试图编译“ex_app_led_blink”项目,结果得到以下错误:我的观点是,这个“简单”的设置远非易事。谁能帮我一步一步地完成这些程序到我的dsPic
    发表于 05-08 11:00

    无法获知TIVA到底有什么函数以及这些函数的用法?

    初学TIVA,有一个地方让我感到头疼,就是无法获知TIVA到底有什么函数以及这些函数的用法(不需要源代码,只想知道每一个函数的具体用途),不知道论坛的大神有没有相关的资源,可否发一
    发表于 08-26 08:34

    到底什么是密钥

    文章目录各种密钥总结其他密钥分类密钥的管理密钥详解在之前的文章中,我们讲到了对称密码,公钥密码,消息认证码和数字签名等密码学的技术,这些技术中都使用到了一个叫做密钥的东西。那么到底什么是密钥
    发表于 07-27 06:45

    到底怎么去学习单片机编程

    到底怎么去学习单片机编程
    发表于 10-26 07:20

    到底怎么去使用KEIL的这些调试方法

    为什么要虚拟串口,这里的虚拟串口又是什么意思?到底怎么去使用KEIL的这些调试方法
    发表于 12-21 07:20

    如何使用Paddle2ONNX模型转换工具飞桨模型转换为ONNX模型

    如何使用Paddle2ONNX模型转换工具飞桨模型转换为ONNX模型
    发表于 12-29 07:42

    Env工具到底是什么?怎样去使用Env工具

    是什么?我们对于 env 的印象就是下面这样一个黑黑的 shell 终端,那它到底是什么?其实就像我们想的那样,它本质上就是调用的 cmd 命令框,那也就是说明,这些一切都可以在 cmd 中完成,并不需要装
    发表于 06-24 11:31

    如何模型用到效能评估系统中去

    如何模型用到效能评估系统中去 智慧华盛恒辉效能评估系统大数据的应用效能评估系统及其评估方法,以应用基础数据和应用运行数据为基础,从数据开放集约能力、用户认可度、平安运行能力和运维保障支持四个
    的头像 发表于 09-27 16:16 495次阅读

    开源LLEMMA发布:超越未公开的顶尖模型,可直接应用于工具和定理证明

    但LLEMMA的出现改变了这一局面。它不仅在MATH基准测试上创下了新高,甚至超越了某些还未对外公开的顶尖模型,如Minerva。更让人欣喜的是,LLEMMA无需额外的调整,即可直接应用于工具和定理证明。
    的头像 发表于 10-22 10:24 709次阅读
    开源LLEMMA发布:超越未公开的<b class='flag-5'>顶尖</b><b class='flag-5'>模型</b>,可直接应用于<b class='flag-5'>工具</b>和定理证明

    如何Kafka使用到我们的后端设计中

    本文介绍了以下内容: 1.什么是Kafka? 2.为什么我们需要使用Kafka这样的消息系统及使用它的好处 3.如何Kafka使用到我们的后端设计中。 译自timber.io
    的头像 发表于 10-30 14:30 477次阅读
    如何<b class='flag-5'>将</b>Kafka使<b class='flag-5'>用到我</b>们的后端设计中

    电流探头的带宽到底如何选择

    电流探头的带宽到底如何选择? 电流探头的带宽选择对于仪器的测量精度和信号质量至关重要。带宽是指电流探头能够有效传输的频率范围。因此,正确选择电流探头的带宽对于准确测量电流信号是至关重要的。 首先
    的头像 发表于 01-08 16:09 1638次阅读