0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

OpenAI发布了一个“逆天”的AI模型——GPT2整个模型包含15亿个参数

电子工程师 来源:lp 2019-03-07 14:45 次阅读

上个月,OpenAI发布了一个“逆天”的AI模型——GPT2,整个模型包含15亿个参数。你给它一句话,它能给你编出一篇文章来。

OpenAI的研究主管Dario Amodei表示,GPT2是在一个包含大约1000万篇文章的数据集上进行培训的,比之前最先进的AI模型大12倍,数据集大15倍。

有这么厉害?看看他的实力水平不就知道了,OpenAI给出了这么一个开头:

在一项研究中,科学家们发现了一群独角兽,它们生活在安第斯山脉一个偏远的还没被开发山谷中,更令人惊讶的是这些独角兽会说一口流利的英语

就这么一句话,GPT-2能写出以下这么一大段故事:

因为它们独特的角,科学家们将他们命名为Ovid’s Unicorn,这些四角、银色角的独角兽是原来科学家所不曾见过的。

......中间还编写了,这些独角兽是如何被发现的,以及业内权威人士认为这些生物是如何出现的,最后还表明要验证这群独角兽是否为外星种族,唯一的方法可能就是通过DNA。

这一本正经的胡说八道,说的猿妹我都信以为真

能有这样出色的表现,不是没有原因的,GPT-2各种特定领域的语言建模任务中都取得了很好的分数。作为一个没有经过任何领域数据专门训练的模型,它的表现,比那些专为特定领域数据集(例如维基百科,新闻,书籍)上训练的模型。有图有真相:

除了能用于语言建模,GPT-2在问答、阅读理解、摘要生成、翻译等等任务上也都有非常好的成绩,openAI在博客上也给出了示例,感兴趣的可以前往查看(地址:https://blog.openai.com/better-language-models/)

除了以上提到的这些优异表现,最主要的是GPT-2还学习几种编程语言的语法模型,比如PHP和JavaScript。

它写出来的JavaScript长这样:

还有PHP语言:

就连Facebook AI研究院的Tim Rocktäschel看了GPT-2写出来的代码都表示:我们要有大麻烦了

话虽如此,该博客下面也有人表示其实,GPT-2写的代码不够严谨,容易把js、C++Python等语言混为一谈。但实力依然不可小觑

目前,GPT-2已经在GitHub上获得4116个Star,674个Fork(地址:https://github.com/openai/gpt-2),喜欢的人可以尝试一下

不过,OpenAI 的研究人员们决定不发布训练模型的数据、也不发布最大那个模型预训练后的参数,因为他们认为如此强力的模型有遭到恶意滥用的风险。最后,你们如何看待这个项目呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31493

    浏览量

    270097
  • 数据集
    +关注

    关注

    4

    文章

    1209

    浏览量

    24802
  • 独角兽
    +关注

    关注

    0

    文章

    189

    浏览量

    26573

原文标题:这个开源AI逆天了!编故事问答翻译样样行,最主要的是还会写代码

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能,根据官网提供的信息,LLaMA的模型包含4
    发表于 12-22 10:18

    迄今最大模型OpenAI发布参数量高达15亿的通用语言模型GPT-2

    史上最强“通用”NLP模型来袭:今天OpenAI在官博介绍他们训练的大规模无监督NLP模型
    的头像 发表于 02-16 08:43 4148次阅读

    OpenAI发布款令人印象深刻的语言模型GPT-2

    今年2月,OpenAI发布款令人印象深刻的语言模型GPT
    的头像 发表于 05-17 18:48 4511次阅读

    OpenAI宣布,发布7.74亿参数GPT-2语言模型

    就在本周,OpenAI宣布,发布7.74亿参数GPT-2语言
    的头像 发表于 09-01 09:10 3043次阅读

    谷歌训练开发万亿参数AI语言模型

    参数是机器学习算法的关键。它们是从历史训练数据中学到的模型部分。般来说,在语言领域,参数的数量和复杂性之间的相关性非常好。例如,
    的头像 发表于 01-18 16:19 1859次阅读

    谷歌推出1.6万亿参数的人工智能语言模型,打破GPT-3记录

      古谚道:“熟读唐诗三百首,不会作诗也会吟。” 这句话放在目前的人工智能语言模型中也非常适用。 此前,OpenAI 的研究人员开发出 “GPT-3”,这是
    的头像 发表于 01-18 17:16 2339次阅读

    谷歌开发出新的语言模型包含了超过1.6万亿参数

    AI模型GPT-3。GPT-3就是在570 GB的文本数据上训练的语言模型,因此,就训练数据和生成能力而言,
    的头像 发表于 01-19 15:29 1906次阅读

    GPU训练130亿参数模型

    现在的模型动辄数百、数千亿参数,普通人训不动怎么办? 前不久,谷歌发布参数量为 1.6 万亿的语言模型
    的头像 发表于 02-11 09:04 2472次阅读
    <b class='flag-5'>一</b><b class='flag-5'>个</b>GPU训练<b class='flag-5'>一</b><b class='flag-5'>个</b>130<b class='flag-5'>亿</b><b class='flag-5'>参数</b>的<b class='flag-5'>模型</b>

    浪潮、英伟达微软相继发布2500亿、5300亿参数的巨量模型,超过GPT-3

    Turing-NLG相继出现。   2020年6月OpenAI发布GPT-3,这是当时训练的最大模型,具有1750
    的头像 发表于 10-18 14:41 3597次阅读
    浪潮、英伟达微软相继<b class='flag-5'>发布</b>2500<b class='flag-5'>亿</b>、5300<b class='flag-5'>亿</b><b class='flag-5'>参数</b>的巨量<b class='flag-5'>模型</b>,超过<b class='flag-5'>GPT</b>-3

    ChatGPT升级 OpenAI史上最强大模型GPT-4发布

    ChatGPT升级 史上最强大模型GPT-4发布 OpenAI正式推出了ChatGPT升级版本,号称史上最强大模型
    的头像 发表于 03-15 18:15 2855次阅读

    State of GPT:大神Andrej揭秘OpenAI模型原理和训练过程

    你可以看到,Llama 的参数数量大概是 650 亿。现在,尽管与 GPT3 的 1750 亿参数
    的头像 发表于 05-30 14:34 1100次阅读
    State of <b class='flag-5'>GPT</b>:大神Andrej揭秘<b class='flag-5'>OpenAI</b>大<b class='flag-5'>模型</b>原理和训练过程

    DeepSpeed结合Megatron-LM训练GPT2模型笔记

    本文基于DeepSpeedExamples仓库中给出的Megatron相关例子探索下训练GPT2模型的流程。主要包含3部分,第
    的头像 发表于 06-19 14:45 3618次阅读
    DeepSpeed结合Megatron-LM训练<b class='flag-5'>GPT2</b><b class='flag-5'>模型</b>笔记

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3

    ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI
    的头像 发表于 11-07 18:20 2853次阅读
    ChatGPT重磅更新 <b class='flag-5'>OpenAI</b><b class='flag-5'>发布</b><b class='flag-5'>GPT</b>-4 Turbo<b class='flag-5'>模型</b>价格大降<b class='flag-5'>2</b>/3

    联发科玑9300最高可运行330亿参数AI模型

    联发科玑9300最高可运行330亿参数AI模型 联发科这个是要把AI
    的头像 发表于 11-07 19:00 1763次阅读

    人手AI是如何诞生的?

    2023年是AI大语言模型爆发的年,以OpenAI推出的GPT模型为起始,
    的头像 发表于 07-23 10:33 259次阅读