OpenAI发布了一个“逆天”的AI模型——GPT2整个模型包含15亿个参数-电子发烧友网

上个月，OpenAI发布了一个“逆天”的AI模型——GPT2，整个模型包含15亿个参数。你给它一句话，它能给你编出一篇文章来。

OpenAI的研究主管Dario Amodei表示，GPT2是在一个包含大约1000万篇文章的数据集上进行培训的，比之前最先进的AI模型大12倍，数据集大15倍。

有这么厉害？看看他的实力水平不就知道了，OpenAI给出了这么一个开头：

在一项研究中，科学家们发现了一群独角兽，它们生活在安第斯山脉一个偏远的还没被开发山谷中，更令人惊讶的是这些独角兽会说一口流利的英语

就这么一句话，GPT-2能写出以下这么一大段故事：

因为它们独特的角，科学家们将他们命名为Ovid’s Unic orn，这些四角、银色角的独角兽是原来科学家所不曾见过的。

......中间还编写了，这些独角兽是如何被发现的，以及业内权威人士认为这些生物是如何出现的，最后还表明要验证这群独角兽是否为外星种族，唯一的方法可能就是通过DNA。

这一本正经的胡说八道，说的猿妹我都信以为真

能有这样出色的表现，不是没有原因的，GPT-2各种特定领域的语言建模任务中都取得了很好的分数。作为一个没有经过任何领域数据专门训练的模型，它的表现，比那些专为特定领域数据集（例如维基百科，新闻，书籍）上训练的模型。有图有真相：

除了能用于语言建模，GPT-2在问答、阅读理解、摘要生成、翻译等等任务上也都有非常好的成绩，openAI在博客上也给出了示例，感兴趣的可以前往查看（地址：https://blog.openai.com/better-language-models/）

除了以上提到的这些优异表现，最主要的是GPT-2还学习几种编程语言的语法模型，比如PHP和JavaScript。

它写出来的JavaScript长这样：

还有PHP语言：

就连Facebook AI研究院的Tim Rocktäschel看了GPT-2写出来的代码都表示：我们要有大麻烦了

话虽如此，该博客下面也有人表示其实，GPT-2写的代码不够严谨，容易把js、C++、Python等语言混为一谈。但实力依然不可小觑

目前，GPT-2已经在GitHub上获得4116个Star，674个Fork（地址：https://github.com/openai/gpt-2），喜欢的人可以尝试一下

不过，OpenAI 的研究人员们决定不发布训练模型的数据、也不发布最大那个模型预训练后的参数，因为他们认为如此强力的模型有遭到恶意滥用的风险。最后，你们如何看待这个项目呢？

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
32422

浏览量
271587
数据集

数据集

+关注

关注
4

文章
1212

浏览量
24989
独角兽

独角兽

+关注

关注
0

文章
191

浏览量
26641

原文标题：这个开源AI逆天了！编故事问答翻译样样行，最主要的是还会写代码

文章出处：【微信号：TheBigData1024，微信公众号：人工智能与大数据技术】欢迎添加关注！文章转载请注明出处。

【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

预训练语言模型。该模型最大的特点就是基于以较小的参数规模取得了优秀的性能，根据官网提供的信息，LLaMA的模型包含4

发表于 12-22 10:18

迄今最大模型？OpenAI发布参数量高达15亿的通用语言模型GPT-2

史上最强“通用”NLP模型来袭：今天OpenAI在官博介绍了他们训练的一个大规模无监督NLP模型

发表于 02-16 08:43 •4225次阅读

OpenAI发布一款令人印象深刻的语言模型GPT-2

今年2月，OpenAI发布了一款令人印象深刻的语言模型GPT

发表于 05-17 18:48 •4567次阅读

OpenAI宣布，发布了7.74亿参数GPT-2语言模型

就在本周，OpenAI宣布，发布了7.74亿参数GPT-2语言

发表于 09-01 09:10 •3098次阅读

谷歌训练开发一个万亿参数的AI语言模型

参数是机器学习算法的关键。它们是从历史训练数据中学到的模型的一部分。一般来说，在语言领域，参数的数量和复杂性之间的相关性非常好。例如，

发表于 01-18 16:19 •1896次阅读

谷歌开发出一个新的语言模型，包含了超过1．6万亿个参数

的AI模型GPT-3。GPT-3就是在570 GB的文本数据上训练的语言模型，因此，就训练数据和生成能力而言，

发表于 01-19 15:29 •1930次阅读

一个GPU训练一个130亿参数的模型

现在的模型动辄数百、数千亿参数，普通人训不动怎么办？前不久，谷歌发布了参数量为 1.6 万亿的语言模型

发表于 02-11 09:04 •2515次阅读

浪潮、英伟达微软相继发布2500亿、5300亿参数的巨量模型，超过GPT-3

Turing-NLG相继出现。 2020年6月OpenAI在发布了GPT-3，这是当时训练的最大模型，具有1750

发表于 10-18 14:41 •3676次阅读

ChatGPT升级　OpenAI史上最强大模型GPT-4发布

ChatGPT升级史上最强大模型GPT-4发布 OpenAI正式推出了ChatGPT升级版本，号称史上最强大模型

发表于 03-15 18:15 •2951次阅读

State of GPT：大神Andrej揭秘OpenAI大模型原理和训练过程

你可以看到，Llama 的参数数量大概是 650 亿。现在，尽管与 GPT3 的 1750 亿个参数

发表于 05-30 14:34 •1149次阅读

DeepSpeed结合Megatron-LM训练GPT2模型笔记

本文基于DeepSpeedExamples仓库中给出的Megatron相关例子探索一下训练GPT2模型的流程。主要包含3个部分，第

发表于 06-19 14:45 •3812次阅读

ChatGPT重磅更新　OpenAI发布GPT-4 Turbo模型价格大降2/3

ChatGPT重磅更新 OpenAI发布GPT-4 Turbo模型价格大降2/3 目前OpenAI

发表于 11-07 18:20 •2939次阅读

联发科天玑9300最高可运行330亿参数AI大模型

联发科天玑9300最高可运行330亿参数AI大模型联发科这个是要把AI大

发表于 11-07 19:00 •1818次阅读

人手一个的AI是如何诞生的?

2023年是AI大语言模型爆发的一年，以OpenAI推出的GPT大模型为起始，

发表于 07-23 10:33 •298次阅读

OpenAI即将推出GPT-5模型

OpenAI首席执行官奥尔特曼近日宣布了一项重要消息：OpenAI将在今年未来几个月内推出全新的GPT-5

发表于 02-13 11:21 •325次阅读