0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

史上最大AI模型GPT-3强势霸榜Github

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2021-01-06 17:06 次阅读

最近,GPT-3火了!相信你已经在网上看到各种有关GPT-3的演示。这个由OpenAI创建的大型机器学习模型,它不仅可以自己写论文,还会写诗歌,就连你写的代码都能帮你写了。 下面还是先让你看看GPT-3的威力吧,首先来看看GPT3在问答任务上的表现:

4139cfac-4ff9-11eb-8b86-12bb97331649.png

无论你的问题是天马行空的脑筋急转弯,还是有逻辑性极强的数学问题,它都能对答如流。 开发者Sharif Shameem用GPT-3做了一个生成器,你只要输入你所需的布局,它就能为你生成JSX代码。如下视频所示:

还有人在 Google 表格里开发了一个新的 GPT3 函数,除了简单的数学运算之外,它还可以自动查找美国各州的人口以及创建年份:

41764a68-4ff9-11eb-8b86-12bb97331649.png

除此之外,它还能查到Twitter账号:

41b126d8-4ff9-11eb-8b86-12bb97331649.png

遗憾的是,如果你想试用GPT-3,你得先拿到体验资格才行,但是此模型创建的应用程序似乎有无限可能,通过它你可以使用纯英语查询SQL数据库,自动注释代码,自动生成代码,编写热门文章标题,甚至帮助猿妹我写出一篇爆文。 GPT-3是什么? GPT-3是一种神经网络驱动的语言模型。与大多数语言模型一样,GPT-3在未标记的文本数据集上进行了大量的训练(训练数据包括Common Crawl和Wikipedia),从文本中随机删除单词或短语,并且模型必须学会仅使用周围的单词作为上下文来填充单词或短语。这是一个简单的培训任务,可以产生功能强大且可推广的模型。 GPT-3模型架构本身就是一个基于单向transformer语言模型。这种架构在2-3年前开始流行,流行的NLP模型BERT和GPT-3的前身GPT-2都是基于transformer构建。从架构的角度来看,GPT-3实际上并不是很新颖!

42265afc-4ff9-11eb-8b86-12bb97331649.jpg

它之所以会这么火,是因为GPT-3的模型尺寸增大到了1750亿,并且使用45TB数据进行训练,是有史以来创建的最大语言模型。源于它的参数模型巨大,因此可以完成许多其他模型无法完成的事情,就像前面所说的,你可以让它成为一名翻译家、作家、诗人、程序员等。 如果你对GPT-3的模型参数1750亿感到有些抽象,那么,我举个例子,你应该就懂了:

BERT模型有3亿参数

GPT-3模型的前身GPT-2有15亿个参数

英伟达的Megatron-BERT有80亿参数

微软Turing NLP,有170亿参数

就连排名第二的微软Turing NLP的数据参数和GPT-3都不是一个量级的。

值得一提的是,这次的GPT-3论文作者足足有31位,论文体量更是高达72页,网友都惊呼,现在PTM的工作是要开始pk论文页数了吗?

和往常一样,GPT-3立即放出了GitHub项目页面,你可以在上面找到各种各样有趣的demo,最后附上Github地址:https://github.com/openai/gpt-3。推荐↓↓↓

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268360
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI时代算力的重要性及现状:平衡发展与优化配置的挑战

    瓦时的电力。训练一次拥有1746亿参数的GPT-3模型,所需的算力更是高达3640PFlops,耗资466万美元。
    的头像 发表于 11-04 11:45 293次阅读

    GitHub Copilot引入多模型支持

    的对话中切换模型,以找到最适合特定任务的模型。 除了多模型支持外,GitHub还推出了Spark,这是一款用于构建网页应用的AI工具。
    的头像 发表于 10-31 11:49 438次阅读

    英伟达预测机器人领域或迎“GPT-3时刻”

    未来2-3年内,机器人基础模型的研究将迎来重大突破,这一时刻被形象地比喻为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-20 17:05 751次阅读

    Jim Fan展望:机器人领域即将迎来GPT-3式突破

    英伟达科学家9月19日,科技媒体The Decoder发布了一则引人关注的报道,英伟达高级科学家Jim Fan在近期预测,机器人技术将在未来两到三年内迎来类似GPT-3在语言处理领域的革命性突破,他称之为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-19 15:13 524次阅读

    GitHub推出GitHub Models服务,赋能开发者智能选择AI模型

    8月2日,全球领先的代码托管平台GitHub宣布了一项重大创新——GitHub Models服务的正式推出。该服务被定位为AI时代的工程师助手,旨在帮助全球超过1亿的GitHub用户轻
    的头像 发表于 08-02 15:39 518次阅读

    凯迪仕全渠道TOP1 ,全域曝光100亿!

    618年中狂欢盛典,已正式落下帷幕。智能锁行业领头羊凯迪仕,凭借过硬的科技产品力和品牌势能,在全域流量加持以及传奇大师K70新品强势曝光之下,天猫、京东、抖音各平台,稳居各类型榜单榜首,继续以
    的头像 发表于 06-21 20:10 286次阅读
    凯迪仕<b class='flag-5'>霸</b><b class='flag-5'>榜</b>全渠道TOP1 ,全域曝光100亿!

    为什么GPU适用于AIAI服务器产业链格局分析

    GPT模型对比BERT模型、T5模型的参数量有明显提升。GPT-3是目前最大的知名语言
    发表于 04-09 10:38 827次阅读
    为什么GPU适用于<b class='flag-5'>AI</b>?<b class='flag-5'>AI</b>服务器产业链格局分析

    AI新工具DUSt3R走红GitHub,两秒完成3D重建惊艳网友

    近日,一款名为DUSt3R的AI新工具在微软旗下的GitHub平台上引发了广泛关注。这款神奇的工具仅需两张图片和两秒钟的时间,便能完成精确的3D重建,且无需额外测量任何数据。上线不久,
    的头像 发表于 03-08 14:02 1093次阅读

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    2024年第一季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。   3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,
    的头像 发表于 03-06 22:22 593次阅读
    新火种<b class='flag-5'>AI</b>|秒杀<b class='flag-5'>GPT</b>-4,狙杀<b class='flag-5'>GPT</b>-5,横空出世的Claude <b class='flag-5'>3</b>振奋人心!

    全球最强大模型易主,GPT-4被超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude
    的头像 发表于 03-05 09:58 618次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强
    的头像 发表于 03-05 09:49 635次阅读

    Rambus HBM3内存控制器IP速率达到9.6 Gbps

    在人工智能大模型浪潮的推动下,AI训练数据集正极速扩增。以ChatGPT为例,去年11月发布的GPT-3,使用1750亿个参数构建,今年3月发布的G
    的头像 发表于 01-23 11:19 918次阅读
    Rambus HBM<b class='flag-5'>3</b>内存控制器IP速率达到9.6 Gbps

    【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B

    和1750亿参数的GPT-3都是非常由有竞争力的 MetaAI研究人员认为,当前大模型的高成本阻碍了学术研究,因此,开发出这个更小更强的模型将有利于学术研究的发展。使用较少参数的模型
    发表于 12-22 10:18

    大语言模型简介:基于大语言模型模型全家桶Amazon Bedrock

    本文基于亚马逊云科技推出的大语言模型与生成式AI的全家桶:Bedrock对大语言模型进行介绍。大语言模型指的是具有数十亿参数(B+)的预训练语言模型
    的头像 发表于 12-04 15:51 744次阅读

    LLM真的能推理和规划吗?

    在研究人员选择的模型中,GPT-3 davinci(非指令微调)、GPT-3 textdavinci-001(指令微调)和GPT-3 textdavinci-003(InstructG
    发表于 11-30 09:45 628次阅读
    LLM真的能推理和规划吗?