0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

史上最大AI模型GPT-3强势霸榜Github

人工智能与大数据技术 来源:开源最前线 作者:开源最前线 2021-01-06 17:06 次阅读

最近,GPT-3火了!相信你已经在网上看到各种有关GPT-3的演示。这个由OpenAI创建的大型机器学习模型,它不仅可以自己写论文,还会写诗歌,就连你写的代码都能帮你写了。 下面还是先让你看看GPT-3的威力吧,首先来看看GPT3在问答任务上的表现:

4139cfac-4ff9-11eb-8b86-12bb97331649.png

无论你的问题是天马行空的脑筋急转弯,还是有逻辑性极强的数学问题,它都能对答如流。 开发者Sharif Shameem用GPT-3做了一个生成器,你只要输入你所需的布局,它就能为你生成JSX代码。如下视频所示:

还有人在 Google 表格里开发了一个新的 GPT3 函数,除了简单的数学运算之外,它还可以自动查找美国各州的人口以及创建年份:

41764a68-4ff9-11eb-8b86-12bb97331649.png

除此之外,它还能查到Twitter账号:

41b126d8-4ff9-11eb-8b86-12bb97331649.png

遗憾的是,如果你想试用GPT-3,你得先拿到体验资格才行,但是此模型创建的应用程序似乎有无限可能,通过它你可以使用纯英语查询SQL数据库,自动注释代码,自动生成代码,编写热门文章标题,甚至帮助猿妹我写出一篇爆文。 GPT-3是什么? GPT-3是一种神经网络驱动的语言模型。与大多数语言模型一样,GPT-3在未标记的文本数据集上进行了大量的训练(训练数据包括Common Crawl和Wikipedia),从文本中随机删除单词或短语,并且模型必须学会仅使用周围的单词作为上下文来填充单词或短语。这是一个简单的培训任务,可以产生功能强大且可推广的模型。 GPT-3模型架构本身就是一个基于单向transformer语言模型。这种架构在2-3年前开始流行,流行的NLP模型BERT和GPT-3的前身GPT-2都是基于transformer构建。从架构的角度来看,GPT-3实际上并不是很新颖!

42265afc-4ff9-11eb-8b86-12bb97331649.jpg

它之所以会这么火,是因为GPT-3的模型尺寸增大到了1750亿,并且使用45TB数据进行训练,是有史以来创建的最大语言模型。源于它的参数模型巨大,因此可以完成许多其他模型无法完成的事情,就像前面所说的,你可以让它成为一名翻译家、作家、诗人、程序员等。 如果你对GPT-3的模型参数1750亿感到有些抽象,那么,我举个例子,你应该就懂了:

BERT模型有3亿参数

GPT-3模型的前身GPT-2有15亿个参数

英伟达的Megatron-BERT有80亿参数

微软Turing NLP,有170亿参数

就连排名第二的微软Turing NLP的数据参数和GPT-3都不是一个量级的。

值得一提的是,这次的GPT-3论文作者足足有31位,论文体量更是高达72页,网友都惊呼,现在PTM的工作是要开始pk论文页数了吗?

和往常一样,GPT-3立即放出了GitHub项目页面,你可以在上面找到各种各样有趣的demo,最后附上Github地址:https://github.com/openai/gpt-3。推荐↓↓↓

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30758

    浏览量

    268903
  • 机器学习
    +关注

    关注

    66

    文章

    8408

    浏览量

    132572

原文标题:敲代码、作诗、写论文无所不能!史上最大AI模型GPT-3强势霸榜Github

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI时代算力的重要性及现状:平衡发展与优化配置的挑战

    瓦时的电力。训练一次拥有1746亿参数的GPT-3模型,所需的算力更是高达3640PFlops,耗资466万美元。
    的头像 发表于 11-04 11:45 417次阅读

    GitHub Copilot引入多模型支持

    的对话中切换模型,以找到最适合特定任务的模型。 除了多模型支持外,GitHub还推出了Spark,这是一款用于构建网页应用的AI工具。
    的头像 发表于 10-31 11:49 502次阅读

    Llama 3 模型与其他AI工具对比

    Llama 3模型与其他AI工具的对比可以从多个维度进行,包括但不限于技术架构、性能表现、应用场景、定制化能力、开源与成本等方面。以下是对Llama 3
    的头像 发表于 10-27 14:37 372次阅读

    Llama 3GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama 3GPT-4作为两个备受瞩目的
    的头像 发表于 10-27 14:17 334次阅读

    英伟达预测机器人领域或迎“GPT-3时刻”

    未来2-3年内,机器人基础模型的研究将迎来重大突破,这一时刻被形象地比喻为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-20 17:05 791次阅读

    Jim Fan展望:机器人领域即将迎来GPT-3式突破

    英伟达科学家9月19日,科技媒体The Decoder发布了一则引人关注的报道,英伟达高级科学家Jim Fan在近期预测,机器人技术将在未来两到三年内迎来类似GPT-3在语言处理领域的革命性突破,他称之为机器人领域的“GPT-3时刻”。
    的头像 发表于 09-19 15:13 566次阅读

    GitHub推出GitHub Models服务,赋能开发者智能选择AI模型

    8月2日,全球领先的代码托管平台GitHub宣布了一项重大创新——GitHub Models服务的正式推出。该服务被定位为AI时代的工程师助手,旨在帮助全球超过1亿的GitHub用户轻
    的头像 发表于 08-02 15:39 576次阅读

    凯迪仕全渠道TOP1 ,全域曝光100亿!

    618年中狂欢盛典,已正式落下帷幕。智能锁行业领头羊凯迪仕,凭借过硬的科技产品力和品牌势能,在全域流量加持以及传奇大师K70新品强势曝光之下,天猫、京东、抖音各平台,稳居各类型榜单榜首,继续以
    的头像 发表于 06-21 20:10 310次阅读
    凯迪仕<b class='flag-5'>霸</b><b class='flag-5'>榜</b>全渠道TOP1 ,全域曝光100亿!

    为什么GPU适用于AIAI服务器产业链格局分析

    GPT模型对比BERT模型、T5模型的参数量有明显提升。GPT-3是目前最大的知名语言
    发表于 04-09 10:38 903次阅读
    为什么GPU适用于<b class='flag-5'>AI</b>?<b class='flag-5'>AI</b>服务器产业链格局分析

    AI新工具DUSt3R走红GitHub,两秒完成3D重建惊艳网友

    近日,一款名为DUSt3R的AI新工具在微软旗下的GitHub平台上引发了广泛关注。这款神奇的工具仅需两张图片和两秒钟的时间,便能完成精确的3D重建,且无需额外测量任何数据。上线不久,
    的头像 发表于 03-08 14:02 1163次阅读

    新火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    2024年第一季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。   3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,
    的头像 发表于 03-06 22:22 635次阅读
    新火种<b class='flag-5'>AI</b>|秒杀<b class='flag-5'>GPT</b>-4,狙杀<b class='flag-5'>GPT</b>-5,横空出世的Claude <b class='flag-5'>3</b>振奋人心!

    全球最强大模型易主,GPT-4被超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude
    的头像 发表于 03-05 09:58 648次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强
    的头像 发表于 03-05 09:49 680次阅读

    360集团和哪吒汽车合作 将共同发布NETA GPT模型

    360集团和哪吒汽车合作 将共同发布NETA GPT模型 3月1日,360集团与哪吒汽车签署战略合作协议,双方计划共同发布大模型产品NETA GP
    的头像 发表于 03-02 15:51 959次阅读

    Rambus HBM3内存控制器IP速率达到9.6 Gbps

    在人工智能大模型浪潮的推动下,AI训练数据集正极速扩增。以ChatGPT为例,去年11月发布的GPT-3,使用1750亿个参数构建,今年3月发布的G
    的头像 发表于 01-23 11:19 974次阅读
    Rambus HBM<b class='flag-5'>3</b>内存控制器IP速率达到9.6 Gbps