0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

新火种AI|马斯克又一大动作!Grok-1.5性能超越GPT-4,AI反击战打响?

新火种 来源:新火种 作者:新火种 2024-04-02 18:20 次阅读

作者:文子

编辑:小迪

马斯克又一大招,直逼OpenAI

wKgaomYGwn6AWq_fAAFlRYUDpxk772.jpg

Grok-1.5突然发布,挑战“劲敌”GPT-4

继一周前开源GroK-1后,马斯克又有了新动作,再一次剑指OpenAI。

3月29日,马斯克旗下xAI团队突然对外发布Grok-1.5大模型,主打就是一个“字少事大”。而这一次的动作,明摆着也是冲着GPT-4去的。

wKgZomYGwn6AJzc_AADNTwtMznk719.jpg

从Grok-1.5的基准测试结果来看,各项能力都有巨大的飞跃。其中最明显的改进之一就是在代码和数学相关方面的性能,尤其是涵盖了从小学到高中的各种竞赛问题。

比如在MATH基准测试中,Grok-1.5就取得50.6%的得分;在GSM8K基准测试中,Grok-1.5更获得90%的得分。

而在评估代码生成和解决问题能力的HumanEval基准测试中,Grok-1.5更是超越了GPT-4,得分高达74.1%,同时碾压了一众热门的开源模型 Mistral Large、Claude 2等等。

wKgaomYGwn-ACFdaAACJcF_ryjA170.jpg

另一个重要升级之一就是Grok-1.5改进了推理能力,从原先的24 %提升至50%。该模型现在能够在上下文窗口中处理高达128K token的长文本,这相当于一部中篇小说的篇幅。这一改进使得Grok的处理能力达到了之前上下文长度的16倍,进而能够充分利用长文档中的信息

此外,Grok-1.5模型还具备处理更长且更复杂的指令的能力,即便在上下文窗口扩大时,也能保持良好的指令遵循性。

无独有偶,在Needle In A Haystack(NIAH)评估中,Grok-1.5还展现出了强大的信息检索技能,能够在一个包含128K字节的上下文中准确检索到嵌入的文本,并实现了完美的检索结果。

wKgZomYGwn-ALkNUAACFRCoIHMo462.jpg

根据xAI官方的介绍,Grok-1.5是基于JAX、Rust和Kubernetes构建的定制分布式训练框架之上。在大型计算集群中,维持大规模语言模型(LLMs)训练作业的稳定性和持续性是关键的挑战之一。xAI团队开发的专属训练协调器,具备自动识别并隔离训练过程中出现的故障节点的先进能力。

此外,xAI团队还对检查点的创建、数据加载以及训练作业的重启流程进行了优化,以降低故障带来的停机时间。

在未来几日内,Grok-1.5将向早期测试者和平台用户开放。随着Grok-1.5逐渐普及至更广泛的用户群体,预计还将推出多项新功能。

全面对战OpenAI,Grok-1.5开源成谜

要知道,这次Grok-1.5发布前,马斯克因为起诉了OpenAI不开源,所以选择开源了3140 亿参数的模型Grok-1,也是截至目前参数量最大的开源大语言模型,规模相当于 Meta LlaMA 2 70B的4.4倍。

其实抛开马斯克本身与OpenAI的恩怨情仇不讲,Grok的开源决策并非仓促决定,而是经过深思熟虑。

表面上看Grok占据着X平台资源优势和马斯克的影响力加持,但在大模型大爆发的当下,却并没有在大模型的“军备竞赛”中有太多竞争优势。

wKgaomYGwn-Abeq1AAA-fnNEOCY033.jpg

特别是自2024年以来,Gemini、Claude 3等模型的发布,它们的能力已经接近甚至超越了GPT-4,这三个模型基本上确立了行业的第一梯队。再加上Mistral AI和Inflection AI也在积极追赶,大模型的“虹吸效应”愈发显著,留给马斯克和Grok的时间已经不多了。

在这种形势下,如果Grok坚持闭源开发的路线,它很可能会像之前诺基亚的Symbian系统一样,被淘汰只是时间问题。这样的结果不仅无法帮助马斯克将X平台商业化,还会成为一种昂贵的沉没成本。

wKgZomYGwoCADAwbAAC09B24yig697.jpg

因此,摆在马斯克面前的只剩下一条路,就是破釜沉舟用“开源”为Grok杀出一条血路。

月之暗面CEO杨植麟就曾表示,“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

wKgaomYGwoCALJ9cAAKuz_LseiE904.jpg

而Grok-1自开源5天后,在开源社区GitHub就获得了高达4.2万人的收藏,可见马斯克这一步棋下的赢了民心。

所以哪怕目前Grok 团队并未表示Grok-1.5是否开源,但有Grok-1打了头阵,再加上马斯克和OpenAI的官司,Grok-1.5大概率是要开源的,也就是时间长短的问题。

“all in”和混战,AI反击战打响

如果用一句话来形容现在的AI领域,就是一群疯子在“ALL IN”和混战。全球主流大模型间的比拼,仍没有减慢的迹象。大家你出你的牌,我出我的牌。

在这场混战之中,从马斯克批判GPT背后的大模型滥用会引发人类危机,到亲自下场参与大模型的开发,再到开源Grok-1,这种反差的背后更多不是技术和理念差异,而是商业利益和政治风向的变化。

马斯克的目的也非常明确,就是和OpenAI硬刚到底,推出能够匹敌ChatGPT的产品

毕竟一旦GPT-4成功跃进到GPT-5,其他AIGC工具也会跟着实现爆发式增长,而这一切都将会大幅抹去X计划中的AI部分,到时马斯克整个商业帝国的基石就会受到严重侵蚀。这种结果对马斯克而言无论是商业考量还是个人心理层面都无法接受,也促使他立马发布了现在的Grok-1.5。

在xAI的官网里也可以看到马斯克的初创团队拥有12名核心成员,其中4名是华人。团队成员曾在人工智能领域的其他知名公司工作过,包括OpenAI、谷歌研究院、微软研究院和最近并入谷歌的DeepMind,也有来自多伦多大学的AI领域顶级学者。

目前xAI也同步开启了招人计划,招揽AI相关的技术人才加入。

wKgaomYGwoGATjfzAABgMfC_nzA606.jpg

其实不止马斯克在加紧脚步,被马斯克视作“宿敌”的OpenAI也在紧锣密鼓的研发大模型。就在最近,有微软工程师爆料,10万个H100基建正在紧锣密鼓地建设中,目的就是为了训练GPT-6。

同时,一张名为“OpenAI内部时间线”的图片也在网上疯传,里面清晰地标注出,OpenAI早在2022年8月-10月之间就开始了GPT-5的训练,在2023年4月就已经开始训练了GPT-4.5,而在去年9月就开始了GPT-6的测试。

wKgZomYGwoKAbTGgAAEXzy5ssFE480.jpg

所以无论消息是真是假,但有一点不可否认,马斯克和OpenAI这场战争似乎看不到终点。

而马斯克的2024年,还有好几场硬仗要打。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267904
  • GPT
    GPT
    +关注

    关注

    0

    文章

    351

    浏览量

    15266
  • 马斯克
    +关注

    关注

    1

    文章

    797

    浏览量

    21257
  • OpenAI
    +关注

    关注

    9

    文章

    1027

    浏览量

    6374
收藏 人收藏

    评论

    相关推荐

    马斯克旗下xAI对Grok-2-mini进行速度升级

    科技巨头马斯克旗下的xAI公司近日宣布了项重大进展,其热门语言模型Grok-2-mini成功完成了速度升级。
    的头像 发表于 08-27 15:28 326次阅读

    马斯克旗下AI初创公司发布Grok-2聊天机器人

    埃隆·马斯克麾下的创新AI企业xAI今日震撼发布了其最新力作——Grok-2聊天机器人,该产品在性能上自信地宣称已能与业界巨头OpenAI、谷歌及Anthropic的顶尖产品并驾齐驱。
    的头像 发表于 08-15 16:05 592次阅读

    马斯克自曝Grok 2将于下月上线!Grok 3也在加紧训练中

    马斯克连发两条推文为xAI造势!8月发布Grok 2,年底将推出Grok 3...
    的头像 发表于 07-05 15:45 275次阅读
    <b class='flag-5'>马斯克</b>自曝<b class='flag-5'>Grok</b> 2将于下月上线!<b class='flag-5'>Grok</b> 3也在加紧训练中

    马斯克自曝训练Grok 3用了10万块NVIDIA H100

    在科技界的前沿阵地上,埃隆·马斯克再次以其前瞻性的视野和大胆的尝试引领着新的风潮。近日,马斯克在社交媒体X上的则回应,不经意间透露了其即将推出的AI聊天机器人
    的头像 发表于 07-03 14:16 417次阅读

    马斯克预告:xAI Grok-2大语言模型八月亮相

    特斯拉及SpaceX的传奇人物埃隆·马斯克近日在其社交媒体平台X(推特)上宣布了项令人瞩目的消息:其人工智能初创企业xAI即将在八月推出其最新力作——Grok-2大语言模型。这预告
    的头像 发表于 07-02 10:49 510次阅读

    xAI加速人工智能步伐,Grok系列大模型即将迎来重大更新

    在人工智能领域,家由埃隆·马斯克创立并领导的创新公司xAI正以前所未有的速度推动着技术的边界。据国外媒体最新报道,继今年3月推出的Grok-1.54月的
    的头像 发表于 07-01 16:11 374次阅读

    马斯克旗下xAI计划大举投资AI芯片

    特斯拉CEO马斯克最近宣布,其旗下的人工智能初创公司xAI计划斥资至少90亿美元购买30万块英伟达B200 AI芯片。这举措再次凸显了马斯克在人工智能领域的雄心壮志。
    的头像 发表于 06-05 09:33 387次阅读

    火种AI|秒杀GPT-4,狙杀GPT-5,横空出世的Claude 3振奋人心!

    2024年第季度才刚过半,AI领域就大动作不断,大家卯着劲的出新品,可谓卷出天际。   3月4日,Anthropic发布了最新的Claude 3系列模型,用Anthropic的话说,
    的头像 发表于 03-06 22:22 573次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|秒杀<b class='flag-5'>GPT-4</b>,狙杀<b class='flag-5'>GPT</b>-5,横空出世的Claude 3振奋人心!

    全球最强大模型易主,GPT-4超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所
    的头像 发表于 03-05 09:58 594次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强AI模型的GPT-4
    的头像 发表于 03-05 09:49 606次阅读

    马斯克:AI发展速度前所未见 但马斯克起诉OpenAI及其创始人

    马斯克AI发展速度前所未见  现在市场上对于任何OpenAI的消息都非常敏感,我们分享一下马斯克对OpenAI起诉的些事项。 马斯克在日
    的头像 发表于 03-02 15:29 1189次阅读

    Grok即将上线!马斯克据此成为“数据封建王”?

    马斯克背刺Open AI,即将成为“数据封建主”?
    的头像 发表于 12-12 10:18 541次阅读
    <b class='flag-5'>Grok</b>即将上线!<b class='flag-5'>马斯克</b>据此成为“数据封建王”?

    火种AI|谷歌深夜发布复仇神器Gemini,原生多模态碾压GPT-4

    谷歌背水一战,发布Gemini,狙击GPT-4
    的头像 发表于 12-08 09:09 1075次阅读
    新<b class='flag-5'>火种</b><b class='flag-5'>AI</b>|谷歌深夜发布复仇神器Gemini,原生多模态碾压<b class='flag-5'>GPT-4</b>?

    马斯克称人工智能比核弹危险 需要全球合作的组织来监管AI

    马斯克又开始放嘴炮了吗?马斯克称人工智能比核弹危险;马斯克直深度关注人工智能的发展,并警告隐性风险,着重提示应该对人工智能实施某种监管。 马斯克
    的头像 发表于 12-01 19:23 477次阅读

    马斯克发布AI大模型Grok:挑战ChatGPT,X平台将搭载

    马斯克表示,Grok可以挑战chatgpt 3.5,并且在许多标准测试中,试制品做得更好。grok是利用x平台(旧twitter)的数据开发的,将对少数用户进行测试,并以每月16美元的价格向x premium +用户开放。
    的头像 发表于 11-06 14:29 747次阅读