0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT迎重磅升级 算力需求喷发可期

科创板日报 来源:科创板日报 2023-09-27 17:11 次阅读

最新的ChatGPT能讲故事、进行语音对话,还会看图。OpenAI将能看图的模型称作GPT-4V(ision),还测试了GPT-4V的验证码破解及地理定位能力。语音与图像数据大小显著高于文本,券商指出,多模态大模型的训练推理算力需求将大幅攀升。

当地时间25日,OpenAI宣布ChatGPT迎来重磅更新:这个聊天机器人如今“会看、会说、会听”——换言之,ChatGPT加入了语音与图像功能。未来两周内,Plus用户与企业用户便能体验新功能,开发人员等其他用户群体也有望在不久的将来体验。

其中,最受外界关注的是ChatGPT的图像理解能力。据介绍,用户可以向ChatGPT展示一张或多张图片,排查为何烧烤炉无法启动,检查冰箱里的菜能做什么美食,或分析复杂图表得出数据。若想让ChatGPT关注图片中的特定部分,还可以使用APP中的绘图工具高亮标注。

在OpenAI给出的示例视频中可以看到,当用户向ChatGPT发送一张自行车照片、询问如何调低车垫时,ChatGPT不仅会自发观察自行车型号、辨认零部件、给出详细步骤,还会看说明书,并分辨用户现有工具能否完成这项工作。

3ce97d30-5c71-11ee-939d-92fbcf53809c.gif

值得注意的是,同日发布的一篇论文中,OpenAI将这一能看图的模型称作GPT-4V(ision)。该模型在2022年已完成训练,之后在2023年早些时候开始早期测试访问。

借助GPT-4V,今年3月OpenAI与Be My Eyes组织合作开发Be My AI,可为盲人与视力障碍人士描述外界世界。测试表明,Be My AI可为50万盲人和视力障碍用户提供工具,满足他们在信息、文化和就业方面的需求。

另外,OpenAI还测试了GPT-4V的验证码破解及地理定位能力,前者表明模型具备解决谜题与执行复杂视觉推理任务的能力,后者则展现出了模型在搜索物品/地点的用处。但这两项功能将涉及网络安全及隐私问题。

至于本次更新的另一语音识别与生成功能,OpenAI表示,用户可以用这一功能为孩子讲述睡前故事,还可以在吵架时作为帮手。

OpenAI与专业配音演员合作,提供了5种不同的声音。另外,公司还与Spotify展开合作,通过这一功能将播客翻译为其他语言,同时保留播客主持人的声音。

值得一提的是,数据显示,近期ChatGPT流量回升。SimilarWeb数据显示,9月11日那一周,ChatGPT流量较前一周增长约12%。另一家分析公司Sensor Tower报告称,8月最后两周全球ChatGPT应用程序用户每周增长超过10%。据悉,流量增长的主要原因为学生开始返校,且印度及巴西市场迎来增长。

▌多模态大模型成兵家必争之地 算力需求显著攀升

如今,多模态功能已成为各家AI大模型的必争之地。Meta最近推出AudioCraft,通过AI生成音乐;谷歌Bard及必应机器人均已部署多模式功能;苹果也在试验AI生成语音Personal Voice。

随着AI感知、交互与生成能力快速发展,应用场景与生态也有望进一步丰富。而语音与图像数据大小显著高于文本,券商指出,多模态大模型的训练推理算力需求将大幅攀升。

例如被谷歌寄予厚望的多模态大模型Gemini,据SemiAnalysi分析师Dylan Patel和Daniel Nishball透露,其已开始在TPUv5 Pod上进行训练,算力高达~1e26 FLOPS,是训练GPT-4所需算力的5倍。

华为副董事长、轮值董事长、CFO孟晚舟日前也表示,“人工智能的发展,算力是核心驱动力。大模型需要大算力,算力大小决定着AI迭代与创新的速度,也影响着经济发展的速度。算力的稀缺和昂贵,已经成为制约AI发展的核心因素。”

国信证券指出,AI三元素(大模型、算力、应用)呈螺旋式促进关系。AI三元素以“模型更新-算力芯片迭代、单位tokens成本降低-应用增加”循环往复,当三者中有一个要素喷发,就是强刺激期;三者同时没有更新,就会进入停滞期,等待下次爆发。

3d6e6dba-5c71-11ee-939d-92fbcf53809c.png

多模态大模型是未来发展趋势。通过将不同数据类型相互关联结合,可以大幅提高模型准确性和鲁棒性,应用场景进一步拓展。

同时,3月谷歌发布多模态具身视觉语言模型(VLM)PaLM-E,其可用于机器人领域;7月谷歌发布新一代视觉-语言-动作(VLA)模型Robotics Transformer 2(RT-2),专用于机器人领域,看好大模型赋能机器人趋势,分析师看好大模型赋能机器人。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    210

    文章

    27822

    浏览量

    204529
  • 模型
    +关注

    关注

    1

    文章

    3029

    浏览量

    48340
  • ChatGPT
    +关注

    关注

    28

    文章

    1517

    浏览量

    6885

原文标题:ChatGPT迎重磅升级 算力需求喷发可期

文章出处:【微信号:chinastarmarket,微信公众号:科创板日报】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浅析三大之异同

    随着一年多前ChatGPT的出现引爆人工智能(AI)浪潮,支撑大模型背后的“”概念突然闯进我们的视野,成为科技圈炙手可热的新词,引领着最新潮流。作为数字经济时代新生产,也许不少人
    的头像 发表于 08-30 12:56 300次阅读
    浅析三大<b class='flag-5'>算</b><b class='flag-5'>力</b>之异同

    摩尔线程夸娥智中心解决方案重磅升级

    摩尔线程重磅宣布其AI旗舰产品夸娥(KUAE)智集群解决方案实现重大升级,从当前的千卡级别大幅扩展至万卡规模。摩尔线程夸娥(KUAE)万卡智集群,以全功能GPU为底座,旨在打造国内
    的头像 发表于 08-27 16:09 512次阅读

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    摩尔线程张建中:以国产助力数智世界,满足大模型需求

    摩尔线程创始人兼CEO张建中在会上透露,为了满足国内对AI的迫切需求,他们正在积极寻求与国内顶尖科研机构的深度合作,共同推动更大规模的AI智集群项目。
    的头像 发表于 05-10 16:36 610次阅读

    时代, 如何打破内存墙

    来源:Ambarella安霸 何小林 近年来,人工智能应用正经历一轮快速的发展与普及,而以ChatGPT等先进的大模型技术在此过程中起到了关键作用。这些模型对计算能力的需求不断攀升,催生了AI芯片
    的头像 发表于 03-06 19:51 239次阅读
    大<b class='flag-5'>算</b><b class='flag-5'>力</b>时代, 如何打破内存墙

    智能规模超通用,大模型对智能提出高要求

    的缩写,即每秒所能够进行的浮点运算数目(每秒浮点运算量)。   可以分为通用、智能
    的头像 发表于 02-06 00:08 5430次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    夯实底座,顺网科技业务全面升级

    解决行业的上网问题,演变为解决行业 “上好,用好AI” 的问题,真正实现顺网新发展战略—— “立足,聚焦AI” ,满足AI智时代的
    的头像 发表于 01-22 09:20 323次阅读
    夯实<b class='flag-5'>算</b><b class='flag-5'>力</b>底座,顺网科技<b class='flag-5'>算</b><b class='flag-5'>力</b>业务全面<b class='flag-5'>升级</b>

    网络面临三大挑战

    2024年,以AIGC为代表的人工智能技术将进一步激发需求网络、智中心、超
    的头像 发表于 01-12 10:39 772次阅读

    ChatGPT芯片如何做输出

    卡的核心当然还是计算芯片,会搭配大容量高带宽的内存、缓存,以及搭载CPU用于调度,为了帮助数据传输,便会使用高速通道,这便是PCIe(高速串行计算机扩展总线标准)在系统中的作用:提供总线通道。
    发表于 01-11 10:01 368次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片如何做<b class='flag-5'>算</b><b class='flag-5'>力</b>输出

    AI应用中的光模块产品

    ChatGPT为代表的AI大模型应用普及将推动需求快速增长,服务器产业链是其中重要的受益环节之一,AI计算的普及将推动服务器产业链光模块向800G
    的头像 发表于 01-02 15:32 371次阅读
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b>应用中的光模块产品

    认识一下AI应用中的光模块产品

    ChatGPT为代表的AI大模型应用普及将推动需求快速增长,服务器产业链是其中重要的受益环节之一,AI计算的普及将推动服务器产业链光模块向800G
    的头像 发表于 12-29 16:14 747次阅读
    认识一下AI<b class='flag-5'>算</b><b class='flag-5'>力</b>应用中的光模块产品

    升级 英特尔至强可扩展处理器持续技术创新

    庞大的支持,用户普遍需要向云计算厂商购买服务;且由于大量用户涌入云服务市场,云厂商需要尽快升级数据中心算
    的头像 发表于 12-29 14:32 315次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>大<b class='flag-5'>升级</b> 英特尔至强可扩展处理器持续技术创新

    芯科技,解密ChatGPT畅聊之芯片

    在今日飞速发展的科技浪潮中,OpenAI的ChatGPT如一颗璀璨明星,引领着智能对话的新潮流。ChatGPT不仅是一款聊天机器人程序,它背后的驱动力是一个庞大而复杂的网络。这个网
    的头像 发表于 12-27 07:45 799次阅读
    芯科技,解密<b class='flag-5'>ChatGPT</b>畅聊之<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片

    什么是可分为哪些类别?

    计算是人类解决问题的一种方式。 在漫长的历史长河中,人类遇到过很多问题,都需要通过计算来解决。这些计算任务,仅凭大脑这个“原生”工具,是无法完成的。 于是,人类发明了很多
    的头像 发表于 11-20 09:27 1.2w次阅读
    什么是<b class='flag-5'>算</b><b class='flag-5'>力</b>?<b class='flag-5'>算</b><b class='flag-5'>力</b>可分为哪些<b class='flag-5'>算</b><b class='flag-5'>力</b>类别?