0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 希望击败GPT-4

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-12-14 17:30 次阅读

谷歌首席执行官Sundar Pichai表示,这是人工智能新时代的开始:Gemini时代。Gemini是谷歌最新的大型语言模型,Pichai在6月份的I/O开发者大会上首次提出,现在向公众发布。听Pichai和谷歌DeepMind首席执行官Demis Hassabis描述,这是人工智能模型的一个巨大飞跃,最终将影响谷歌几乎所有的产品。Pichai说:“这一时刻的一个强大之处是,你可以研究一种底层技术,并使其变得更好,并且它会立即衍生到我们的产品中。”

Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano,旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro,很快将为谷歌的许多人工智能服务提供动力,从今天开始,它是Bard的支柱。还有一个功能更强大的模型叫Gemini Ultra,这是谷歌迄今为止创建的最强大的LLM,似乎主要是为数据中心和企业应用程序设计的。

从12月13日开始,开发者和企业客户将能够通过谷歌Generative AI Studio或谷歌云中的Vertex AI访问Gemini Pro。Gemini目前只提供英语版本,其他语言显然很快就会出现。但Pichai表示,该模式最终将在全球范围内集成到谷歌的搜索引擎、广告产品、Chrome浏览器等中。这是谷歌的未来,它马上就要到来了。

OpenAI在一年多前推出了ChatGPT,该公司和产品立即成为人工智能领域最火爆的内容。现在,谷歌——这家创造了当前人工智能繁荣背后大部分基础技术的公司,近十年来一直称自己为“人工智能第一”组织,终于准备好反击了。

Hassabis表示:“我们已经对系统进行了非常彻底的并排分析和基准测试。” 谷歌运行了32个完善的基准测试来比较这两个模型,从广泛的整体测试(如多任务语言理解基准测试)到比较两个模型生成Python代码的能力的测试。Hassabis面带微笑地说:“我认为我们在32个基准中有30个基本领先。”

在这些基准(实际上大多非常接近)中,Gemini最明显的优势来自于它理解视频音频并与之互动的能力。这在很大程度上是有意为之:多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样,为图像和语音训练单独的模型;它从一开始就建立了一个多感官模型。“我们一直对非常、非常通用的系统感兴趣,”Hassabis说。他特别感兴趣的是如何混合所有这些模式——从任何数量的输入和感觉中收集尽可能多的数据,然后给出尽可能多种类的响应。

目前,Gemini最基本的模型是文本输入和文本输出,但像Gemini Ultra这样功能更强大的模型可以处理图像、视频和音频。Hassabis说:“这将变得更加普遍。还有一些东西,比如动作和触摸,更像机器人类型的东西。” 他说,随着时间的推移,Gemini会有更多的感觉,在这个过程中变得更准确、更接地气。Hassabis表示,这些模型知道的越多,他们就会得到更好的结果。

不过,基准测试只是基准测试,最终,对Gemini能力的真正考验将来自那些想用它集思广益、查找信息、编写代码等的日常用户。谷歌似乎特别将编码视为Gemini的杀手级应用;它使用了一种名为AlphaCode 2的新代码生成系统,称其性能优于85%的编码比赛参与者,高于原始AlphaCode的50%。但Pichai表示,用户会注意到该模型所涉及的几乎所有方面都有所改进。

对谷歌来说同样重要的是,Gemini显然是一个效率高得多的模式。它是在谷歌自己的张量处理单元上训练的,运行起来比谷歌以前的模型(如PaLM)更快、更便宜。除了新模型,谷歌还推出了其TPU系统的新版本TPU v5p,这是一种设计用于数据中心的计算系统,用于训练和运行大型模型。

与Pichai和Hassabis交谈发现,很明显,他们认为Gemini的发布既是一个更大项目的开始,也是其本身的一个阶段性变化。Gemini是谷歌一直在等待的模式,也是它多年来一直在努力打造的模式,甚至可能是它在OpenAI和ChatGPT“接管”世界之前就应该准备好的模式。

谷歌在ChatGPT发布后宣布进入“code red”,此后一直被认为在迎头赶上,似乎仍在努力坚持其“大胆而负责任”的口号。Hassabis和Pichai都表示,他们不愿意为了跟上而走得太快,尤其是在我们离终极人工智能梦想通用人工智能越来越近的时候。通用人工智能是一种自我塑造、比人类更聪明并准备改变世界的人工智能。“随着我们接近AGI,情况将有所不同,”Hassabis说,“这是一种积极的技术,所以我认为我们必须谨慎、谨慎但乐观地对待它。”谷歌表示,它通过内部和外部测试以及红队合作,努力确保Gemini的安全和责任。Pichai指出,确保数据安全性和可靠性对于企业优先的产品尤为重要,而这正是最具生成性的人工智能赚钱的地方。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6192

    浏览量

    105876
  • Gemini
    +关注

    关注

    0

    文章

    56

    浏览量

    7613
  • 人工智能
    +关注

    关注

    1796

    文章

    47643

    浏览量

    239871

原文标题:谷歌推出Gemini 希望击败GPT-4

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌发布Gemini 2.0 AI模型

    谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性,旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高
    的头像 发表于 12-12 10:13 292次阅读

    Llama 3 与 GPT-4 比较

    随着人工智能技术的飞速发展,我们见证了一代又一代的AI模型不断突破界限,为各行各业带来革命性的变化。在这场技术竞赛中,Llama 3和GPT-4作为两个备受瞩目的模型,它们代表了当前AI领域的最前
    的头像 发表于 10-27 14:17 456次阅读

    OpenAI推出新模型CriticGPT,用GPT-4自我纠错

    基于GPT-4的模型——CriticGPT,这款模型专为捕获ChatGPT代码输出中的错误而设计,其独特的作用在于,让人们能够用GPT-4来查找GPT-4的错误。
    的头像 发表于 06-29 09:55 585次阅读

    OpenAI API Key获取:开发人员申请GPT-4 API Key教程

      OpenAI的GPT-4模型因其卓越的自然语言理解和生成能力,成为了许多开发者的首选工具。获取GPT-4 API Key并将其应用于项目,如开发一个ChatGPT聊天应用,不仅是实践人工智能技术
    的头像 发表于 06-24 17:40 2519次阅读
    OpenAI API Key获取:开发人员申请<b class='flag-5'>GPT-4</b> API Key教程

    开发者如何调用OpenAI的GPT-4o API以及价格详情指南

    ​目前,OpenAI新模型GPT-4o和GPT-4 Turbo的价格如下: GPT-4o 对比 GPT-4 Turbo GPT-4o 拥有与
    的头像 发表于 05-29 16:00 1.2w次阅读
    开发者如何调用OpenAI的<b class='flag-5'>GPT-4</b>o API以及价格详情指南

    GPT-4人工智能模型预测公司未来盈利胜过人类分析师

    据悉,本次研究中,研究人员仅向GPT-4提供了匿名的财务数据,包括资产负债表和损益表,并要求其预测未来盈利增长。尽管未获得其他信息,GPT-4仍能达到60%的准确度,远超人类分析师的平均水平(53%-57%)。
    的头像 发表于 05-27 16:41 648次阅读

    OpenAI推出面向所有用户的AI模型GPT-4o

    在周一的直播盛会上,OpenAI揭开了其最新的人工智能模型GPT-4o的神秘面纱。这款新模型旨在为其著名的聊天机器人ChatGPT提供更强大、更经济的支持。GPT-4o是此前备受瞩目的GPT-4模型的升级版,自
    的头像 发表于 05-15 09:23 434次阅读

    OpenAI计划宣布ChatGPT和GPT-4更新

    人工智能领域的领军企业OpenAI近日宣布,将于5月13日进行一场产品更新直播,届时将揭晓ChatGPT和GPT-4的新进展。这一消息立即引发了外界对OpenAI下一项重大技术发布的广泛猜测和期待。
    的头像 发表于 05-13 11:06 620次阅读

    阿里云发布通义千问2.5大模型,多项能力超越GPT-4

    阿里云隆重推出了通义千问 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及生活建议、临时聊天及对话以及安全风险评估)方面表现出色,超越了GPT-4
    的头像 发表于 05-09 14:17 1008次阅读

    OpenAI推出Vision模型版GPT-4 Turbo,融合文本与图像理解

    据悉,此模型沿用GPT-4 Turbo系列特有的12.8万token窗口规模及截至2023年12月的知识库架构,其创新亮点则是强大的视觉理解功能。
    的头像 发表于 04-10 10:49 437次阅读

    微软Copilot全面更新为OpenAI的GPT-4 Turbo模型

    起初,Copilot作为Bing Chat AI助手推出,初期采用GPT-3.5模型,随后升级至GPT-4取得显著进步,如今再次更新至性能卓越的GPT-4 Turbo模型,这无疑将使得
    的头像 发表于 03-13 13:42 772次阅读

    OpenAI推出ChatGPT新功能:朗读,支持37种语言,兼容GPT-4GPT-3

    据悉,“朗读”功能支持37种语言,且能够自主识别文本类型并对应相应的发音。值得关注的是,该功能对GPT-4以及GPT-3.5版本的ChatGPT均适用。此举彰显了OpenAI致力于“多模态交互”(multimodal capabilities)的方向
    的头像 发表于 03-05 15:48 997次阅读

    Anthropic推出Claude 3大型语言模型,在认知任务性能上创新高

    据官方披露,Claude 3 旗舰 Opus 在大学生和研究生范畴的学术知识、复杂数理任务了解部分超越 OpenAI 的 GPT-4 以及谷歌Gemini 1.0 Ultra。
    的头像 发表于 03-05 11:16 572次阅读

    全球最强大模型易主,GPT-4被超越

    近日,AI领域的领军企业Anthropic宣布推出全新的Claude 3系列模型,其中包括最强版Claude 3 Opus。据该公司称,Claude 3系列在推理、数学、编码、多语言理解和视觉方面全面超越了包括GPT-4在内的所有大型模型,重新树立了行业基准。
    的头像 发表于 03-05 09:58 695次阅读

    Anthropic推出Claude 3系列模型,全面超越GPT-4,树立AI新标杆

    近日,AI领域的领军企业Anthropic震撼发布了全新的Claude 3系列模型,该系列模型在多模态和语言能力等关键领域展现出卓越性能,成功击败了此前被广泛认为是全球最强AI模型的GPT-4,树立了新的行业基准。
    的头像 发表于 03-05 09:49 729次阅读