谷歌推出Gemini 希望击败GPT-4-电子发烧友网

谷歌首席执行官Sundar Pichai表示，这是人工智能新时代的开始：Gemini时代。Gemini是谷歌最新的大型语言模型，Pichai在6月份的I/O开发者大会上首次提出，现在向公众发布。听Pichai和谷歌DeepMind首席执行官Demis Hassabis描述，这是人工智能模型的一个巨大飞跃，最终将影响谷歌几乎所有的产品。Pichai说：“这一时刻的一个强大之处是，你可以研究一种底层技术，并使其变得更好，并且它会立即衍生到我们的产品中。”

Gemini不仅仅是一个单一的人工智能模型。有一个简单版本叫Gemini Nano，旨在在安卓设备上离线运行。有一个更强大的版本叫Gemini Pro，很快将为谷歌的许多人工智能服务提供动力，从今天开始，它是Bard的支柱。还有一个功能更强大的模型叫Gemini Ultra，这是谷歌迄今为止创建的最强大的LLM，似乎主要是为数据中心和企业应用程序设计的。

从12月13日开始，开发者和企业客户将能够通过谷歌Generative AI Studio或谷歌云中的Vertex AI访问Gemini Pro。Gemini目前只提供英语版本，其他语言显然很快就会出现。但Pichai表示，该模式最终将在全球范围内集成到谷歌的搜索引擎、广告产品、Chrome浏览器等中。这是谷歌的未来，它马上就要到来了。

OpenAI在一年多前推出了ChatGPT，该公司和产品立即成为人工智能领域最火爆的内容。现在，谷歌——这家创造了当前人工智能繁荣背后大部分基础技术的公司，近十年来一直称自己为“人工智能第一”组织，终于准备好反击了。

Hassabis表示：“我们已经对系统进行了非常彻底的并排分析和基准测试。” 谷歌运行了32个完善的基准测试来比较这两个模型，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力的测试。Hassabis面带微笑地说：“我认为我们在32个基准中有30个基本领先。”

在这些基准（实际上大多非常接近）中，Gemini最明显的优势来自于它理解视频和音频并与之互动的能力。这在很大程度上是有意为之：多模式从一开始就是Gemini计划的一部分。谷歌没有像OpenAI创建DALL-E和Whisper那样，为图像和语音训练单独的模型；它从一开始就建立了一个多感官模型。“我们一直对非常、非常通用的系统感兴趣，”Hassabis说。他特别感兴趣的是如何混合所有这些模式——从任何数量的输入和感觉中收集尽可能多的数据，然后给出尽可能多种类的响应。

目前，Gemini最基本的模型是文本输入和文本输出，但像Gemini Ultra这样功能更强大的模型可以处理图像、视频和音频。Hassabis说：“这将变得更加普遍。还有一些东西，比如动作和触摸，更像机器人类型的东西。” 他说，随着时间的推移，Gemini会有更多的感觉，在这个过程中变得更准确、更接地气。Hassabis表示，这些模型知道的越多，他们就会得到更好的结果。

不过，基准测试只是基准测试，最终，对Gemini能力的真正考验将来自那些想用它集思广益、查找信息、编写代码等的日常用户。谷歌似乎特别将编码视为Gemini的杀手级应用；它使用了一种名为AlphaCode 2的新代码生成系统，称其性能优于85%的编码比赛参与者，高于原始AlphaCode的50%。但Pichai表示，用户会注意到该模型所涉及的几乎所有方面都有所改进。

对谷歌来说同样重要的是，Gemini显然是一个效率高得多的模式。它是在谷歌自己的张量处理单元上训练的，运行起来比谷歌以前的模型（如PaLM）更快、更便宜。除了新模型，谷歌还推出了其TPU系统的新版本TPU v5p，这是一种设计用于数据中心的计算系统，用于训练和运行大型模型。

与Pichai和Hassabis交谈发现，很明显，他们认为Gemini的发布既是一个更大项目的开始，也是其本身的一个阶段性变化。Gemini是谷歌一直在等待的模式，也是它多年来一直在努力打造的模式，甚至可能是它在OpenAI和ChatGPT“接管”世界之前就应该准备好的模式。

谷歌在ChatGPT发布后宣布进入“code red”，此后一直被认为在迎头赶上，似乎仍在努力坚持其“大胆而负责任”的口号。Hassabis和Pichai都表示，他们不愿意为了跟上而走得太快，尤其是在我们离终极人工智能梦想通用人工智能越来越近的时候。通用人工智能是一种自我塑造、比人类更聪明并准备改变世界的人工智能。“随着我们接近AGI，情况将有所不同，”Hassabis说，“这是一种积极的技术，所以我认为我们必须谨慎、谨慎但乐观地对待它。”谷歌表示，它通过内部和外部测试以及红队合作，努力确保Gemini的安全和责任。Pichai指出，确保数据安全性和可靠性对于企业优先的产品尤为重要，而这正是最具生成性的人工智能赚钱的地方。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉