0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌推出Gemini 2.0 Flash体验版

谷歌开发者 来源:谷歌开发者 2025-01-06 09:52 次阅读

作者 / Gemini API 小组产品经理 Shrestha Basu Mallick 和 Google Labs 产品总监 Kathy Korevec

我们正赋予开发者构建 AI 未来的能力,包括尖端模型、智能代码编写工具以及跨平台和设备的无缝集成。自 2023 年 12 月我们推出 Gemini 1.0 以来,数百万的开发者已经使用 Google AI Studio 和 Vertex AI 在 109 种语言中使用 Gemini 进行构建。

我们推出了 Gemini 2.0 Flash 体验版,旨在支持更具沉浸感和交互性的应用。同时,我们还推出了能够代开发者执行任务、优化开发流程的全新编码智能体。

使用 Gemini 2.0 Flash 进行构建

在 Gemini 1.5 Flash 成功的基础上,Flash 2.0 的速度是 1.5 Pro 的两倍,具有更优越的性能,包括新的多模态输出,并支持原生工具使用。我们还推出了 Multimodal Live API,用于构建具有实时音频视频流的动态应用。

即日起,开发者可以通过 Google AI Studio 和 Vertex AI中的 Gemini API,测试和探索实验阶段的 Gemini 2.0 Flash,正式版预计将于 2025 年初全面推出。

借助 Gemini 2.0 Flash,开发者可以获得:

1. 更佳性能

Gemini 2.0 Flash 比 1.5 Pro 更强大,同时在速度和效率上依然符合开发者对 Flash 的期望。它还在关键基准测试中展示了更优越的多模态、文本、代码、视频、空间理解和推理性能。改进后的空间理解能力能够在复杂图像中为小对象生成更精确的边界框,并实现更好的对象识别和图像描述。如需了解详情,您可以观看空间理解视频或阅读 Gemini API 文档。

2. 新的输出模式

开发者将能够使用 Gemini 2.0 Flash 通过单次 API 调用,生成包含文本、音频和图像的综合响应。这些新的输出模态已提供给早期测试人员使用,预计 2025 年将在更大范围推广。所有图像和音频输出都将启用 SynthID 隐形水印,这有助于减少错误信息和错误归因问题。

多语言原生音频输出: Gemini 2.0 Flash 具有原生文本转语音的音频输出功能,开发者不仅可以控制模型输出的内容,还可以精细控制说话方式,并提供 8 种高品质的声音以及各种语言和口音选择。您可以聆听原生音频输出的实际效果,或在开发者文档中了解更多信息。

原生图像输出: Gemini 2.0 Flash 现在可以生成原生图像,并支持对话式多轮编辑,因此您可以在此前的输出基础上进行构建和完善。它可以输出交错的文本和图像,使其在食谱等多模态内容中非常实用。您可以观看原生图像输出视频以了解更多信息。

3. 原生工具使用

Gemini 2.0 已经过训练,能够使用工具,这是构建智能体体验的基础能力。除了通过函数调用自定义第三方函数之外,它还可以原生调用 Google Search 和代码执行等工具。使用原生 Google Search 作为工具,不仅能提供更真实、更全面的答案,还能为发行商带来更多流量。它可以同时运行多项搜索,从多个来源找到更多相关事实并将其组合以提升准确率,从而改进信息检索效率。您可以在原生工具使用视频中了解详情,或从 Notebook 上开始构建。

4. Multimodal Live API

开发者现在可以使用来自摄像头或屏幕的音频和视频流输入,构建实时多模态应用。同时,应用可以支持诸如中断和语音活动检测等自然对话模式。该 API 支持将多个工具集成在一起,通过单个 API 调用即可完成复杂的用例。您可以在多模态直播视频中查看更多内容,尝试使用 Web console或入门代码 (Python)。

我们很高兴看到初创公司在使用 Gemini 2.0 Flash 方面取得了令人瞩目的进展,他们正在研发各种新体验的原型,例如 tldraw 的视觉游乐场、Viggle 的虚拟角色创建和音频旁白、Toonsutra 的情景多语言翻译以及 Rooms 正在实现的实时音频功能等。

为了加速开发,我们在 Google AI Studio 中发布了三个入门级应用体验,并提供了空间理解、视频分析和 Google 地图探索的开源代码,以便您可以开始使用 Gemini 2.0 Flash 进行构建。

赋能 AI 代码辅助的演进

随着 AI 代码辅助功能从简单的代码搜索迅速发展到嵌入开发者工作流程中的 AI 助手,我们希望分享使用 Gemini 2.0 的最新进展: 可以代表您执行任务的编码智能体。 在我们最新的研究中,我们已能够使用配备代码执行工具的 2.0 Flash,在 SWE-bench Verified 基准测试中达到 51.8% 的成绩,该基准测试用于评估智能体在实际软件工程任务中的表现。Gemini 2.0 Flash 的尖端推理速度使智能体能够采样数百种潜在的解决方案,再根据现有的单元测试和 Gemini 自身的判断来选择最佳解决方案。我们正在将这项研究成果转化为新的开发者产品。

认识您的 AI 编码智能体 Jules

想象一下,您的团队刚刚完成了一次 Bug Bash,现在有一长串的 Bug 等着您解决。现在,您可以将 Python 和 Javascript 编码任务分配给 Jules,这是一个使用 Gemini 2.0 的实验性 AI 编码智能体。Jules 可以异步工作,并与您的 GitHub 工作流程集成,处理 Bug 修复和其他耗时任务,让您可以专注于真正想要构建的内容。Jules 会创建全面的多步骤计划来解决问题,高效地修改多个文件,甚至还会准备拉取请求,以便将修复直接提交回 GitHub。

Jules 还处于早期阶段,但根据我们内部使用 Jules 的经验,它可为开发者提供:

更高的生产力:将问题和编码任务分配给 Jules,以提高异步编码效率。

进度跟踪:通过实时更新,随时了解情况并优先处理需要您关注的任务。

开发者全面掌控:随时查看 Jules 制定的方案,并根据需要提出反馈或进行调整。轻松审查 Jules 编写的代码,并在适当的时候将其合并到您的项目中。

我们目前将 Jules 提供给部分受信任的测试人员,并计划将于 2025 年初为其他感兴趣的开发者提供该功能。欢迎您在 labs.google.com/jules 上注册,获取有关 Jules 的最新进展。

Colab 的数据科学智能体

将为您创建 Notebook

在 2024 年的 I/O 大会上,我们在 labs.google/code 上推出了实验性的数据科学智能体,任何用户都可以上传数据集,并在几分钟内获得洞察,所有这些都基于可运行的 Colab Notebook。我们收到了开发者社区的积极反馈,并见证了该功能的影响力,这令我们倍感欣喜。例如,在数据科学智能体的帮助下,Lawrence Berkeley 国家实验室研究全球热带湿地甲烷排放项目的科学家估计,原本要花一周时间分析和处理的内容,现在只需五分钟。 Colab 已经开始使用 Gemini 2.0 整合这些相同的智能体功能。只需用简单的语言描述您的分析目标,就可以自动生成 Notebook,帮助您提升研究和数据分析的能力。开发者可以通过加入受信任的测试人员计划来抢先体验这项新功能,该功能将于 2025 年上半年更广泛地面向 Colab 用户推出。

开发者正在构建未来

我们的 Gemini 2.0 模型可以让您更快、更轻松地构建更强大的 AI 应用,让您可以专注于为用户打造卓越的体验。我们将在未来几个月内把 Gemini 2.0 引入 Android Studio、Chrome DevTools 和 Firebase 等平台。开发者可以在 Gemini Code Assist中注册以使用 Gemini 2.0 Flash,从而在 Visual Studio Code、IntelliJ、PyCharm 等流行 IDE 中体验增强的代码辅助功能。您可以访问 ai.google.dev 开始使用,并关注 Google AI for Developers,获取后续更新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    55

    浏览量

    7605
  • API
    API
    +关注

    关注

    2

    文章

    1504

    浏览量

    62157
  • AI
    AI
    +关注

    关注

    87

    文章

    31054

    浏览量

    269406
  • 开发者
    +关注

    关注

    1

    文章

    580

    浏览量

    17034

原文标题:为开发者开启 Gemini 时代新篇章

文章出处:【微信号:Google_Developers,微信公众号:谷歌开发者】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    谷歌Gemini 2.0 Flash体验版发布

    信息是人类进步的基石。26 年来,我们始终专注于我们的使命——整合全球信息,供大众使用,让人人受益。这也是我们持续拓展人工智能前沿领域的原因。我们整合来自世界各地的信息,并通过多样化的输出方式,让这些信息触手可及,真正为您所用。
    的头像 发表于 12-13 13:52 161次阅读

    谷歌正式发布Gemini 2.0 性能提升近两倍

    在智能体时代,谷歌再次引领技术潮流,正式发布了其最新力作——Gemini 2.0。这款AI模型不仅在性能上实现了显著提升,更是在多模态表现和原生工具应用方面展现了前所未有的强大功能。 Gemi
    的头像 发表于 12-12 14:22 316次阅读

    谷歌发布Gemini 2.0 AI模型

    下文处理技术,能够更有效地支持用户在学术及专业领域进行深入研究。这一新功能的推出,将为用户在探索复杂问题时提供更为精准和全面的帮助。 目前,Gemini 2.0 Flash
    的头像 发表于 12-12 10:13 251次阅读

    谷歌计划12月发布Gemini 2.0模型

    近日,有消息称谷歌计划在12月发布其下一代人工智能模型——Gemini 2.0。这一消息引发了业界的广泛关注,因为谷歌在人工智能领域一直保持着领先地位,而
    的头像 发表于 10-29 11:02 587次阅读

    谷歌Gemini 1.5 Flash模型升级,AI聊天速度飙升50%

    谷歌近期对其Gemini AI系列进行了重大更新,推出Gemini 1.5 Flash模型。此次升级的核心亮点在于显著提升了AI聊天的响应
    的头像 发表于 09-06 18:06 775次阅读

    谷歌推出Gemini Live,开启AI语音聊天新纪元

    在万众瞩目的Pixel 9系列手机发布会上,谷歌震撼宣布了一项创新服务——Gemini Live,该服务自今日起,率先向使用英语的Gemini Advanced订阅用户敞开大门。这一举措标志着
    的头像 发表于 08-15 17:29 730次阅读

    谷歌Gemini新增旅行规划功能,助用户高效规划度假行程

    谷歌方面称,Gemini可依据用户需求,快速挖掘航班时间与酒店预订详情,从而迅速制定出适宜的度假方案。谷歌副总裁兼Gemini总经理Sissie Hsiao指出,传统手动规划旅行需耗费
    的头像 发表于 05-15 11:18 401次阅读

    谷歌Gmail将支持Gemini总结电子邮件内容

    谷歌透露,Gemini 将协助 Workspace 和 Google One AI Premium 的用户理解和处理电子邮件内容。用户可通过移动应用和网页版 Gmail 使用 Gemini
    的头像 发表于 05-15 11:11 921次阅读

    苹果拟将谷歌Gemini大模型植入iPhone

    近日,有消息人士透露,苹果公司正与谷歌就一项具有里程碑意义的合作展开谈判。据悉,苹果公司有意将谷歌Gemini人工智能引擎集成至iPhone中,这一举措将深刻影响人工智能行业的发展格局。
    的头像 发表于 03-21 13:37 517次阅读

    谷歌计划重新推出改进后的Gemini AI模型人像生成功能

    谷歌DeepMind的首席执行官德米斯·哈萨比斯在2月26日透露,公司计划在接下来的几周内重新发布其备受关注的Gemini AI模型人像生成功能。此前,由于在某些历史图像生成描述中出现了不准确的问题,谷歌已暂停了这项功能。
    的头像 发表于 02-28 10:17 614次阅读

    谷歌推出Gemini for Workspace,提供AI辅助功能,定价信息颇受关注

    谷歌声称通过此篇博客文章详尽地介绍了新的更新。最基础的“Starter”套餐收费为每个月每人6美元,如果想使用“Gemini扩展”则需额外支付20美元(折合人民币约为144元)。
    的头像 发表于 02-22 10:38 723次阅读

    谷歌推出新一代大模型Gemini 1.5

    近日,谷歌在无预警的情况下发布了其下一代大模型——Gemini 1.5,这款模型在性能上实现了显著增强,并在长上下文理解方面取得了令人瞩目的突破。更令人惊叹的是,Gemini 1.5甚至能够仅凭提示词学会一门训练数据中没有的新语
    的头像 发表于 02-20 13:55 908次阅读

    谷歌发布AI新版本Gemini 1.5

    谷歌近日宣布推出其最新的人工智能(AI)版本——Gemini 1.5,这一新版本在文本处理能力上实现了重大突破。据了解,Gemini 1.5 Pro的上下文窗口长度已经扩展到惊人的10
    的头像 发表于 02-19 11:05 1158次阅读

    谷歌AI聊天机器人改名为Gemini

    谷歌(Google)近日宣布,旗下备受瞩目的AI聊天机器人Bard正式更名为Gemini,并推出了一款功能更加强大的付费版本——Gemini Advanced。这一战略调整旨在与微软、
    的头像 发表于 02-18 11:28 1130次阅读

    谷歌最新人工智能模型Gemini Pro已在欧洲上市

    近日,谷歌宣布其最新人工智能模型Gemini Pro已在欧洲市场上市,向欧洲用户开放。Gemini Pro是谷歌最大的人工智能(AI)模型之一,被视为巴德(Bard)的升级版。
    的头像 发表于 02-04 15:10 1224次阅读