谷歌推出效率与性能跃阶的全新开放模型标准-电子发烧友网

作者 /Google DeepMind 研究副总裁 Clement Farabet 和Google DeepMind 总监 Tris Warkentin

AI 有可能解决人类面临的一些最紧迫的问题，但前提是每个人都拥有构建 AI 的工具。这就是我们在今年早些时候推出 Gemma的原因，Gemma 是一系列轻量级开放模型系列，采用了与创建 Gemini 模型相同的研究和技术。我们还陆续推出了 CodeGemma、RecurrentGemma 和 PaliGemma，以此不断发展我们的 Gemma 系列，上述每个模型都能为不同的 AI 任务提供独特的功能，并且可以通过与 Hugging Face、NVIDIA 和 Ollama 等合作伙伴的集成轻松访问。

现在，我们正式向全球研究人员和开发者发布 Gemma 2。Gemma 2 分为 90 亿 (9B) 和 270 亿 (27B) 两种参数版本，与第一代相比，其性能更强、推理效率更高，并且在安全性方面也有显著提升。事实上，作为一种有竞争力的替代方案，Gemma 2 27B 的性能可以与规模是其两倍的模型相媲美，截至去年 12 月，只有专有模型才能达到此性能水准。如今，这可以在单个 NVIDIA H100 Tensor Core GPU 或 TPU 的主机上实现，从而显著降低了部署成本。

效率与性能跃阶的

全新开放模型标准

我们在重新设计的架构上构建了 Gemma 2，旨在提供卓越的性能和推理效率。以下是它脱颖而出的原因:

非凡性能:Gemma 2 27B 在同类规模的模型中性能最优，甚至比其规模大两倍以上的模型更具竞争力。而 Gemma 2 9B 模型也具有一流的性能，优于 Llama 3 8B 以及其他相同规模类别的开放模型。如需了解详细性能分析，请查阅技术报告。

立竿见影的降本增效:Gemma 2 27B 模型旨在助您使用单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 以全精度高效运行推理，从而显著降低成本，同时保持高效性能。这使得 AI 部署更加易于访问且经济实惠。

跨硬件的极速推理:Gemma 2 经过优化，可以在一系列硬件上以不可思议的速度运行，包括强大的游戏本电脑、高端台式机和云端配置等。您可以在 Google AI Studio 中以全精度体验 Gemma 2，在 CPU 上使用 Gemma.cpp 量化版本解锁本地性能，或者通过 Hugging Face Transformer 在配备 NVIDIA RTX 或 GeForce RTX 的家用电脑上试用。

专为开发者和研究人员打造

Gemma 2 不仅功能更强大，并且还能够更轻松地集成到您的工作流程中:

开放且易于访问:就像最初的 Gemma 模型一样，Gemma 2 可在我们商业友好型的 Gemma 许可下使用，支持开发者和研究人员分享和商业化他们的创新成果。

广泛的框架兼容性:由于 Gemma 2 与 Hugging Face Transformer 等主要 AI 框架兼容，并且通过原生 Keras 3.0、vLLM、Gemma.cpp、Llama.cpp 和 Ollama 兼容 JAX、PyTorch 和 TensorFlow，因此您可以轻松地将其与您偏好的工具和工作流一起使用。此外，我们还通过 NVIDIA TensorRT-LLM 优化了 Gemma，支持该模型在 NVIDIA 加速基础架构上运行，或作为 NVIDIA NIM 推理微服务运行，并将很快优化支持 NVIDIA NeMo。您现在便可以使用 Keras 和 Hugging Face 进行微调。我们正在积极努力，以提供更多参数高效的微调选项。

轻松部署:从七月开始，Google Cloud 客户将能够在 Vertex AI 上轻松部署和管理 Gemma 2。

探索新的 Gemma 手册，其中包含一系列实用示例和指南，帮助您构建自己的应用并针对特定任务微调 Gemma 2 模型。还可了解如何轻松使用您的工具与 Gemma 集成，包括用于如检索增强生成等常见任务。

负责任的 AI 开发

我们致力于为开发者和研究人员提供负责任地构建和部署 AI 所需的资源，包括使用我们负责任的生成式 AI 工具包 (Responsible Generative AI Toolkit)。最近开源的 LLM Comparator 可帮助开发者和研究人员深入评估语言模型。现在，您可以使用配套的 Python 库对您的模型和数据进行比较评估，并在应用中可视化结果。此外，我们正在积极致力于为 Gemma 模型开源文本水印技术 SynthID。

在训练 Gemma 2 时，我们遵循稳健的内部安全流程和过滤预训练数据，并根据一套全面的指标开展严格的测试和评估，以识别和减轻潜在的偏见和风险。我们在大量的与安全和代表性危害相关的公共基准上发布我们的结果。

使用 Gemma 构建的项目

我们首次推出 Gemma 时获得了超过 1,000 万次的下载量，并促成了无数鼓舞人心的项目。例如，Navarasa 利用 Gemma 创建了一个基于印度语言多样性的模型。

如今，Gemma 2 将帮助开发者落地更具雄心的项目，在他们的 AI 创作中释放全新的性能和潜力。我们将不懈地探索新的架构，并开发专门的 Gemma 变体，以应对更广泛的 AI 任务和挑战。这包括即将推出的Gemma 2 2.6B 模型，旨在进一步弥合轻量级可访问性与强大性能之间的差距。您可以参阅技术报告以详细了解。

开始构建

Gemma 2 现已在 Google AI Studio 中推出，因此您可以在无需硬件要求的情况下测试 Gemma 2 27B 的全部性能。您还可以从 Kaggle 和 Hugging Face 模型下载 Gemma 2 的模型权重，Vertex AI Model Garden 中也即将推出。

为了方便研究和开发，您还可通过 Kaggle 或 Colab notebook 免费使用 Gemma 2。首次使用 Google Cloud 的用户可能有资格获得 300 美元积分。学术研究人员可以通过申请 Gemma 2 学术研究计划 (Gemma 2 Ac ademic Research Program)获取 Google Cloud 积分，从而加速 Gemma 2 的研究。申请现已开放，截止日期为 8 月 9 日。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1775

浏览量
58047
AI

AI

+关注

关注
87

文章
32173

浏览量
271224
模型

模型

+关注

关注
1

文章
3400

浏览量
49436

原文标题：效率与性能提升 | 可供开发者和研究人员使用的 Gemma 2 现已发布

文章出处：【微信号：Google_Developers，微信公众号：谷歌开发者】欢迎添加关注！文章转载请注明出处。

Traco Power推出全新TXO系列开放式框架AC/DC电源

在工业领域，电源设备的稳定性和可靠性至关重要。Traco Power全新推出的TXO系列开放式框架AC/DC电源，以高效率、强化隔离和多功能性，为成本敏感型工业应用提供了理想的解决方案

发表于 01-15 16:12 •336次阅读

Traco Power<b class='flag-5'>推出</b><b class='flag-5'>全新</b>TXO系列<b class='flag-5'>开放</b>式框架AC/DC电源

谷歌发布Gemini 2.0 AI模型

谷歌近日正式推出了新一代AI模型——Gemini 2.0。此次更新引入了名为“深度研究”的新特性，旨在为用户提供更加全面和深入的复杂主题探索与报告撰写辅助。 Gemini 2.0通过高级推理和长上

发表于 12-12 10:13 •360次阅读

2024年联想创新开放日盛大开启

近日，以“AI的向新力”为主题的2024年联想创新开放日盛大开启，汇聚行业客户、合作伙伴、媒体记者等各界嘉宾，共同解锁科技未来密码。为期三天的科技盛宴，不仅将全面展示联想在“全栈AI”产品、方案和服务的最新进展，更创造了一个围绕创新科技深度交流的开放平台。

发表于 12-02 17:19 •640次阅读

谷歌全新推出开放式视觉语言模型PaliGemma

这种热烈的反响非常鼓舞人心，开发者们打造了一系列多样的项目，例如用于印度语言的多语言变体 Navarasa，以及设备端侧动作模型 Octopus v2。开发者们展示了 Gemma 在打造极具影响力且易于使用的 AI 解决方案方面的巨大潜力。

发表于 10-15 17:37 •494次阅读

Meta发布全新开源大模型Llama 3.1

科技巨头Meta近期震撼发布了其最新的开源人工智能（AI）模型——Llama 3.1，这一举措标志着Meta在AI领域的又一重大突破。Meta创始人马克·扎克伯格亲自站台，盛赞Llama 3.1为“业内顶尖水准”的AI模型，并自信地表示它能够与OpenAI、

发表于 07-24 18:25 •1538次阅读

谷歌Gemma 2大语言模型升级发布，性能与安全性双重飞跃

近日，谷歌面向全球科研界与开发者群体隆重推出了全新升级的Gemma 2大语言模型，标志着人工智能技术在语言处理领域的又一次重大进步。此次发布的Gemma 2，以其卓越的

发表于 07-02 10:20 •581次阅读

智谱AI发布全新多模态开源模型GLM-4-9B

近日，智谱AI在人工智能领域取得重大突破，成功推出全新开源模型GLM-4-9B。这款模型以其卓越的多模态能力，再次刷新了业界对于大型语言模型

发表于 06-07 09:17 •875次阅读

谷歌发布全新视频生成模型Veo与Imagen文生图模型

谷歌近日宣布了两项重大技术进展，首先是视频生成模型Veo的正式推出。这款先进的模型能够支持生成质量更高的视频内容，让用户能够根据自己的需求设定光照、镜头语言、视频颜色风格等参数，为视频

发表于 05-16 10:46 •456次阅读

谷歌推出Trillium AI芯片，性能提高近5倍

谷歌推出了其最新的人工智能数据中心芯片——Trillium。这款芯片是谷歌的第六代产品，与上一代TPU v5e相比，Trillium在每个芯片上的峰值计算性能提高了4.7倍，节能67%

发表于 05-16 10:39 •858次阅读

NVIDIA与Google DeepMind合作推动大语言模型创新

支持 NVIDIA NIM 推理微服务的谷歌最新开源模型 PaliGemma 首次亮相。

发表于 05-16 09:44 •547次阅读

谷歌DeepMind推出新一代药物研发AI模型AlphaFold 3

谷歌DeepMind公司近日重磅推出了一款名为AlphaFold 3的全新药物研发AI模型，这一创新技术将为科学家们提供前所未有的帮助，使他们能更精确地理解疾病机制，进而开发出更高效的

发表于 05-10 09:35 •486次阅读

微软准备推出全新人工智能语言模型

微软近期传出消息，正在秘密研发一款全新的人工智能语言模型，这款模型在规模上预计将具备与谷歌和OpenAI等业界巨头相抗衡的实力。据悉，这款新模型

发表于 05-08 09:30 •480次阅读

OpenAI有望在年中推出全新GPT-5模型

近日，人工智能领域的领军企业OpenAI传来了令人振奋的消息。据悉，他们有望在今年的年中，大约是夏季时分，推出全新的GPT-5模型。这一消息引发了业界的广泛关注与期待。

发表于 03-22 11:29 •871次阅读

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，该模型以其独特的功能吸引了众多关注。此模型具备从单张图像

发表于 03-22 10:30 •1001次阅读

谷歌发布全新AI基础世界模型Genie

谷歌近日宣布推出其最新研发的AI基础世界模型——Genie。这款模型拥有惊人的110亿参数，其独特之处在于，仅需一张图片，便能生成一个充满活力和交互性的虚拟世界。用户可以在这个世界中逐

发表于 03-04 14:02 •866次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

谷歌推出效率与性能跃阶的全新开放模型标准

评论