0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google Gemma优化后可在NVIDIA GPU上运行

NVIDIA英伟达 来源:NVIDIA英伟达 2024-02-25 11:01 次阅读

借助 TensorRT-LLM,Google 全新开放语言模型可在 NVIDIA AI 平台(包括本地 RTX AI PC)上加速运行。

2024 年 2 月 21 日,NVIDIA 携手 Google 在所有 NVIDIA AI 平台上发布面向 Gemma 的优化功能,Gemma 是 Google 最先进的新型轻量级 2B 和 7B 开放语言模型,可在任何地方运行,从而降低成本并加快特定领域用户案例的创新工作。

NVIDIA 和 Google 的团队紧密合作,利用 NVIDIA TensorRT-LLM(用于优化大语言模型推理性能的开源库),在数据中心的 NVIDIA GPU云计算和搭载 NVIDIA RTX GPU 的 PC 上运行时,加速 Gemma 性能(Gemma 由创建 Gemini 模型的相同研究和技术构建)。

这使开发者能将全球高性能 AI PC 中超过 1 亿台搭载 NVIDIA RTX GPU 的用户作为潜在用户进行开发。

开发者还可在搭载 NVIDIA GPU 的云端运行 Gemma,该实例拥有 141GB HBM3e 显存,速度为 4.8TB/秒,Google 将于今年部署该实例。

此外,企业级开发者还可利用 NVIDIA 丰富的工具生态系统(包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM),对 Gemma 进行微调,并将优化后的模型部署到生产应用中。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4934

    浏览量

    102794
  • 云计算
    +关注

    关注

    39

    文章

    7732

    浏览量

    137187
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128684

原文标题:共耀光芒:Google Gemma 优化后可在 NVIDIA GPU 上运行

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    如何构建及优化GPU云网络

    并从计算节点成本优化、集群网络与拓扑的选择等方面论述如何构建及优化GPU云网络。
    的头像 发表于 11-06 16:03 241次阅读
    如何构建及<b class='flag-5'>优化</b><b class='flag-5'>GPU</b>云网络

    AMD与NVIDIA GPU优缺点

    NVIDIA的RTX系列显卡以其强大的光线追踪和DLSS技术领先于市场。例如,NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戏体验,而AMD的Radeon RX 6800 XT虽然在某些游戏中表现接近,但在光线追踪技术
    的头像 发表于 10-27 11:15 444次阅读

    TI TDA2x SoC基于GPU的环视优化

    电子发烧友网站提供《TI TDA2x SoC基于GPU的环视优化.pdf》资料免费下载
    发表于 10-10 09:14 0次下载
    TI TDA2x SoC<b class='flag-5'>上</b>基于<b class='flag-5'>GPU</b>的环视<b class='flag-5'>优化</b>

    NVIDIA CorrDiff生成式AI模型能够精准预测台风

    NVIDIA GPU 运行的一个扩散模型向天气预报工作者展示了加速计算如何实现新的用途并提升能效。
    的头像 发表于 09-13 17:13 655次阅读

    Google Gemma 2模型的部署和Fine-Tune演示

    Google 近期发布了最新开放模型 Gemma 2,目前与同等规模的开放模型相比,取得了明显的优势,同时在安全可控性上得到了显著的增强。
    的头像 发表于 08-09 17:04 448次阅读
    <b class='flag-5'>Google</b> <b class='flag-5'>Gemma</b> 2模型的部署和Fine-Tune演示

    暴涨预警!NVIDIA GPU供应大跳水

    gpu
    jf_02331860
    发布于 :2024年07月26日 09:41:42

    英国公司实现英伟达CUDA软件在AMD GPU的无缝运行

    7月18日最新资讯,英国创新科技企业Spectral Compute震撼发布了其革命性GPGPU编程工具包——“SCALE”,该工具包实现了英伟达CUDA软件在AMD GPU的无缝迁移与运行,标志着在
    的头像 发表于 07-18 14:40 594次阅读

    使用google-translate和wwe合并无法使用google-tts怎么解决?

    ,在使用唤醒词唤醒,我想让他使用google-tts说一句话,但是出现以下错误Code: Select all I (16188) wwe_example: rec_engine_cb
    发表于 06-28 06:05

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVID
    的头像 发表于 04-28 10:36 482次阅读

    NVIDIA推出两款基于NVIDIA Ampere架构的全新台式机GPU

    两款 NVIDIA Ampere 架构 GPU 为工作站带来实时光线追踪功能和生成式 AI 工具支持。
    的头像 发表于 04-26 11:25 586次阅读

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新开源大语言模型采用 NVIDIA 技术构建,其经过优化可在云、数据中心、边缘和 PC 的 NVIDIA
    的头像 发表于 04-23 09:52 420次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于
    的头像 发表于 04-20 09:39 639次阅读

    NVIDIA 发布全新交换机,全面优化万亿参数级 GPU 计算和 AI 基础设施

    NVIDIA Quantum-X800 InfiniBand 网络,打造性能最强大的 AI 专用基础设施 NVIDIA Spectrum-X800 以太网络,数据中心必备的优化 AI 网络
    发表于 03-19 10:05 312次阅读
    <b class='flag-5'>NVIDIA</b> 发布全新交换机,全面<b class='flag-5'>优化</b>万亿参数级 <b class='flag-5'>GPU</b> 计算和 AI 基础设施

    TensorRT LLM加速GemmaNVIDIA与谷歌牵手,RTX助推AI聊天

    NVIDIA今天在其官方博客中表示,今天与谷歌合作,在所有NVIDIA AI平台上为Gemma推出了优化
    的头像 发表于 02-23 09:42 561次阅读
    TensorRT LLM加速<b class='flag-5'>Gemma</b>!<b class='flag-5'>NVIDIA</b>与谷歌牵手,RTX助推AI聊天

    谷歌发布全球最强开源大模型Gemma

    谷歌近日宣布,其全新开源大模型Gemma正式亮相。Gemma被誉为全球性能最强大、同时也是最轻量级的模型系列,分为2B(20亿参数)和7B(70亿)两种尺寸版本。令人瞩目的是,即便是2B版本,也能够在笔记本电脑上流畅运行
    的头像 发表于 02-22 14:51 753次阅读