0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

解锁LLM新高度—OpenVINO™ 2024.1赋能生成式AI高效运行

英特尔物联网 来源:OpenVINO 中文社区 2024-05-10 10:36 次阅读

大语言模型推理的改进

LLM 的发展仍保持着惊人的速度。尽管现有的 LLM 已经具备强大的功能,但通过 OpenVINO 的优化和推理加速,可以对这些复杂模型的执行进行精炼,实现更快、更高效的处理,减少计算开销并最大限度发挥硬件潜力,这将直接导致 LLM 实现更高的吞吐量和更低的延迟。

通过采用压缩嵌入实现额外优化,有效地缩减了 LLM 的编译耗时与内存占用。与此同时,基于英特尔锐炫GPU,以及英特尔高级矩阵扩展(Intel AMX)的第4代和第5代英特尔至强平台之上,LLM 的第一个 token 处理性能得到了显著提升。

通过 oneDNN 可实现更好的 LLM 压缩与性能提升。如今,经过量化或压缩后的 INT4 和 INT8 精度的 LLM 可在英特尔锐炫GPU 上得到支持。在搭载集成 GPU 的英特尔酷睿Ultra 处理器上,针对部分小型 GenAI 模型显著减少了内存消耗。

此外,现在可以在 PyTorch 模型进行训练后量化之后,对其进行微调,以提高模型精度并简化从训练后量化过渡到训练感知量化的过程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆盖范围和框架集成

进一步深入了解搭载 OpenVINO 的生成式 AI,该新版本拓宽了生成式AI的边界,使其能够覆盖更广泛的神经网络架构与应用场景。

针对最新发布的最先进的 Llama 3 和 Phi3 模型, OpenVINO 对其实现了支持和优化。

具备混合专家(MoE)架构的 LLM 模型 Mixtral 以及 URLNet 模型,均针对英特尔至强处理器进行了性能提升优化。

文生图模型 Stable Diffusion 1.5以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,则专为搭载了集成 GPU 的英特尔酷睿Ultra 处理器进行了推理速度的改进和优化。

现在,OpenVINO 已支持 Falcon-7B-Instruct,这是一款即用型、具备优秀性能指标的生成式AI大语言模型,适用于聊天与指令场景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及带有 OpenVINO 和 LangChain 的 RAG 系统。

我们还在 OpenVINO Notebooks 存储库中提供了 Jupyter Notebook 示例。

新平台的更改和现有平台的增强

除了 PyPI 上的主 OpenVINO 软件包外,英特尔酷睿Ultra 处理器的预览 NPU 插件现在在 OpenVINO 开源 GitHub 存储库中可用。

现在,可以通过 npm 存储库更轻松地访问 JavaScript API,使 JavaScript 开发人员能够无缝访问 OpenVINO API。我们扩展了文档,可帮助开发人员将他们的 JavaScript 应用程序与 OpenVINO 集成。

现在,默认情况下已在 ARM 处理器上为卷积神经网络(CNN)启用 FP16 推理。在多种 ARM 设备上,已显著提升了众多模型的性能。已实现与 CPU 架构无关的构建,旨在为不同 ARM 设备提供统一的二进制分发。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有价值的资源,用于展示如何利用 OpenVINO 在人工智能领域实现重要进展。最近,我们对 OpenVINO notebooks 存储库做了一些改动,包括将默认分支从 'main' 更改为 'latest',以及对 "notebooks" 文件夹内 notebook 的命名结构进行了改进



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5786
  • 生成式AI
    +关注

    关注

    0

    文章

    492

    浏览量

    463
  • OpenVINO
    +关注

    关注

    0

    文章

    90

    浏览量

    184

原文标题:解锁 LLM 新高度,拓宽模型新边界 —— OpenVINO™ 2024.1 赋能生成式 AI 高效运行 | 开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    三行代码完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分为两个安装包分别是基础包与生成AI支持包,新发布的Ge
    的头像 发表于 08-30 16:49 398次阅读
    三行代码完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

    高通第三代骁龙7s移动平台发布,中端智能手机以卓越AI新体验

    AI技术,并兼容包括Baichuan-7B及拥有10亿参数的Llama 2在内的大型语言模型(LLM),极大地推动了智能手机智能化进程的新高度
    的头像 发表于 08-21 15:42 2124次阅读

    亚马逊云科技Shulex打造基于生成AI的客服和消费者洞察

    "Shulex")在亚马逊云科技的技术下,打造基于生成AI的"AI Agent客服机器人"
    的头像 发表于 08-13 20:38 270次阅读

    使用OpenVINO GenAI API的轻量级生成AI

    随着 ChatGPT 等聊天机器人的风暴席卷全球,生成预训练 Transformers (GPT) 在开发者中正在成为家喻户晓的新名字。生成 A
    的头像 发表于 07-24 15:08 537次阅读

    商汤发布《2024生成AI教育未来》白皮书

    生成AI正在各个行业中展现出巨大的应用前景。在关系国计民生的教育行业,生成AI能够催生哪些创
    的头像 发表于 06-29 09:48 789次阅读

    Wayve迈入AV 2.0新时代,生成AI

    NVIDIA DRIVE Thor。NVIDIA DRIVE Thor 采用 NVIDIA Blackwell GPU 架构,专为Transformer、大语言模型(LLM)和生成 AI
    的头像 发表于 06-07 15:14 980次阅读

    亚马逊云科技携手SAP通过生成AI解锁创新潜力

    科技与SAP宣布扩大战略合作,旨在革新现代化的云ERP体验,并利用生成AI为企业带来全新功能与效率提升。双方将共同努力,简化客户在亚马逊云科技上采用RISE with SAP解决方案的流程,提高SAP工作负载在云端
    的头像 发表于 06-07 10:53 321次阅读

    Arm平台移动端生成AI

    生成人工智能 (Generative AI) 涵盖了当下广为人知,且备受关注的大语言模型 (LLM),如今也已落地边缘侧的移动设备。
    的头像 发表于 04-26 11:09 773次阅读

    生成 AI 进入模型驱动时代

    随着ChatGPT和大型语言模型(LLM)呈现爆炸增长,生成人工智能(GenerativeAI)成为近来的一大热词。由此引发了一场争论:哪种AI
    的头像 发表于 04-13 08:12 495次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 进入模型驱动时代

    研扬携手英特尔,联合举办创AI百城行(武汉站):用OpenVINOAI于边缘计算平台

    边缘计算作为实现智能化、高效化数据处理的关键技术,日益受到业界的广泛关注。为了进一步推动AI边缘计算技术的发展与应用,3月27日研扬科技与英特尔在武汉共同举办了以“用OpenVINO
    的头像 发表于 04-04 08:05 227次阅读
    研扬携手英特尔,联合举办创<b class='flag-5'>AI</b>百城行(武汉站):用<b class='flag-5'>OpenVINO</b>™<b class='flag-5'>赋</b><b class='flag-5'>能</b><b class='flag-5'>AI</b>于边缘计算平台

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 业务决策

    北京 ——2024 年 2 月 21 日   亚马逊云科技宣布,上海沐瞳科技有限公司(以下简称“沐瞳”)应用亚马逊云科技Amazon Bedrock等生成AI服务,为玩家打造卓越的游戏体验并
    发表于 02-22 11:20 221次阅读
    亚马逊云科技助力沐瞳应用<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>技术打造卓越游戏体验 <b class='flag-5'>赋</b><b class='flag-5'>能</b>业务决策

    亚马逊云科技助力沐瞳应用生成AI技术打造卓越游戏体验 业务决策

    北京2024年2月21日 /美通社/ -- 亚马逊云科技宣布,上海沐瞳科技有限公司(以下简称"沐瞳")应用亚马逊云科技Amazon Bedrock等生成AI服务,为玩家打造卓越的游戏体验并
    的头像 发表于 02-22 09:25 404次阅读

    安霸发布全新N1系列生成AI芯片

    安霸在CES 2024上发布了全新的N1系列生成AI芯片,这是一款专门为前端设备设计的芯片,支持本地运行大型语言模型(LLM)应用。其单颗
    的头像 发表于 01-09 15:32 1326次阅读

    安霸发布N1系列生成AI芯片支持前端设备运行本地LLM应用

    单颗 SoC 支持 1 至 340 亿参数的多模态大模型(Multi-Modal LLM)推理,实现前端低功耗生成 AI
    的头像 发表于 01-09 15:19 916次阅读

    OpenVINO千元级『哪吒』AI开发套件大语言模型 | 开发者实战

    ,大多数高性能模型通常需要昂贵的计算资源,使得它们的应用受限于有限的环境。本文将探讨在OpenVINO下,如何在不足千元的AI开发板上部署Stable-Zeph
    的头像 发表于 01-06 08:05 1485次阅读
    <b class='flag-5'>OpenVINO</b>™ <b class='flag-5'>赋</b><b class='flag-5'>能</b>千元级『哪吒』<b class='flag-5'>AI</b>开发套件大语言模型 | 开发者实战