解锁LLM新高度—OpenVINO™ 2024.1赋能生成式AI高效运行-电子发烧友网

大语言模型推理的改进

LLM 的发展仍保持着惊人的速度。尽管现有的 LLM 已经具备强大的功能，但通过 OpenVINO 的优化和推理加速，可以对这些复杂模型的执行进行精炼，实现更快、更高效的处理，减少计算开销并最大限度发挥硬件潜力，这将直接导致 LLM 实现更高的吞吐量和更低的延迟。

通过采用压缩嵌入实现额外优化，有效地缩减了 LLM 的编译耗时与内存占用。与此同时，基于英特尔锐炫GPU，以及英特尔高级矩阵扩展（Intel AMX）的第4代和第5代英特尔至强平台之上，LLM 的第一个 token 处理性能得到了显著提升。

通过 oneDNN 可实现更好的 LLM 压缩与性能提升。如今，经过量化或压缩后的 INT4 和 INT8 精度的 LLM 可在英特尔锐炫GPU 上得到支持。在搭载集成 GPU 的英特尔酷睿Ultra 处理器上，针对部分小型 GenAI 模型显著减少了内存消耗。

此外，现在可以在 PyTorch 模型进行训练后量化之后，对其进行微调，以提高模型精度并简化从训练后量化过渡到训练感知量化的过程。

已添加演示示例：https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆盖范围和框架集成

进一步深入了解搭载 OpenVINO 的生成式 AI，该新版本拓宽了生成式AI的边界，使其能够覆盖更广泛的神经网络架构与应用场景。

针对最新发布的最先进的 Llama 3 和 Phi3 模型， OpenVINO 对其实现了支持和优化。

具备混合专家（MoE）架构的 LLM 模型 Mixtral 以及 URLNet 模型，均针对英特尔至强处理器进行了性能提升优化。

而文生图模型 Stable Diffusion 1.5，以及 LLMs 模型 ChatGLM3-6b和Qwen-7B，则专为搭载了集成 GPU 的英特尔酷睿Ultra 处理器进行了推理速度的改进和优化。

现在，OpenVINO 已支持 Falcon-7B-Instruct，这是一款即用型、具备优秀性能指标的生成式AI大语言模型，适用于聊天与指令场景。

新版本支持的其他模型包括：

Yolo V9、Yolo V8 Oriented Bounding Box Detection （OOB）、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及带有 OpenVINO 和 LangChain 的 RAG 系统。

我们还在 OpenVINO Notebooks 存储库中提供了 Jupyter Notebook 示例。

新平台的更改和现有平台的增强

除了 PyPI 上的主 OpenVINO 软件包外，英特尔酷睿Ultra 处理器的预览 NPU 插件现在在 OpenVINO 开源 GitHub 存储库中可用。

现在，可以通过 npm 存储库更轻松地访问 JavaScript API，使 JavaScript 开发人员能够无缝访问 OpenVINO API。我们扩展了文档，可帮助开发人员将他们的 JavaScript 应用程序与 OpenVINO 集成。

现在，默认情况下已在 ARM 处理器上为卷积神经网络（CNN）启用 FP16 推理。在多种 ARM 设备上，已显著提升了众多模型的性能。已实现与 CPU 架构无关的构建，旨在为不同 ARM 设备提供统一的二进制分发。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有价值的资源，用于展示如何利用 OpenVINO 在人工智能领域实现重要进展。最近，我们对 OpenVINO notebooks 存储库做了一些改动，包括将默认分支从 'main' 更改为 'latest'，以及对 "notebooks" 文件夹内 notebook 的命名结构进行了改进。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

GPU芯片

GPU芯片

+关注

关注
1

文章
303

浏览量
5834
生成式AI

生成式AI

+关注

关注
0

文章
505

浏览量
487
OpenVINO

OpenVINO

+关注

关注
0

文章
93

浏览量
210

原文标题：解锁 LLM 新高度，拓宽模型新边界 —— OpenVINO™ 2024.1 赋能生成式 AI 高效运行 | 开发者实战

文章出处：【微信号：英特尔物联网，微信公众号：英特尔物联网】欢迎添加关注！文章转载请注明出处。

解锁光伏发电新高度：探秘 400V 转 660V 升压变压器核心力量

解锁光伏发电新高度：探秘 400V 转 660V 升压变压器核心力量在追求绿色能源变革的征程中，光伏发电已然成为耀眼的明星，而 400V 转 660V 升压变压器则是隐藏在幕后、默默发力的关键

发表于 12-27 10:27 •120次阅读

<b class='flag-5'>解锁</b>光伏发电<b class='flag-5'>新高度</b>：探秘 400V 转 660V 升压变压器核心力量

三行代码完成生成式AI部署

OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分为两个安装包分别是基础包与生成式AI支持包，新发布的Ge

发表于 08-30 16:49 •428次阅读

三行代码完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

高通第三代骁龙7s移动平台发布,赋能中端智能手机以卓越AI新体验

式AI技术，并兼容包括Baichuan-7B及拥有10亿参数的Llama 2在内的大型语言模型（LLM），极大地推动了智能手机智能化进程的新高度。

发表于 08-21 15:42 •2237次阅读

亚马逊云科技赋能Shulex打造基于生成式AI的客服和消费者洞察

"Shulex"）在亚马逊云科技的技术赋能下，打造基于生成式AI的"AI Agent客服机器人"

发表于 08-13 20:38 •295次阅读

使用OpenVINO GenAI API的轻量级生成式AI

随着 ChatGPT 等聊天机器人的风暴席卷全球，生成式预训练 Transformers （GPT）在开发者中正在成为家喻户晓的新名字。生成式 A

发表于 07-24 15:08 •628次阅读

商汤发布《2024生成式AI赋能教育未来》白皮书

生成式AI正在各个行业中展现出巨大的应用前景。在关系国计民生的教育行业，生成式AI能够催生哪些创

发表于 06-29 09:48 •854次阅读

亚马逊云科技携手SAP通过生成式AI解锁创新潜力

科技与SAP宣布扩大战略合作，旨在革新现代化的云ERP体验，并利用生成式AI为企业带来全新功能与效率提升。双方将共同努力，简化客户在亚马逊云科技上采用RISE with SAP解决方案的流程，提高SAP工作负载在云端

发表于 06-07 10:53 •350次阅读

Arm平台赋能移动端生成式AI

生成式人工智能 (Generative AI) 涵盖了当下广为人知，且备受关注的大语言模型 (LLM)，如今也已落地边缘侧的移动设备。

发表于 04-26 11:09 •815次阅读

生成式 AI 进入模型驱动时代

随着ChatGPT和大型语言模型(LLM)呈现爆炸式增长，生成式人工智能(GenerativeAI)成为近来的一大热词。由此引发了一场争论：哪种AI

发表于 04-13 08:12 •545次阅读

研扬携手英特尔，联合举办创AI百城行（武汉站）：用OpenVINO™赋能AI于边缘计算平台

边缘计算作为实现智能化、高效化数据处理的关键技术，日益受到业界的广泛关注。为了进一步推动AI边缘计算技术的发展与应用，3月27日研扬科技与英特尔在武汉共同举办了以“用OpenVINO赋

发表于 04-04 08:05 •270次阅读

亚马逊云科技助力沐瞳应用生成式AI技术打造卓越游戏体验赋能业务决策

北京 ——2024 年 2 月 21 日亚马逊云科技宣布，上海沐瞳科技有限公司（以下简称“沐瞳”）应用亚马逊云科技Amazon Bedrock等生成式AI服务，为玩家打造卓越的游戏体验并

发表于 02-22 11:20 •227次阅读

亚马逊云科技助力沐瞳应用生成式AI技术打造卓越游戏体验赋能业务决策

北京2024年2月21日 /美通社/ -- 亚马逊云科技宣布，上海沐瞳科技有限公司（以下简称"沐瞳"）应用亚马逊云科技Amazon Bedrock等生成式AI服务，为玩家打造卓越的游戏体验并赋

发表于 02-22 09:25 •423次阅读

安霸发布全新N1系列生成式AI芯片

安霸在CES 2024上发布了全新的N1系列生成式AI芯片，这是一款专门为前端设备设计的芯片，支持本地运行大型语言模型（LLM）应用。其单颗

发表于 01-09 15:32 •1394次阅读

安霸发布N1系列生成式AI芯片支持前端设备运行本地LLM应用

单颗 SoC 支持 1 至 340 亿参数的多模态大模型（Multi-Modal LLM）推理，实现前端低功耗生成式 AI。

发表于 01-09 15:19 •964次阅读

OpenVINO™ 赋能千元级『哪吒』AI开发套件大语言模型 | 开发者实战

，大多数高性能模型通常需要昂贵的计算资源，使得它们的应用受限于有限的环境。本文将探讨在OpenVINO的赋能下，如何在不足千元的AI开发板上部署Stable-Zeph

发表于 01-06 08:05 •1546次阅读