0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生成式AI的功能简述

英特尔物联网 来源:英特尔物联网 2023-09-24 15:34 次阅读

作者:Yury Gorbachev 英特尔院士

翻译:武卓 英特尔AI软件布道师;杨亦诚 英特尔 AI软件工程师

在过去的一年里,我们看到了生成式AI用例和模型的爆炸式增长。现在几乎每周都会针对不同的领域发布新的值得注意的生成式模型,这些模型在不断增加的数据集上训练,具有各种计算复杂性。使用像LoRA这样的方法,可以在非常适度的训练加速器上微调大模型,这解锁了对基础模型的更多修改。由于资源消耗,部署这些模型仍然是挑战,并且高度依赖于在云端部署模型。

随着 OpenVINO 2023.1 版本的发布,我们希望将生成式 AI 的强大功能引入常规台式机和笔记本电脑,让这些模型可以运行在在资源受限的本地环境中,并被您尝试集成到自己的应用程序中。我们在整个产品中针对这些场景进行了优化,实现了一些关键功能,并为我们的下一步工作计划奠定了基础。

也就是说,我们的变化不仅限于生成式AI,我们还改进了产品的其它部分,并希望它能使您的工作更轻松,并为您带来额外的价值。让我们来看看这些变化到底是什么。

生成式AI功能

大模型的整体堆栈优化。来自生成式AI家族的模型有一个共同点——它们亟需资源。模型尺寸巨大,运行它们所需的内存量非常高,对内存带宽的需求也非常大。例如不必要的权重搬运这样简单的问题,都可能会导致由于内存不足而无法运行模型。

为了更好地适应这一点,我们已经跨推理堆栈工作,包括 CPUGPU(集成显卡和独立显卡),目标就是优化我们使用这些模型的方式,包括优化读取和编译模型所需的内存,优化如何处理模型的输入和输出张量以及其他内部结构,从而缩短模型执行时间。

大型语言模型的权重量化。LLM 在执行时需要大量的内存带宽。为了对此进行优化,我们在 NNCF(神经网络压缩框架)优化框架和 CPU 推理中实现了 int8 LLM 权重量化功能。

使用此功能时,NNCF 将生成优化的 IR 模型文件,与精度为 fp16 的常规模型文件相比,该文件能够将尺寸减小一半。IR 文件将在 CPU 插件中被执行额外的优化,这将改善延迟并减少运行时内存消耗。GPU 的类似功能正在实施中,并将在后续发布的版本中提供。

更容易转换模型。大多数LLM目前来自基于PyTorch的环境。要转换这些模型,您现在可以使用我们的直接 PyTorch 转换功能。对于LLM,与我们之前通过ONNX格式的路径相比,这大大加快了转换时间并减少了内存需求。

总体而言,由于我们的优化,我们能够在CPU和GPU上均能提高 LLM 性能。[WZ1]此外,我们还按 倍数级减少了运行这些模型所需的内存量。在某些情况下,新版本OpenVINO可以让我们运行那些以前由于内存不足而失败的模型。我们一直在数十个不同规模和不同任务的LLM上验证我们的工作,以确保我们的方法能够很好地扩展到我们所有的平台和支持的操作系统

我们的转换API和权重量化功能也集成到Hugging Face optimum-intel扩展中,允许您使用OpenVINO作为推理堆栈运行生成式模型,或以方便的方式将模型导出为OpenVINO格式。

简化您的工作流

不再需要开发包,提供统一的工具。从 2023.1 版本开始,我们不再要求您为运行时和开发环境分别安装单独的软件包。我们一直致力于简化我们的工具,并将所有必要的组件集成到单个 OpenVINO软件包中。这也意味着模型转换和推理可以通过所有OpenVINO分发机制以统一的方式获得:pip,conda,brew和archive。

此外,从此版本开始,OpenVINO Python API 可从所有支持最低要求 Python 版本 (3.7) 的软件包中获得。这意味着除了以前可用的 pip 之外,还有conda、brew和指定的 apt 版本。

更高效、更友好的模型转换。我们正在推出OpenVINO模型转换工具 (OVC),该工具正在取代我们众所周知的离线模型转换任务中的模型优化器 (MO) 工具。该工具以OpenVINO包形式提供,依靠内部模型前端来读取框架格式,不需要原始框架来执行模型转换。例如,如果您想将TF模型转换为OpenVINO,则不需要安装TensorFlow。同样,如果您想简单地在 OpenVINO运行时中读取此模型以进行推理而无需转换,同样也不需要 TensorFlow。

为了在 Python 脚本中转换模型,我们进一步改进了convert_model API。例如,它允许将模型从 PyTorch 对象转换为 OpenVINO模型,并编译模型以进行推理或将其保存到 IR格式,请参见以下示例:

c6a191c2-5936-11ee-939d-92fbcf53809c.png

请注意,我们还简化了我们的Python API,可以直接从OpenVINO命名空间获得这些API,因此这一切变得更简单了。您仍然可以从旧命名空间访问函数,如果您需要 mo 工具,可以安装 OpenVINO-dev。这个工具本身也仍然可用,但我们建议迁移到 ovc 工具。

默认切换到 fp16 IR。随着转换工具的变化,我们现在切换到使用 fp16 精度作为 IR 中的数据类型。这允许将模型大小减小 一半(相对FP32精度的模型),并且根据我们执行的测试对准确性没有影响。值得一提的是,IR 精度不会影响硬件插件的执行精度,默认情况下,插件始终以最佳性能继续执行。

更好的PyTorch兼容性

前面已经提到,直接转换PyTorch模型的功能现在已经成熟,该方案已经被集成在我们的 HuggingFace optimum-intel中进行模型转换。因此,现在转换模型更容易,因为您绕过了 ONNX 格式的额外步骤(我们仍然无限制地支持)。

为了使OpenVINO更接近PyTorch生态系统,我们引入了对torch.compile和相应后端的支持。您现在可以通过 OpenVINO堆栈运行您的模型,方法是通过torch.compile编译它并指定 OpenVINO 作为后端!

如下例所示:

c6bf32b8-5936-11ee-939d-92fbcf53809c.png

此功能正在积极增强,我们期待更好的性能和操作覆盖范围,但它已经在我们的集成中使用,例如Stable Diffusion WebUI。

令人兴奋的新Notebook用例

为了展示您可以直接从笔记本电脑上试用的新功能,我们制作了一些Jupyter notebooks示例并更新了现有notebooks。以下是最令我们兴奋的:

基于大语言模型的聊天机器人(LLM Chatbot):

c6f00d70-5936-11ee-939d-92fbcf53809c.png

文生图模型StableDiffusion XL:

文生图模型 Tiny SD

生成音乐模型 MusicGen:

生成视频模型Text-to-video:

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9848

    浏览量

    171200
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267906
  • pytorch
    +关注

    关注

    2

    文章

    798

    浏览量

    13100
  • OpenVINO
    +关注

    关注

    0

    文章

    83

    浏览量

    162

原文标题:介绍OpenVINO™ 2023.1:在边缘端赋能生成式AI|开发者实战

文章出处:【微信号:英特尔物联网,微信公众号:英特尔物联网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI的「七宗罪」!

    面对生成AI日渐增长的「罪恶」,我们该如何解决问题?
    的头像 发表于 05-07 16:34 1701次阅读
    <b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>的「七宗罪」!

    什么是生成AI生成AI的四大优势

    生成AI是一种特定类型的AI,专注于生成新内容,如文本、图像和音乐。这些系统在大型数据集上进行训练,并使用机器学习算法
    发表于 05-29 14:12 4470次阅读

    虹软图像深度恢复技术与生成AI的创新 生成AI助力

    当前,生成人工智能(AI)技术的快速发展令人瞩目。它能够理解人类的描述,并在短时间内生成逼真的图像和视频。在生成
    发表于 06-21 09:06 427次阅读

    ChatGPT热潮继续 甲骨文将在其人力资源软件中添加生成AI功能

    ChatGPT热潮继续 甲骨文将在其人力资源软件中添加生成AI功能 ChatGPT 这类 AI 工具已经在科技行业掀起了一股热潮,
    的头像 发表于 06-29 15:54 561次阅读

    利用 NVIDIA Jetson 实现生成 AI

    近日,NVIDIA 发布了 Jetson 生成 AI 实验室(Jetson Generative AI Lab),使开发者能够通过 NVIDIA Jetson 边缘设备在现实世界中探
    的头像 发表于 11-07 21:25 879次阅读
    利用 NVIDIA Jetson 实现<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b>

    生成AI技术的应用前景

    生成 AI(人工智能)与我们熟知的 AI 有何不同?这篇文章将为我们一探究竟!
    的头像 发表于 11-29 12:20 1246次阅读

    Amazon Connect新增生成AI功能

    Connect Contact Lens为客户互动添加了AI生成摘要功能,帮助管理人员评估和优化坐席表现; Amazon Connect中的Amazon Lex现已利用生成
    的头像 发表于 12-18 17:34 500次阅读

    生成AI对智能家居的影响

    电子发烧友网站提供《生成AI对智能家居的影响.pdf》资料免费下载
    发表于 01-02 14:50 17次下载

    谷歌地图引入生成AI功能

    谷歌近日宣布,在其广受欢迎的谷歌地图应用中引入了全新的生成AI功能。这一创新功能利用大型模型,深入分析了地图上超过2.5亿个地点的详细信息
    的头像 发表于 02-06 16:42 4944次阅读

    博世与微软合作开发生成AI产品

    全球知名科技公司博世与微软联合宣布,双方已建立合作关系,共同致力于开发先进的生成AI产品。这一合作的核心目标在于通过利用生成
    的头像 发表于 03-05 11:17 792次阅读

    IBM与SAP深化生成AI领域合作

    近日,IBM与SAP宣布将进一步扩大他们的合作范围,共同在生成人工智能(AI)领域进行深度探索。此次合作的核心在于,双方将共同为SAP的RISE平台构建全新的生成
    的头像 发表于 05-13 09:19 421次阅读

    荣耀新品将搭载谷歌AI功能,提升生成AI体验

    荣耀于5月22日宣布,将在新款智能手机上集成谷歌的AI功能,实现生成AI体验。此外,新机还将得到谷歌云服务的支持。
    的头像 发表于 05-23 08:51 416次阅读

    原来这才是【生成AI】!!

    随着ChatGPT、文心一言等AI产品的火爆,生成AI已经成为了大家茶余饭后热议的话题。可是,为什么要在AI前面加上“
    的头像 发表于 06-05 08:04 290次阅读
    原来这才是【<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>】!!

    NVIDIA AI助力SAP生成AI助手Joule加速发展

    在美国佛罗里达州奥兰多举行的 SAP Sapphire 大会上,NVIDIA 与这家企业软件公司公布了搭载NVIDIA AI Enterprise软件的生成 AI 合作成果,其为 S
    的头像 发表于 09-09 09:37 345次阅读

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.ai小编为您整理
    的头像 发表于 10-28 11:19 105次阅读