0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

恩智浦如何在边缘设备上部署LLM

NXP客栈 来源:NXP客栈 2024-11-29 09:39 次阅读

近来,与AI相关的周期性热点几乎都围绕着大语言模型 (LLM) 和生成式AI模型,这样的趋势反映出这些话题近年来日益增强的影响力和普及程度。与大语言模型和生成式AI模型相关的应用涵盖了广泛的领域,从开放式聊天机器人到任务型助手。虽然LLM主要聚焦基于云和服务器端的应用,但人们对在嵌入式系统和边缘设备中部署这些模型的兴趣也在不断增加。

嵌入式系统 (如家用电器、工业设备、汽车等设备中的微处理器) 需要在成本和功耗受限的情况下,适应有限的计算能力和内存可用性。这使得在边缘设备上部署高精度和高性能的语言模型极具挑战性。

在边缘设备上部署LLM

在嵌入式解决方案中,利用LLM的一个关键领域是操作员与机器之间的自然对话交互,即人机界面 (HMI)。

嵌入式系统可以简化各种输入选项,如麦克风、摄像头或其他传感器,但大多数系统不会像个人电脑、笔记本电脑和手机那样,配备完整的键盘与LLM模型进行交互。因此,嵌入式系统在使用音频和视觉作为LLM输入时,必须具备实用性。这需要一个自动语音识别 (ASR) 或图像识别和分类的预处理模块。

同样,交互的输出选项也有限。嵌入式解决方案能没有屏幕,或者不方便用户阅读屏幕信息。因此,在生成式AI模型之后,需要一个后处理步骤,使用文本到语音 (TTS) 算法将模型输出转换为音频。

恩智浦正在构建eIQ GenAI Flow,通过添加必要的预处理和后处理模块,使其成为一个模块化流程,从而使边缘生成式AI更加实用。

生成式AI正在改变嵌入式应用。阅读恩智浦关于检索增强生成 (RAG) 的白皮书,了解这种方法如何简化LLM的开发过程,点击这里>>

通过LLM革新应用

通过集成基于LLM的语音识别、自然语言理解和文本生成功能,嵌入式设备能够提供更直观和对话式的用户体验。这包括响应语音命令的智能家居设备、通过自然语言控制的工业机械,以及能够进行免提对话的汽车娱乐中控系统,以指导用户或操作车内功能等。

LLM还在健康应用中的嵌入式预测分析和决策支持系统中发挥作用。设备可以嵌入使用特定领域数据训练的语言模型,然后利用自然语言处理分析传感器数据、识别模式并生成见解,同时在边缘实时运行并保护患者隐私,无需将数据发送到云端。

应对生成式AI挑战

在嵌入式环境中部署准确且功能强大的生成式AI模型面临许多挑战。需要优化模型的大小和内存使用,使LLM能够适应目标硬件的资源限制。具有数十亿个参数的模型需要数千兆字节的存储空间,而在边缘系统中,这可能会带来高成本且难以实现。量化和修剪等模型优化技术不仅适用于卷积神经网络,也适用于转换器模型——这是生成式AI克服模型大小问题的重要方法。

像LLM这样的生成式AI模型也有知识局限性。例如,它们的理解是有限的,通常会提供不一致的答案,也称为“幻觉”(hallucination),而且它们的知识受限于训练数据的时效性。训练模型或通过再训练来微调模型可以提高准确性和上下文感知,但这可能在数据收集和所需的训练计算方面花费巨大。

幸运的是,有需求就有创新;通过检索增强生成 (RAG) 可以解决这个问题。RAG方法使用特定上下文数据创建知识数据库,LLM可以在运行时参考这些数据来准确回答查询。

eIQ GenAI Flow将生成式AI和LLM的优势以实用的方式应用于边缘场景。通过将RAG整合到该流程中,我们为嵌入式设备提供特定领域的知识,而不会将用户数据暴露给原始AI模型的训练数据。这样可以确保对LLM的任何更改都是私密的,并且仅在边缘本地使用。

本文作者

Ali Ors,恩智浦半导体边缘处理AI机器学习战略技术主管。Ali专门负责领导各跨职能团队,为机器学习和视觉处理领域提供创新产品和平台。他目前在恩智浦负责全球AI机器学习战略和技术工作。Ali曾在恩智浦汽车业务部负责ADAS和自主产品的AI战略、战略伙伴关系和平台设计。加入恩智浦之前,Ali曾担任CogniVue公司的工程副总裁,负责开发视觉SoC解决方案和认知处理器IP内核。Ali持有加拿大渥太华卡尔顿大学的工程学学位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 嵌入式
    +关注

    关注

    5085

    文章

    19140

    浏览量

    305785
  • 恩智浦
    +关注

    关注

    14

    文章

    5863

    浏览量

    107611
  • LLM
    LLM
    +关注

    关注

    0

    文章

    290

    浏览量

    351
  • 生成式AI
    +关注

    关注

    0

    文章

    505

    浏览量

    485

原文标题:在嵌入式应用中部署生成式AI,恩智浦有个好方法!

文章出处:【微信号:NXP客栈,微信公众号:NXP客栈】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于i.MX95的边缘计算人工智能解决方案

    Tria MSC SM2S-IMX95   基于 i.MX 95 的边缘计算人工智能解决方案 供应商:NXP 产品说明 i.MX
    的头像 发表于 12-26 09:57 820次阅读
    基于i.MX95的<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b><b class='flag-5'>边缘</b>计算人工智能解决方案

    AI模型部署边缘设备的奇妙之旅:如何在边缘部署OpenCV

    的能力。 本文章主要讲述如何在边缘设备上使用OpenCV。本次使用的边缘设备是凌智电子开发的凌智视觉模块,具体如下: 如对该
    发表于 12-14 09:31

    树莓派跑LLM难上手?也许你可以试试Intel哪吒开发板

    的兴起,现在有潜力在更小巧、便携的设备上部署这些模型。例如,Raspberry Pi 树莓派和 Intel 哪吒开发套件等单片机。尽管体积小巧,但它们具备足够的能力运行某些精简版本的模型。本文就两款单片机上运行LLM做一个对比,
    的头像 发表于 12-02 09:43 349次阅读
    树莓派跑<b class='flag-5'>LLM</b>难上手?也许你可以试试Intel哪吒开发板

    基于MCX N系列MCU的应用示例

    全新MCX微控制器系列,为新一代工业与物联网广泛的应用赋能,受到广大边缘智能开发者的青睐。
    的头像 发表于 10-25 14:26 698次阅读

    一站式方案+系统级安全,重新定义边缘智能

    电子发烧友网报道(文/吴子鹏)随着“AI赋能千行百业”的成果涌现,“AI+”已经成为各行业发展的新业态。在安全边缘处理业务媒体沟通会上,
    的头像 发表于 10-17 00:10 2177次阅读
    一站式方案+系统级安全,<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>重新定义<b class='flag-5'>边缘</b>智能

    半导体发布i.MX RT700系列MCU,赋能智能AI边缘设备

    半导体近期震撼发布了其最新力作——i.MX RT700跨界微控制器(MCU)系列,专为推动智能AI在边缘设备的应用而设计。这款创新产品精准定位可穿戴
    的头像 发表于 09-26 16:06 716次阅读

    利用云实验室部署AI模型

    如今,人工智能(AI)非常火爆,这个风口该如何把握?作为一个电子工程师,和AI最主要的交集应该就是边缘计算了,具体来讲,就是在一些性能、功耗以及价格相对较低的嵌入式平台上部署和运行AI模型。
    的头像 发表于 08-02 11:46 2786次阅读
    利用<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>云实验室<b class='flag-5'>部署</b>AI模型

    安富利携手推出人工智能解决方案

    在物联网(IoT)和工业4.0时代,数据的海量化与实时处理需求日益增长,对边缘计算设备提出了前所未有的挑战。对此,安富利携手,基于创新的MCX-N系列微控制器,推出一系列“开箱即
    的头像 发表于 08-01 10:38 1402次阅读
    安富利携手<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>推出人工智能解决方案

    在杭州召开汽车生态技术峰会,推出全新S32 CoreRide开放平台

    峰会上,正式在中国发布了S32 CoreRide开放平台,该平台融合了成熟的S32计算、网络、系统电源管理技术,以及来自
    的头像 发表于 05-30 16:59 1360次阅读

    边缘AI需求大爆发,在安全连接和模拟电源方面有怎样的思考?

    层面都会有所不同,不过这些方案往往也会面临一些共性的问题,比如信息安全的保护,以及引入更高性能和更大系统规模之后带来的功耗挑战。 针对这两大全行业需要面临的共性问题,在2024高管春季媒体沟通会上,
    的头像 发表于 04-28 02:59 4088次阅读
    <b class='flag-5'>边缘</b>AI需求大爆发,<b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>在安全连接和模拟电源方面有怎样的思考?

    亮相2024国际嵌入式大会,展示智能边缘技术

    4月9日至11日,在德国纽伦堡举办的2024国际嵌入式大会(Embedded World)上,盛装亮相,展示最新技术成果如何为创新方案打造坚实的基石,诠释智能
    的头像 发表于 04-15 09:26 1022次阅读

    NVIDIA与联手,在边缘设备上部署AI模型

    工业及IoT边缘高级副总裁Charles Dachs表示,人工智能的创新将塑造智能互联世界的未来,融入Nvidia先进的AI培训技术以及
    的头像 发表于 03-25 16:05 904次阅读

    NVIDIA TAO工具套件功能与eIQ机器学习开发环境的集成

    半导体宣布与NVIDIA合作,将NVIDIA经过训练的人工智能模型通过eIQ机器学习开发环境部署广泛的
    的头像 发表于 03-22 09:11 984次阅读

    推出首次搭载专属神经处理单元(NPU)的MCX N系列!

    半导体强势推出新品MCX N系列产品,首次集成专用神经处理单元(NPU), 可助力实现高性能、低功耗的边缘安全智能。
    的头像 发表于 03-14 09:46 1193次阅读

    发布新一代智能语音技术组合的语音识别引擎

    发布新一代智能语音技术组合的语音识别引擎。本文将探讨开发人员在嵌入式语音控制设计中面临的挑战、新的Speech to Intent引擎,以及您如
    的头像 发表于 01-26 09:15 776次阅读
    <b class='flag-5'>恩</b>智<b class='flag-5'>浦</b>发布新一代智能语音技术组合的语音识别引擎