0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

把Transformer大模型部署在端侧,IPC SoC正在普惠AI

21克888 来源:电子发烧友网 作者:黄晶晶 2023-12-08 13:50 次阅读

电子发烧友网报道(文/黄晶晶)AI大模型袭卷而来,而如何让终端产品插上AI的翅膀会是芯片厂商研发的方向和市场的机会。如今网络摄像机作为智慧城市、智能家居等应用的主流终端发展迅速,IPC SoC芯片是其核心之一。最近爱芯元智带来的两款IPC SoC新品在黑光全彩处理、适配Transformer大模型等方面表现十分亮眼,爱芯元智副总裁史欣也向媒体分享了公司对IPC SoC高清化、智能化发展的洞察。

两款IPC SoC:AX630C和AX620Q




爱芯元智带来的两款新产品AX630C和AX620Q都搭载了最新的爱芯智眸AI-ISP4.0图像处理引擎以及爱芯通元4.0高性能、低功耗的NPU引擎。这些技术的升级使得这两款产品在视频图像效果、智能业务处理和分析等方面均达到了业界的领先水平。

爱芯智眸AI-ISP4.0对HDR、去噪、demosaic、锐化、去雾等算法做了升级,在暗光下的噪声处理、色彩还原、运动拖影、清晰度等方面较上一代产品更优秀,通过AI赋能ISP Pipeline里的关键模块,在各种复杂应用场景中全面提升成像效果,为后期智能处理提供高质量的图像、视频素材。

爱芯通元混合精度NPU则通过减少数据搬运,在一定程度上减小了内存墙和功耗墙的阻碍,提高整个NPU的效率,从而在端侧边缘侧面积、功耗受限的情况下,以更高的有效算力支持更多的智能算法。

爱芯元智的“真黑光”技术,则是通过爱芯智眸AI-ISP将画面真实还原,后续再通过NPU进行优化,进行更加准确的图像处理,在极低照度下获得超越人眼所见的黑光全彩效果。

AX630C具有高算力的特征,其CPU采用双核A53@1.2G,配合3.2T@INT8的NPU以及硬化的CV算子模块,可以对4K图像进行实时的智能处理,提高客户智能算法处理的精度和性能。同时,AX630C新一代的NPU引擎支持主流的Transformer网络如ViT/DeiT/Swin/SwinV2/DETR等,可以解决训练数据集不足引起的算法精度下降,以及长尾场景下算法的泛化性问题。

据介绍,AX630C是爱芯元智面向智慧城市行业前端IPC市场推出的超高清智能SoC,可支持4K@30fps实时真黑光;AX620Q是爱芯元智面向模组与渠道行业前端IPC市场推出的高清智能SoC,可支持5Mp实时、4K非实时的真黑光。

从细节上看,为了实现黑光全彩的效果,爱芯智眸AI-ISP4.0集中对四个关键模块进行了算法升级。史欣分析,传统ISP由十几个模块组成,在算力足够大的时候若不考虑成本可以用AI模型去增加每一个模块。而爱芯元智结合了客户的痛点需求和成本因素,对pipeline模块中HDR、3DNR、RLTM、Demosaic等进行了增强,达到了色彩饱和度高、运动图像无拖尾,以及噪声、锐化、清晰度等效果的显著提高。后续,爱芯元智还将针对防抖、3A等模块进行优化。

这其中的另一个问题是AI的算力消耗,本质上来说尽可能将模块的精确度提高就能更少的消费算力。史欣举例说,例如做人脸处理是对整个区域或者部分区域做降噪,消费的算力不一样。原来在400万分辨率的情况下需要1T做整个AI-ISP的处理,现在爱芯元智的第三、四代产品已经降到了0.6甚至0.5T,接下来可以做到0.2T就可以完成3DNR降噪的算力消耗,既能降低芯片成本,又可以留出更多的算力让客户开发更多可能。

Transformer在智慧城市中的应用


“Transformer应用的一个典型场景是对信息特征的检索,从最早期的后端处理、服务器处理,算法上云,到目前开始进入算法在边缘侧的部署等等,但始终没有解决端侧部署的问题。大的厂商能够根据行业应用来适配模型大小,而Transformer兴起之后将带来更多具象化的信息,使得检索更容易、并缩减检索的时间。”史欣说道。

爱芯元智能够帮助客户把在服务器、云端训练好的算法在裁剪之后在端侧部署。这里既有部署性包括带宽、功耗、成本等的考虑,也有精度的要求。爱芯元智通过几年来在NPU和算法工具链的迭代,IPC SoC能够支持算法的快速部署、保证精度,具备端侧部署的软硬件条件。



不仅是Transformer大模型,爱芯元智还在适配国内的DINOv2大模型,爱芯元智依托硬件NPU、软件算法等技术并与合作伙伴共同推出算法部署国产化。

普惠AI


我们看到爱芯元智有一个非常明确的发展理念,即是普惠AI。AI不应只在云端,更应该让消费、智慧城市、汽车等各个行业受惠。史欣谈到,客户希望能够从To G或者To大B的业务部署向To小B,甚至To C的业务上进行部署。即便是家用摄像头这个普及型消费电子产品,也需要AI-ISP加持,那么更需要像爱芯元智这样具备软硬件能力的厂商通过产品技术、性价比等去拥抱市场。

对于AI芯片的发展趋势,史总给出预判,他认为端侧AI的小型化将越来越多的落地,同时其性能要有前瞻性和较高的性价比。同时产品的易用性加强,芯片厂商的方案交付要更简单。同时除了自身掌握关键技术之外,也需要生态合作伙伴做更丰富的算法和软件,如此才能加快AI的普惠化,助力智能化产业升级。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268892
  • 智能城市
    +关注

    关注

    1

    文章

    172

    浏览量

    20757
  • 爱芯元智
    +关注

    关注

    1

    文章

    78

    浏览量

    4830
收藏 人收藏

    评论

    相关推荐

    四大厂商业绩大涨背后,积极探索AI SoC芯片创新迭代

    电子发烧友网报道(文/李弯弯)近年来,模型技术的带动下,AI应用正在迅速往迁移,产品形态
    的头像 发表于 08-27 01:28 4667次阅读
    四大厂商业绩大涨背后,积极探索<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b> <b class='flag-5'>SoC</b>芯片创新迭代

    中信建投建议关注AI模组机会

    析,OpenAI在其“连续12天直播发布”的第5天宣布,支持Apple Intelligence的苹果设备现已能够开启ChatGPT功能。这一消息不仅显示了AI技术消费级市场的广泛应用潜力,也预示着
    的头像 发表于 12-17 14:05 226次阅读

    广和通开启AI新时代

    AI发展正酣,随着终端芯片算力越来越高、模型能力越来越强、实时响应及隐私保护的应用需求增
    的头像 发表于 12-12 10:35 167次阅读

    智谱推出四个全新模型 携英特尔按下AI普及加速键

    随着AI的发展,AI模型越来越受到广大客户及厂商的关注,业界领先的大模型公司智谱于近日推出了
    的头像 发表于 12-02 17:13 196次阅读
    智谱推出四个全新<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>模型</b> 携英特尔按下<b class='flag-5'>AI</b>普及加速键

    把握关键节点,美格智能持续推动AI规模化拓展

    当前,AI模型走向已经是大势所趋,AI的发
    的头像 发表于 11-26 01:00 132次阅读
    把握关键节点,美格智能持续推动<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>规模化拓展

    把握关键节点,美格智能持续推动AI规模化拓展

    当前,AI模型走向已经是大势所趋,AI的发
    的头像 发表于 11-25 16:45 233次阅读
    把握关键节点,美格智能持续推动<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>规模化拓展

    AI浪潮已来!炬芯科技发布新一代AI音频芯片,能效比和AI算力大幅度提升

    AI音频芯片。   2028 年中小型模型AI
    的头像 发表于 11-06 09:11 2471次阅读
    <b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>浪潮已来!炬芯科技发布新一代<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>音频芯片,能效比和<b class='flag-5'>AI</b>算力大幅度提升

    快速部署Tensorflow和TFLITE模型Jacinto7 Soc

    电子发烧友网站提供《快速部署Tensorflow和TFLITE模型Jacinto7 Soc.pdf》资料免费下载
    发表于 09-27 11:41 0次下载
    快速<b class='flag-5'>部署</b>Tensorflow和TFLITE<b class='flag-5'>模型</b><b class='flag-5'>在</b>Jacinto7 <b class='flag-5'>Soc</b>

    Yuan2.0千亿大模型通用服务器NF8260G7上的推理部署

    巨量模型的智能生产力正在逐步渗透到各行各业,但它们的部署和运行通常需要专用的AI加速卡,能否CPU上运行千亿大
    的头像 发表于 07-30 14:26 400次阅读
    Yuan2.0千亿大<b class='flag-5'>模型</b><b class='flag-5'>在</b>通用服务器NF8260G7上的推理<b class='flag-5'>部署</b>

    基于AX650N/AX630C部署大语言模型Qwen2

    本文将分享如何将最新的大语言模型部署到超高性价比SoC上,向业界对
    的头像 发表于 07-06 17:43 3512次阅读
    基于AX650N/AX630C<b class='flag-5'>部署</b><b class='flag-5'>端</b><b class='flag-5'>侧</b>大语言<b class='flag-5'>模型</b>Qwen2

    模型部署加速,都有哪些芯片可支持?

    小型化、场景化需求的增加,推理逐步从云端扩展向。这种趋势PC和手机等终端产品上尤为明显。   大模型
    的头像 发表于 05-24 00:14 4092次阅读

    模型装进小盒子:这个小魔盒直击AIGC的痛点!

    私有本地化部署:智能硬件的未来随着当下数字化的高速发展,今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生,模型
    的头像 发表于 05-10 08:33 358次阅读
    <b class='flag-5'>把</b>大<b class='flag-5'>模型</b>装进小盒子:这个小魔盒直击<b class='flag-5'>端</b><b class='flag-5'>侧</b>AIGC的痛点!

    AI硬件大爆发,这个小魔盒直击AIGC的痛点

    私有本地化部署AI硬件的未来随着当下AI的高速发展,今年将会迎来“大模型应用爆发元年”。市面上不少大模型产品应运而生,
    的头像 发表于 05-07 08:02 414次阅读
    <b class='flag-5'>AI</b>硬件大爆发,这个小魔盒直击<b class='flag-5'>端</b><b class='flag-5'>侧</b>AIGC的痛点

    商汤发布业内最快推理速度「日日新 5.0 模型

    现在,就是AI模型应用的春天!
    的头像 发表于 04-29 10:32 573次阅读
    商汤发布业内最快推理速度「日日新 5.0 <b class='flag-5'>端</b><b class='flag-5'>侧</b>大<b class='flag-5'>模型</b>」

    荣耀引领AI新时代

    今年的MWC盛会上,荣耀宣布与高通、Meta携手,将70亿参数大模型引入,这一创新举措预示着
    的头像 发表于 03-01 10:28 630次阅读