回顾驭势联合新加坡国立大学推出东风网络的理解-电子发烧友网

给定目标硬件，如何确定最优的速度-精度折衷边界？换言之：给定推断延时的限制，模型能达到的最高精度是多少？给定精度要求，模型所需的最短延时是多少？

回顾驭势联合新加坡国立大学推出东风网络的理解

为此，驭势科技 AI研究院联合新加坡国立大学提出了偏序关系剪枝（Partial Order Pruning）方法，直接考虑模型在目标硬件上的延时，利用偏序关系假设对搜索空间进行剪枝，平衡模型的宽度与深度，以提高速度-精度折衷的边界。应用该方法所得的东风（DF）骨干网络，取得了目标硬件（TX2）上的最优速度-精度折衷。应用该方法于语义分割网络Decoder的结构搜索，所得的东风分割网络（DF-Seg）也取得了TX2/1080Ti上最优的速度-精度折衷。

在实际运用当中，具备多重实用价值，主要体现在以下几个方面：

（一）DF/DF-Seg网络的实用价值

（1）DF网络取得了目标硬件（TX2）上最优的速度-精度折衷。

回顾驭势联合新加坡国立大学推出东风网络的理解

（2）DF网络节约显存。以DF2A网络为例，其精度介于ResNet50/101之间，而仅需1/3至1/2的显存（以BVLC Caffe测试）。

回顾驭势联合新加坡国立大学推出东风网络的理解

（3）DF网络结构简单，仅使用基本的残差模块，相当于更“精耕细作”的ResNet。

回顾驭势联合新加坡国立大学推出东风网络的理解

（4）DF-Seg网络是TX2/1080Ti/Titan X(Maxwell)上速度-精度折衷最好的分割网络。

回顾驭势联合新加坡国立大学推出东风网络的理解

省时间、省显存、结构简单，使得DF/DF-Seg网络有助于在嵌入式设备TX2上部署高精度、低延时、多路图像并行处理的CNN模型；有助于高端GPU上的视频处理、大规模图像数据处理等任务的部署；有助于科研人员，尤其是计算资源不足的科研人员，节省计算资源，实现更复杂的算法。

（二）偏序关系剪枝算法的实用价值

DF网络更适合GPU平台，我们也利用偏序关系剪枝算法，在骁龙845 CPU平台上进行了骨干网络结构与分割网络Decoder结构的搜索，所得语义分割网络得到了目前CPU平台上最好速度-精度折衷。

回顾驭势联合新加坡国立大学推出东风网络的理解

以下为该论文内容翻译：

一、偏序关系剪枝算法

（一）搜索空间设计与模型结构编码

回顾驭势联合新加坡国立大学推出东风网络的理解

图2(a)为本文的模型搜索空间，图2(b)为本文使用的残差模块结构。网络由6个Stage构成，Stage1~5均通过设步长为2降低输入特征的分辨率，Stage6通过全局池化与全连接层产生分类结果。本文的模型搜索不搜索基本模块的结构，而是在基本残差模块的基础上，对网络整体的宽度与深度进行平衡。在Stage3~5，模型分别包含L/M/N个残差模块，Stage s中的第i个残差模块的宽度记为，因此本文将一个结构表示为：

回顾驭势联合新加坡国立大学推出东风网络的理解

（二）模型延时估计与子搜索空间

图2(a)所表达的搜索空间记为s，实践中我们仅关心延时在中的子集，即。为估计各网络的延时，我们使用TensorRT提供的性能分析工具，在目标硬件TX2上，测量了不同的残差模块所需的延时，并建立一个查找表

回顾驭势联合新加坡国立大学推出东风网络的理解

。这里，分别是输入输出特征的通道数，而

回顾驭势联合新加坡国立大学推出东风网络的理解

是相应的空间尺寸。利用该查找表将各残差模块延时进行加和记为对一个网络延时的估计。在图3(a)中，我们对若干网络的估计延时与实际延时进行了比较，可见估计延时与实际延时基本一致。

回顾驭势联合新加坡国立大学推出东风网络的理解

（三）偏序关系假设

我们借用集合论中的偏序（Partial Order）关系来描述模型结构之间的联系：集合中的元素为不同的模型结构（见图2（a）），集合中的二元关系定义为：若x比y更浅且更窄，则称x是y的前序，记为。如此，整个搜索空间中的模型结构就满足了严格偏序关系，包括反自反性、反对称行、传递性。图4给出了若干模型结构间偏序关系的示意图。偏序关系假设为：若x是y的前序（意味着x比y更浅且更窄），则x的速度更快，精度更低。这可以写为：

回顾驭势联合新加坡国立大学推出东风网络的理解

在图3(b)中，我们基于已训练的模型，对偏序关系假设的合理性进行了验证，其中，

回顾驭势联合新加坡国立大学推出东风网络的理解

，

回顾驭势联合新加坡国立大学推出东风网络的理解

。可见，在本实验所关心的模型子空间中，偏序关系假设是合理的。

（四）偏序关系剪枝

基于偏序关系假设，我们可以在模型搜索中对搜索空间进行剪枝。图5是该剪枝过程的一个示意图。集合为已训练的模型结构，集合中的模型代表了当前迭代中所能达到的最优速度-精度折衷边界。对于一个非边界模型

回顾驭势联合新加坡国立大学推出东风网络的理解

，其任意前序模型

回顾驭势联合新加坡国立大学推出东风网络的理解

，应有：

回顾驭势联合新加坡国立大学推出东风网络的理解

而我们已有速度-精度折衷更好的边界点：

回顾驭势联合新加坡国立大学推出东风网络的理解

因此w的部分前序元素，延时将比高，而精度将比低，也即处于图5的阴影部分。这些中的模型结构无法提供更好的速度-精度折衷，可以据此对搜索空间进行剪枝：。如此反复迭代，在迭代中不断对搜索空间进行剪枝，直至速度-精度折衷的边界趋于稳定，如算法1所描述。

回顾驭势联合新加坡国立大学推出东风网络的理解

（五）语义分割网络的Decoder设计

本文中语义分割网络的结构设计如图6所示，在Stage 5中加入了pyramid pooling module，使用图6(b)所示的Fusion node融合不同分辨率的特征，其中Channel Controller(CC)为1x1卷积，用以控制Decoder在不同分辨率下的宽度。不同的，构成了不同复杂度的Decoder结构。这些Decoder结构之间也存在着偏序关系假设，因此也可以使用偏序关系剪枝算法对搜索空间进行剪枝。

回顾驭势联合新加坡国立大学推出东风网络的理解

二、实验数据

（一）TX2上的骨干网络搜索

我们在TX2上进行骨干网络的搜索，最终选取3个最有代表性的网络，记为3个东风（DF）骨干网络。如图7与表1所示，DF网络取得了TX2上最好的速度-精度折衷。

DF1网络FLOPs明显高于MobileNet于ShuffleNet等，但在TX2上实际延时更低。这是因为FLOPs作为间接指标，仅考虑了浮点计算量而没有考虑内存访问的延时。以ShuffleNetV2与DF1为例，其内存访问代价（也即中间层的特征），分别为4.9M与2.9M。

NASNet与PNASNet在网络结构搜索中均未考虑模型延时，所得模型结构复杂，内存访问量大，实际延时较高。有一些同期工作（ProxylessNAS/FBNet）也在模型搜索中考虑了模型延时，DF网络在速度-精度折衷上也优于这些模型。这是因为：一、这些模型未针对TX2平台进行模型搜索；二、这些网络均基于MobileNetV2的inverted bottleneck模块，相比本文使用的残差模块，内存访问量更高。

回顾驭势联合新加坡国立大学推出东风网络的理解

（二）TX2/1080Ti上的Decoder网络结构搜索

基于TX2上搜索的东风骨干网络，我们也在TX2/1080Ti上分别进行了Decoder结构搜索。如表3所示，东风分割网络（DF-Seg）是目前1080Ti上速度-精度折衷最好的语义分割网络。DF-Seg网络的速度（FPS）与精度（mIoU）均在1024x2048的分辨率下，使用TensorRT提供的性能分析工具在1080Ti上进行测试。为与ICNet公平对比，在FPS(Caffe)栏中使用“Caffe Time”工具，在Titan X(Maxwell)上进行速度测试。表4与表5分别为Titan X(Maxwell)/TX2上的速度测试，DF-Seg的速度大幅优于现有结果，能够在TX2上实现对720P分辨率图像的30FPS的语义分割。

回顾驭势联合新加坡国立大学推出东风网络的理解

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4660

浏览量
94029
网络

网络

+关注

关注
14

文章
7676

浏览量
89905
结构

结构

+关注

关注
1

文章
117

浏览量
21797

反电动势到底如何来理解？（可下载）

电机中的反电动势是如何产生的呢？要了解这个问题，我们需要回顾一下高中时学过的电磁学知识，在电磁学中我们学到过感应电动势，感应电动势又分为动生电动势

发表于 03-04 14:25 •0次下载

东风日产联合Momenta打造全场景高阶智驾

近日， “NI好——东风日产最家技术发布会”在广州长隆举行。作为东风日产新能源技术首秀，本次发布会以“最家”为主题，集中展示东风日产新能源转型的创新成果。

发表于 03-04 10:22 •355次阅读

新加坡云服务器网络中断的常见原因有哪些

新加坡云服务器网络中断的常见原因包括以下几方面：硬件故障，网络设备故障：数据中心内部的路由器、交换机等网络设备出现故障，会导致云服务器无法正常连接

发表于 01-13 17:03 •354次阅读

清华大学深圳国际研究生院、新加坡国立大学：研发新型的超材料生物传感器件最新设计制备

研究背景随着交通运输的快速发展和汽车数量的激增，交通安全问题日益受到关注。根据统计数据，人类因素如嗜睡、疲劳等每年导致美国约10万起交通事故，严重影响了公众的生命安全和社会稳定。因此，研究如何提高驾驶安全性，尤其是通过监测驾驶员的生理状态，成为了一个重要的研究领域。在这一背景下，生物传感器技术作为一种新兴的监测手段，引起了科学家的广泛关注。生物传感器是能够检测生物标志物并提供实时反馈的设备，主要用于监

发表于 01-02 18:14 •452次阅读

东风日产与Momenta合作推出高阶智驾方案

日前，东风日产官宣携手全球领先的自动驾驶公司Momenta，联合打造基于端到端智驾大模型的行业领先高阶智驾方案。东风日产与Momenta的合作，是东风日产智能化转型的关键一步，标志其正

发表于 11-22 16:56 •906次阅读

从新加坡到深圳：南洋理工大学（NTU）与VoiceAI的深度对话

近日，来自新加坡南洋理工大学的数十名师生到访声扬科技深圳总部，与声扬科技“硬核科研团”展开深度交流。公司联合创始人、总经理张伟彬博士出席交流会，与新加坡南洋理工

发表于 11-13 14:29 •657次阅读

【厦门同昌源】受邀参加中国-新加坡健康电子先进材料双边论坛（S3AM-2024）

（IMRE）执行院长罗贤俊院士、厦门大学柔性电子（未来技术）研究院（厦大IFE）常务副院长霍峰蔚教授、新加坡国立大学刘小钢院士担任大会主席。厦门同昌源电子受邀参加本次

发表于 11-12 01:06 •469次阅读

Commvault与Pure Storage联合推出网络就绪解决方案

混合云网络弹性和数据保护解决方案的领先提供商Commvault（纳斯达克代码：CVLT）宣布与Pure Storage联合推出一项网络就绪解决方案。该解决方案能够在帮助企业遵守不断变化的严格法规方面发挥关键作用。

发表于 10-15 09:16 •675次阅读

比亚迪腾势D9登陆新加坡,正式进军右舵国家市场

10月11日最新消息，比亚迪腾势汽车于昨日在新加坡市场正式亮相，标志着其正式进军右舵驾驶国家。　　昨日，右舵版腾势D9在新加坡正式发布，其售价区间为296，888新元至341，

发表于 10-11 17:07 •1125次阅读

中科驭数受邀出席中国科学院大学校友论坛

近日，第五届中国科学院大学校友创新论坛正式举行，本次论坛聚焦科技前沿领域，旨在搭建高端对话平台，促进产学研深度融合。在大算力时代——AI技术前沿沙龙上，中科驭数高级副总裁、CTO卢文岩博士受邀

发表于 09-29 09:45 •452次阅读

中科驭数分析DPU在云原生网络与智算网络中的实际应用

CCF Chip 2024，精彩不能停！7月21日下午，中科驭数在第二届中国计算机学会（CCF）芯片大会的“驭数专属时刻”仍在继续，驭数组织承办“DPU技术趋势和应用——DPU在云原生与智算网

发表于 08-02 11:21 •906次阅读

同星智能赞北京理工大学东风日产方程式赛车队（BITFSAE）

BITFSAE东风日产方程式赛车队北京理工大学东风日产方程式赛车队（BITFSAE）成立于2009年，是一支由赛车技术兴趣爱好者及汽车相关专业人才组成的学生科技创新队伍，连续13年参加中国汽车

发表于 06-18 08:21 •522次阅读

卓驭科技与高通推出成行平台全新智能驾驶解决方案

深圳市卓驭科技（卓驭科技）与高通技术公司宣布深化技术合作，共同推动汽车行业的智能驾驶技术革新。此次合作，双方利用Snapdragon Ride平台，推出了全新的智能驾驶产品。

发表于 05-06 14:26 •858次阅读

新加坡国立大学医院将于2025年上半年启用AI消化系统健康中心

新中心将配置计算机辅助检测、诊断及质量控制三大AI系统。据介绍，这三套系统协同工作，有望更有效地识别早期胃肠病变，并实现对这些病变的实时量化评分癌症诊断。

发表于 05-06 14:13 •729次阅读

Living Well Digitally：由新加坡国立大学可信互联网和社区中心发起并由 DQ 提供支持的全球倡议

新加坡2024年4月20日 /美通社/ -- 2024年4月17日，新加坡国立大学 (NUS) 可信互联网与社区中心 (CTIC) 启动了一项开创性的新计划，"Living Well

发表于 04-21 23:12 •514次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

回顾驭势联合新加坡国立大学推出东风网络的理解

评论

反电动势到底如何来理解？（可下载）

东风日产联合Momenta打造全场景高阶智驾

新加坡云服务器网络中断的常见原因有哪些

清华大学深圳国际研究生院、新加坡国立大学：研发新型的超材料生物传感器件最新设计制备

东风日产与Momenta合作推出高阶智驾方案

从新加坡到深圳：南洋理工大学（NTU）与VoiceAI的深度对话

【厦门同昌源】受邀参加中国-新加坡健康电子先进材料双边论坛（S3AM-2024）

Commvault与Pure Storage联合推出网络就绪解决方案

比亚迪腾势D9登陆新加坡,正式进军右舵国家市场

中科驭数受邀出席中国科学院大学校友论坛

中科驭数分析DPU在云原生网络与智算网络中的实际应用

同星智能赞北京理工大学东风日产方程式赛车队（BITFSAE）

卓驭科技与高通推出成行平台全新智能驾驶解决方案

新加坡国立大学医院将于2025年上半年启用AI消化系统健康中心

Living Well Digitally：由新加坡国立大学可信互联网和社区中心发起并由 DQ 提供支持的全球倡议