0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

梯度的独特分布给量化训练带来了极大挑战

lhl545545 来源:商汤科技 作者:商汤科技 2020-06-15 14:32 次阅读

商汤科技CVPR 2020录用论文在多个领域实现突破,包括:对抗式生成模型、三维点云理解与分析、训练加速与模型量化、视频理解与分析、网络结构搜索等。以下为商汤及商汤联合实验室入选CVPR 2020的代表性论文。

▎研究方向:对抗式生成模型

代表性论文:《对人脸生成模型的隐空间可解释性分析》链接:https://arxiv.org/abs/1907.10786

近年来,对抗生成网络(GAN)的快速发展极大地增强了图像生成的质量,也因此得到了越来越广泛的应用。越来越多基于GAN的模型被提出来提高生成质量以及训练稳定性,但是对于生成模型的可解释性还鲜有研究。

本文以人脸生成模型为例,对GAN的隐空间进行了深入分析,目标在于理解GAN是如何将一个随机噪声转化为一张高质量图片的。本文提出了一种简单而通用的技术InterFaceGAN,用于在潜在空间中进行语义人脸编辑,可控制姿势以及其他面部属性,例如性别、年龄、眼镜等,还能够纠正GAN造成的伪影。

代表性论文:《ACGPN:基于图像的自适应生成保留虚拟换装》链接:https://arxiv.org/abs/2003.05863

本文关注基于图像的虚拟换装任务。现有方法取得了很多突破但仍然存在很大问题:(1)人物的肢体仍然是模糊的;(2)对于下装很难做到清楚的保留;(3)衣服的纹理容易产生过度形变。

为此本文利用一种语义敏感的方法,自适应的判断哪部分图像是应该保留的,解决了现有方法中无法对人物肢体与衣服有遮挡的情况的建模,极大程度地降低了生成结果中的伪影以及模糊细节;并通过引入仿射变换的共线性等性质,对变形衣服中的薄板样条插值变换起到约束,使得Logo和花纹不易扭曲变形。 ▎研究方向:三维点云理解与分析 代表性论文:《PV-RCNN: 基于Point-Voxel点云特征深度融合的3D物体检测算法》链接:https://arxiv.org/abs/1912.13192

本文关注基于点云数据的三维物体检测任务。文章提出了一个高性能的3D物体检测框架PV-RCNN,其通过构造Set Abstraction特征抽象操作将基于Point与Voxel的点云特征提取算法分别在Voxel-to-Keypoint阶段和Keypoint-to-RoIGrid 阶段深度融合,使其同时拥有可变感受野、精确的点云位置信息以及高召回率,从而有效提升3D物体检测的性能。

梯度的独特分布给量化训练带来了极大挑战

实验部分,PV-RCNN分别在竞争激烈的自动驾驶数据集KITTI以及更大规模的Waymo数据集上得到了验证。在KITTI数据集的3D物体检测榜Car类别上,PV-RCNN大幅领先其他所有算法,在三个难度上均取得了第一名。在更大规模的Waymo数据集上,PV-RCNN同样在所有难度以及不同距离上超越了现有算法,最高mAP增幅达近7个点。

▎研究方向:训练加速与模型量化

代表性论文:《用于加速卷积神经网络训练过程INT8训练技术》链接//arxiv.org/abs/1912.12607

卷积神经网络训练过程需要耗费大量的计算资源和时间,而各种深度学习硬件都提供非常高效的INT8计算支持。当把INT8计算应用到训练中同时加速网络的前传和反传过程时,梯度的独特分布给量化训练带来了极大挑战。

为了解决梯度量化带来的精度损失,论文进行了量化训练收敛稳定性的理论分析并基于此提出了“误差敏感的学习率调节”和“基于方向自适应的梯度截断”方法,将两个方法在图像分类数据集ImageNet、CIFAR和目标检测数据集PASCAL VOC、COCO上进行实验,均取得了极少的精度损失。

梯度的独特分布给量化训练带来了极大挑战

实验中也验证了该方法对Inception、MobileNet等不同网络结构的通用性。为了保证更高的加速比,论文还提出使用周期更新、量化卷积融合等技术来减少量化操作带来的时间开销。通过在GTX1080TI上实测,可以提升22%的训练过程。

研究方向:视频理解与分析 代表性论文:《TAPOS: 基于时序动作解析理解动作内部和不同动作间的语义》

动作理解是计算机视觉领域的核心问题之一,也是许多其他任务的基石,如智能视频检索,基于视觉的机器人学等。本文发现,人本身对于动作序列中子动作模式的转换是比较敏感的。

在这篇工作中,本文提出了一种时域解析器,可以挖掘人体动作中的子动作模式,并根据挖掘出的子动作模式对较复杂的动作序列进行时域上的解析。这种时域解析器不但能对一个给定的动作序列进行子动作边界划分,还可以找寻大量不同动作序列中相同的子动作模式。本文发现,对较复杂动作序列良好的时域解析可以帮助提升一些较为高层的任务的准确率,如动作识别等。

梯度的独特分布给量化训练带来了极大挑战

▎研究方向:网络结构搜索 代表性论文:《最高加速400倍,探索更好的网络评价方法EcoNas》链接:https://arxiv.org/abs/2001.01233 许多网络搜索算法需要耗费大量的算力,而这些算力绝大多数集中在候选网络(Candidate)的评估上。同样地,由于算力的限制,候选网络的评估往往需要在代理环境(Proxy)下进行,如较短的训练周期数。虽然每个NAS算法都要用到代理环境,但是代理环境对子网络评估的影响仍然是未知的。 本文的工作首次系统研究了不同代理参数对网络评估的影响。作者发现,使用更可靠的代理环境不仅可以极大压缩计算量,也有助于搜到更好的模型。基于对代理环境的研究,作者提出了一个层次化的搜索方法,EcoNAS在将进化算法加速400倍的同时,得到了更好的网络结构。

梯度的独特分布给量化训练带来了极大挑战

同样地,作者发现可靠的代理环境也可以被用于其他搜索算法中,例如权重共享算法,在不影响精度的同时,使得搜索效率进一步提升。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2892

    浏览量

    107640
  • GaN
    GaN
    +关注

    关注

    19

    文章

    1944

    浏览量

    73664
  • 商汤科技
    +关注

    关注

    8

    文章

    513

    浏览量

    36107
收藏 人收藏

    评论

    相关推荐

    AI模型部署边缘设备的奇妙之旅:如何实现手写数字识别

    。 这种方法通常能保留更多的模型精度,因为模型已经在训练中学会了应对量化带来的变化。 优点: 显著降低模型的存储需求和计算复杂度。 在特定硬件(如GPU、NPU)上运行时,可以大幅提升推理速度。
    发表于 12-06 17:20

    协调控制器在分布式光伏领域如何发挥最优控制策略进行调节控制?

    电力系统的稳定运行带来了挑战。为了应对这些挑战,协调控制器在分布式光伏领域的应用显得尤为重要。本文将深入探讨协调控制器在
    的头像 发表于 11-22 14:33 284次阅读
    协调控制器在<b class='flag-5'>分布</b>式光伏领域如何发挥最优控制策略进行调节控制?

    AI客户服务带来了哪些好处

    如今,各行各业的客户服务部门都面临着呼叫量增加、客服人员流失率高、人才短缺以及客户期望不断变化等挑战
    的头像 发表于 11-20 09:22 351次阅读

    训练RNN时如何避免梯度消失

    有效的训练。为了解决这个问题,可以采取以下几种方法: 梯度裁剪(Gradient Clipping) 梯度裁剪是限制梯度大小的技术,通过设置梯度
    的头像 发表于 11-15 10:01 362次阅读

    激光打靶射击训练系统 DW-S602提供军事训练效率

    分析和反馈,帮助训练者提高射击技能和战斗反应能力。 随着现代科技的飞速发展,公安武警及新兵训练领域也迎来了技术革新的浪潮。其中,模拟轻武器射击训练系统激光打靶设备以其
    的头像 发表于 11-03 09:54 441次阅读

    AI普及嵌入式设计人员带来挑战

    探讨了人工智能(AI)的普及嵌入式设计人员带来的新挑战。在创建“边缘机器学习(ML)”应用时,设计人员必须确保其能有效运行,同时最大限度地降低处理器和存储开销,以及物联网(IoT)设备的功耗
    发表于 08-22 14:20 693次阅读
    AI普及<b class='flag-5'>给</b>嵌入式设计人员<b class='flag-5'>带来</b>新<b class='flag-5'>挑战</b>

    有刷换向电机EMC噪声的产生及其解决方法详解

    智能座舱这几年的发展不仅驾驶员带来了便捷舒适,也电机行业也带来了一个新的挑战
    的头像 发表于 05-21 11:49 1521次阅读
    有刷换向电机EMC噪声的产生及其解决方法详解

    存内计算技术工具链——量化

    本篇文章将重点讲述存内计算技术工具链之“量化”,我们将从面向存内计算芯片的深度学习编译工具链、神经网络中的量化(包括训练量化量化感知
    的头像 发表于 05-16 12:35 1265次阅读
    存内计算技术工具链——<b class='flag-5'>量化</b>篇

    大语言模型:原理与工程时间+小白初识大语言模型

    分布式表示,基于预训练的词嵌入表示。 独热表示就是在一个大的向量空间中,其中一个位1,其余都为0,这样就会变成单独的。 词的分布式表示:根据上下文进行推断语义。 基于预训练的词嵌入表
    发表于 05-12 23:57

    【大语言模型:原理与工程实践】大语言模型的基础技术

    特定任务对模型进行微调。这种方法的成功不仅是自然语言处理发展的一个转折点,还为许多现实世界的应用场带来了前所未有的性能提升。从广为人知的GPT到BERT,预训练的模型参数量越来越大预训练数据越来越多
    发表于 05-05 12:17

    JPEG LS算法局部梯度值计算原理

    如果同一个上下文中对少量元素进行编码,通常无法获得足够的上下文编码信息。但是如果对大量元素进行编码又会带来存储空间变大的问题。因此要对局部梯度值进行量化处理。
    的头像 发表于 04-25 10:46 499次阅读
    JPEG LS算法局部<b class='flag-5'>梯度</b>值计算原理

    分布式运维管理平台在云计算环境中的实施案例分析

    一、案例背景 随着云计算技术的快速发展,越来越多的企业开始将业务迁移到云上,以实现资源的灵活调配和成本的降低。然而,云计算环境的复杂性和动态性运维管理带来了巨大的挑战。为了应对这些挑战
    的头像 发表于 03-26 16:16 565次阅读

    分布式运维管理平台在跨地域企业中的部署与运维案例

    一、案例背景 随着全球化进程的加速和市场竞争的加剧,越来越多的企业开始拓展跨地域业务,形成多分支机构、多数据中心的运营模式。然而,这种跨地域运营模式也企业的运维管理带来了极大挑战
    的头像 发表于 03-26 16:11 486次阅读

    功率放大器在声波截面梯度场的重建及其在声波场处理中的应用

    光束偏转断层成像的一个扩展版本。基于波场的梯度与相对声压分布,可以直接采用基尔霍夫积分定理来进一步计算和分析波场。   研究方向:声光传感、声场重建   测试设备:ATA-4051高压功率放大器
    发表于 03-08 17:45

    分布式智慧终端:挑战与解决方案

    是一个重要的问题。解决方案包括采用分布式一致性协议,如Paxos、Raft等,以及通过数据备份和恢复机制来确保数据的安全性。 故障容忍性挑战分布式系统中的组件和服务往往分布在不同的
    的头像 发表于 01-24 14:50 458次阅读