搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

TensorFlow官方发布消息称将引入一个新的优化工具包

编者按：几个月前，Tensorflow发布了一份名为《Quantizing deep convolutional networks for efficient inference》的白皮书，主要介绍团队关于模型量化的相关工作，所谓量化，简单来说就是将32浮点数近似地用8位整数存储和计算，量化后，模型占用存储空间减小75%，能起到压缩模型的效果。而现在，这项技术就快和大家见面了。

今天凌晨，TensorFlow官方发布消息称将引入一个新的优化工具包，方便机器学习初学者和高级开发人员进行优化，方便模型的部署和执行。

它的名字是训练后量化（post-training quantization），这是模型量化的一类，主要优点有：

模型占用存储空间缩小75%

如果是主要由卷积层组成的模型，执行速度提高10–50%

如果是基于RNN的模型，执行速度提高3倍

内存、算力要求的降低也意味着大多数模型的功耗会大幅降低

内存、算力、功耗，这是模型量化的主要优化对象，而在实践中，最能从中收益的自然是在各种移动端设备上使用机器学习模型的开发人员，尤其是TensorFlow Lite的用户。

下图展示了使用这个优化工具包后，几种典型模型在存储空间占用上的变化（单核Android Pixel 2手机）：

模型尺寸比较：经优化的模型几乎为原来的1/4

下图是训练后量化对模型执行的加速效果（单核Android Pixel 2手机）：

延迟比较：经优化的模型执行速度提高了1.2到1.4倍

通常情况下，模型压缩会对原有准确率造成不同程度的影响，但训练后量化的影响几乎等同于无，它能在缩小尺寸、提高速度的前提下保持模型精度，如下图所示（单核Android Pixel 2手机）：

启用模型量化

现在训练后量化已被集成到TensorFlow Lite中，它的使用方法很简单：首先构建一个TensorFlow模型，其次在conversion tool中找到模型量化的标志“posttrainingquantize”。假设模型存储在savedmodeldir中，那么具体命令就是：

converter=tf.contrib.lite.TocoConverter.from_saved_model(saved_model_dir)

converter.post_training_quantize=True

tflite_quantized_model=converter.convert()

open(“quantized_model.tflite”, “wb”).write(tflite_quantized_model)

具体操作可见github：github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/lite/tutorials/posttrainingquant.ipynb

虽然目前开发者们只能在TensorFlow Lite中用到这个技术，但官方也称将尽快把它整合到一般的TensorFlow工具中。

小结

除了训练后量化，在之前提到的白皮书中，Tensorflow还提到了训练时量化，它能使模型的准确率更高。而综合来看，它们都是基于量化设计的技术，依靠把32浮点数近似地用8位整数存储和计算来达到内存占用更少、计算更少和功耗更少的目的。

随着深层神经网络不断在现实中落地，这种技术将适应现代科技设备的发展步伐，为开发者和产品用户带来便利。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8418

浏览量
132646
tensorflow

tensorflow

+关注

关注
13

文章
329

浏览量
60536

原文标题：模型大小缩小75%，TensorFlow推出模型优化工具包

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

最新Simplicity SDK软件开发工具包发布

最新的SimplicitySDK软件开发工具包已经发布！此次更新针对SiliconLabs（芯科科技）第二代无线开发平台带来了包括蓝牙6.0的信道探测（Channel Sounding

的头像

发表于 12-24 09:47 •123次阅读

基于EasyGo Vs工具包和Nl veristand软件进行的永磁同步电机实时仿真

EasyGo Vs Addon是一款领先的FPGA仿真工具包软件，它强大地连接了VeriStand软件与Matlab/Simulink，为实时测试和验证领域带来了前所未有的便利和效率，特别适用于汽车

的头像

发表于 11-27 11:28 •244次阅读

基于EasyGo Vs<b class='flag-5'>工具包</b>和Nl veristand软件进行的永磁同步电机实时仿真

FPGA仿真工具包软件EasyGo Vs Addon介绍

EasyGo Vs Addon是一款领先的FPGA仿真工具包软件，它强大地连接了VeriStand软件与Matlab/Simulink，为实时测试和验证领域带来了前所未有的便利和效率，特别适用于汽车、航空航天和能源电力等实时测试和验证至关重要的行业。

的头像

发表于 10-24 15:55 •374次阅读

FPGA仿真<b class='flag-5'>工具包</b>软件EasyGo Vs Addon介绍

采用德州仪器 (TI) 工具包进行模拟前端设计应用说明

电子发烧友网站提供《采用德州仪器 (TI) 工具包进行模拟前端设计应用说明.pdf》资料免费下载

发表于 09-09 11:21 •0次下载

采用德州仪器 (TI) <b class='flag-5'>工具包</b>进行模拟前端设计应用说明

TensorFlow是什么？TensorFlow怎么用？

TensorFlow是由Google开发的一个开源深度学习框架，它允许开发者方便地构建、训练和部署各种复杂的机器学习模型。TensorFlow凭借其高效的计算性能、灵活的架构以及丰富的

的头像

发表于 07-12 16:38 •716次阅读

使用freeRTOS开发工具包时，在哪里可以找到freeRTOS的版本？

作为主题，当我使用 freeRTOS 开发工具包时，在哪里可以找到 freeRTOS 的版本？

发表于 07-09 07:17

tensorflow和pytorch哪个好

tensorflow和pytorch都是非常不错的强大的框架，TensorFlow还是PyTorch哪个更好取决于您的具体需求，以下是关于这两个框架的一些关键点：

的头像

发表于 07-05 09:42 •689次阅读

宝塔面板Docker一键安装：部署GPTAcademic，开发私有GPT学术优化工具

人工智能的浪潮中，GPT模型因其强大的自然语言处理能力备受瞩目。然而，为了更好地应用于学术领域，许多人希望能部署自己私有的GPT学术优化工具。本文将详细介绍如何通过宝塔面板和Docker一键安装

的头像

发表于 07-02 11:58 •2596次阅读

宝塔面板Docker<b class='flag-5'>一</b>键安装：部署GPTAcademic，开发私有GPT学术<b class='flag-5'>优化工具</b>

新加坡推出Project Moonshot -- 这是一款生成式人工智能测试工具包，用于应对LLM安全和安保挑战

新加坡2024年6月3日 /美通社/ -- 新加坡通讯及新闻部部长Josephine Teo 女士推出了AI Verify- Project Moonshot，这是一个易于使用的测试工具包，旨在

的头像

发表于 06-03 19:59 •236次阅读

新加坡推出Project Moonshot -- 这是<b class='flag-5'>一</b>款生成式人工智能测试<b class='flag-5'>工具包</b>，用于应对LLM安全和安保挑战

QE for Motor V1.3.0：汽车开发辅助工具解决方案工具包

电子发烧友网站提供《QE for Motor V1.3.0：汽车开发辅助工具解决方案工具包.pdf》资料免费下载

发表于 02-19 10:44 •0次下载

QE for Motor V1.3.0：汽车开发辅助<b class='flag-5'>工具</b>解决方案<b class='flag-5'>工具包</b>

求助，请问有没有labview opc ua工具包 2018 啊

如题，求助，请问有没有labview opc ua工具包 2018 啊。只要2018的哦

发表于 01-25 20:14

labview工具包下载

求助一个labview2020控制仿真工具包，官网下载不了，这个说能免注册下载网址我打开也是空白，求助好心人帮帮忙分享个 https://download.ni.com/#evalua

发表于 01-16 15:07

利用ProfiShark 构建便携式网络取证工具包

网络安全领域日益重视便携式取证工具的灵活应用。本文介绍了如何构建一个以ProfiShark1G为核心的便携式网络取证工具包，以提高网络取证的效率和实效性

的头像

发表于 01-13 08:04 •1596次阅读

利用ProfiShark 构建便携式网络取证<b class='flag-5'>工具包</b>

Torch TensorRT是一个优化PyTorch模型推理性能的工具

那么，什么是Torch TensorRT呢？Torch是我们大家聚在一起的原因，它是一个端到端的机器学习框架。而TensorRT则是NVIDIA的高性能深度学习推理软件工具包。Torc

的头像

发表于 01-09 16:41 •1743次阅读

Torch TensorRT是<b class='flag-5'>一</b><b class='flag-5'>个</b><b class='flag-5'>优化</b>PyTorch模型推理性能的<b class='flag-5'>工具</b>

解决方案工具包QE显示[RX，RA]V3.2.0：用于显示应用程序的开发辅助工具

电子发烧友网站提供《解决方案工具包QE显示[RX，RA]V3.2.0：用于显示应用程序的开发辅助工具.pdf》资料免费下载

发表于 01-03 09:59 •0次下载

解决方案<b class='flag-5'>工具包</b>QE显示[RX，RA]V3.2.0：用于显示应用程序的开发辅助<b class='flag-5'>工具</b>