资料介绍
软件简介
TNN是一个移动端高性能、轻量级推理框架,同时拥有跨平台、高性能、模型压缩、代码裁剪等众多突出优势。TNN框架在原有Rapidnet、ncnn框架的基础上进一步加强了移动端设备的支持以及性能优化,同时也借鉴了业界主流开源框架高性能和良好拓展性的优点。目前TNN已经在手Q、微视、P图等应用中落地,欢迎大家参与协同共建,促进TNN推理框架进一步完善。
快速开始
使用 TNN 非常简单,如果你有一个已经训练好的模型, 那么一般而言通过以下三个步骤就能完成模型在目标平台上的部署。
-
第一步是把训练好的模型转换成TNN的模型,为此我们提供了丰富的工具来帮助你完成这一步,无论你使用的是 TensorFlow、PyTorch、或者 Caffe,都可以轻松完成转换。
-
当你完成了模型的转换,第二步就是编译目标平台的 TNN 引擎了,你可以根据自己的目标平台的硬件支持情况,选择 CPU/ARM/OpenCL/Metal 等加速方案。 对于这些平台,TNN 都提供了一键编译的脚本,使用非常方便。
-
最后一步就是使用编译好的 TNN 引擎进行推理,你可以在自己的应用程序中嵌入对 TNN 的调用,这方面我们提供了丰富而详实的 demo 来帮助你完成。
技术方案
目前TNN已经在手Q、微视、P图等应用中落地:
-
计算优化
-
低精度优化
- 支持 INT8, FP16 低精度计算,减少模型大小、内存消耗,同时利用硬件低精度计算指令加速计算
- 支持 INT8 Winograd 算法,(输入6bit), 在精度满足要求的情况下,进一步降低模型计算复杂度
- 支持单模型多种精度混合计算,加速计算同时保证模型精度
-
内存优化
- 高效”内存池”实现:通过 DAG 网络计算图分析,实现无计算依赖的节点间复用内存,降低 90% 内存资源消耗
- 跨模型内存复用:支持外部实时指定用于网络内存,实现“多个模型,单份内存”。
-
主流模型实测性能:v0.1 2020.05.29
-
model cpu time(单线程,ms) gpu time(ms) Mobilenet_v1 88 12 Mobilenet_v1_int8 55 Mobilenet_v2 58 11 Mobilenet_v2_int8 41 squeezenet_v1.0 127 20 squeezenet_v1.0_int8 82 -
骁龙835:
model cpu time(单线程,ms) gpu time(ms) Mobilenet_v1 94 16 Mobilenet_v1_int8 62 Mobilenet_v2 61 14 Mobilenet_v2_int8 47 squeezenet_v1.0 122 28 squeezenet_v1.0_int8 93 -
model cpu time(单线程,ms) gpu time(ms) Mobilenet_v1 60 10 Mobilenet_v1_int8 37 Mobilenet_v2 39 8 Mobilenet_v2_int8 28 squeezenet_v1.0 74 14 squeezenet_v1.0_int8 56
-
-
TNN架构图:
-
通过 ONNX 支持 TensorFlow, PyTorch, MXNet, Caffe 等多种训练框架,充分利用和融入不断完善的 ONNX 开源生态。当前支持 ONNX 算子55个,近期会完善到约80个,覆盖主流CNN网络
-
支持主流安卓、iOS、Embedded Linux 操作系统,支持 ARM CPU, GPU 硬件平台(近期还会加入达芬奇 NPU 支持)
-
模块化设计,将模型解析、计算图构建、优化、底层硬件适配、高性能 kernel 实现各部分抽象隔离,通过 Factory Mode 注册、构建设备,方便接入更多的底层硬件、加速方案。
-
Runtime 无任何第三方库依赖,CPU 动态库尺寸仅约 400KB,并提供基础图像变换操作,调用简单便捷。跨平台模型统一、调用接口统一,通过单个配置参数快速切换。
- 纳米框架Esp32开源分享
- 开源雾计算软件框架FogLAMP介绍(二):FogLAMP介绍
- 开源雾计算软件框架FogLAMP介绍(三):FogLAMP架构分析
- 移动端基于GPU推理的神经网络推理框架
- 端侧softmax推理的数学等价优化
- 开源网络协议分析器WireShark软件下载 15次下载
- 跨媒体数据分析与推理技术综述 15次下载
- 一种基于框架特征的共指消解方法 7次下载
- 如何使用物联网操作系统Zephyr实现“连续集成”开源软件的详细说明
- 基于改进模糊熵和证据推理的多属性决策方法 1次下载
- 网络资源分配框架的软件设计和应用 10次下载
- 移动机器人软件框架构思详细资料免费下载 11次下载
- AN1292与电机控制应用程序框架对比 2次下载
- 达芬奇软件框架技术融入共享内存技术进行数据交换的改进中文概述 4次下载
- 从ResearchKit应用探讨移动医疗的发展 0次下载
- SemiDrive X9 AI 开发环境搭建 175次阅读
- Torch TensorRT是一个优化PyTorch模型推理性能的工具 1018次阅读
- 介绍一款基于昆仑芯AI加速卡的高效模型推理部署框架 1460次阅读
- 全平台系统开源免费抓包软件ProxyPin概述 1724次阅读
- 三种主流模型部署框架YOLOv8推理演示 2365次阅读
- 腾讯开源的前端框架介绍 1813次阅读
- PyTorch开源深度学习框架简介 4235次阅读
- 编写机智云安卓开源框架的UI界面 1626次阅读
- 移植开源Gui框架GuiLite到STM32F4OLED屏幕 3334次阅读
- 谷歌重新定义开源软件漏洞治理框架 2657次阅读
- Facebook与CMU联手打造开源框架PyRobot 3746次阅读
- NASA的开源软件是什么?NASA的开源软件的详细分析 7186次阅读
- TensorFlow的框架结构解析 7032次阅读
- 将TVM用于移动端常见的ARM GPU,提高移动设备对深度学习的支持能力 1w次阅读
- 红帽推出Ansible 2.2 :为开源自动化框架奠定牢靠的基础 984次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多