资料介绍
软件简介
AKG(Auto Kernel Generator)对深度神经网络中的算子进行优化,并提供特定模式下的算子自动融合功能。AKG与MindSpore的图算融合功能协同工作,可提升在不同硬件后端上运行网络的性能。
AKG由四个基本的优化模块组成:规范化、自动调度、指令发射和后端优化。
-
规范化: 为了解决polyhedral表达能力的局限性(只能处理静态的线性程序),需要首先对计算公式IR进行规范化。规范化模块中的优化主要包括自动运算符inline、循环拆分和公共子表达式优化等。
-
自动调度: 自动调度模块基于polyhedral技术,主要包括自动向量化、自动切分、依赖分析和数据搬移等。
-
指令发射: 指令发射模块的优化主要包括循环规范化、标签自动生成和指令发射等。
-
后端优化: 后端优化模块的优化主要包括双缓冲区、存储重写和同步指令插入等。
硬件后端支持
当前支持Ascend910
,gpu v100/A100
等,更多硬件后端支持待开发。
构建
从MindSpore侧构建
详细细节请参考MindSpore README.md。
独立构建
我们建议您从MindSpore侧构建运行AKG代码,但同时为了方便开发,我们提供了独立编译运行AKG的方式。 详细的编译依赖请参考MindSpore安装指南。
bash build.sh -t $target // target can set 'gpu' or 'ascend'
运行
- 设置环境变量
-
Ascend910
cd tests source ./test_env.sh amd64 export export PATH=${PATH}:${YOUR_CCEC_COMPILER_PATH}
-
GPU V100/A100
cd tests source ./test_env.sh gpu
- 运行测试用例
-
Ascend910
cd tests/operators/vector pytest -s test_abs_001.py -m "level0" # 运行level0测试用例
-
GPU V100/A100
cd tests/operators/gpu python3 test_all.py -a "op_name" #运行op_name算子测试用例
- 基于深度迁移学习网络的肺结节辅助CT诊断 8次下载
- 端到端的深度学习网络人体自动抠图算法 10次下载
- 基于预训练模型和长短期记忆网络的深度学习模型 19次下载
- 3小时学习神经网络与深度学习课件下载 0次下载
- 深度神经网络模型的压缩和优化综述 20次下载
- 深度模型中的优化与学习课件下载 3次下载
- 使用TensorFlow建立深度学习和机器学习网络 18次下载
- 一种基于深度学习的地下浅层震源定位方法 10次下载
- 深度学习网络训练技巧的详细资料汇总 10次下载
- 快速了解神经网络与深度学习的教程资料免费下载 33次下载
- 深度学习优化器方法及学习率衰减方式的详细资料概述 9次下载
- 深度学习是什么?了解深度学习难吗?让你快速了解深度学习的视频讲解 16次下载
- 基于卷积神经网络的深度学习参数分布对网络性能的影响 0次下载
- 基于深度学习的安卓恶意应用检测 4次下载
- CDMA网络深度覆盖的天线应用与RSSI指标优化分析 23次下载
- 神经网络优化器有哪些 298次阅读
- 深度神经网络(DNN)架构解析与优化策略 579次阅读
- 神经网络优化算法有哪些 268次阅读
- 深度学习与卷积神经网络的应用 542次阅读
- 深度学习模型训练过程详解 424次阅读
- 深度学习的模型优化与调试方法 432次阅读
- 详解深度学习、神经网络与卷积神经网络的应用 1564次阅读
- 深度学习神器DYnet++:轻松驾驭复杂自由曲面,3D测量无难度! 502次阅读
- 深度学习中的图像分割 1106次阅读
- 深度学习中多种优化算法 2477次阅读
- 深度学习模型小型化处理的五种方法 4096次阅读
- 深度学习和普通机器学习的区别 4345次阅读
- 深度学习在各个领域有什么样的作用深度学习网络的使用示例分析 7512次阅读
- 基于Keras搭建的深度学习网络示例 8150次阅读
- 如何估算深度神经网络的最优学习率(附代码教程) 2431次阅读
下载排行
本周
- 1山景DSP芯片AP8248A2数据手册
- 1.06 MB | 532次下载 | 免费
- 2RK3399完整板原理图(支持平板,盒子VR)
- 3.28 MB | 339次下载 | 免费
- 3TC358743XBG评估板参考手册
- 1.36 MB | 330次下载 | 免费
- 4DFM软件使用教程
- 0.84 MB | 295次下载 | 免费
- 5元宇宙深度解析—未来的未来-风口还是泡沫
- 6.40 MB | 227次下载 | 免费
- 6迪文DGUS开发指南
- 31.67 MB | 194次下载 | 免费
- 7元宇宙底层硬件系列报告
- 13.42 MB | 182次下载 | 免费
- 8FP5207XR-G1中文应用手册
- 1.09 MB | 178次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 2555集成电路应用800例(新编版)
- 0.00 MB | 33566次下载 | 免费
- 3接口电路图大全
- 未知 | 30323次下载 | 免费
- 4开关电源设计实例指南
- 未知 | 21549次下载 | 免费
- 5电气工程师手册免费下载(新编第二版pdf电子书)
- 0.00 MB | 15349次下载 | 免费
- 6数字电路基础pdf(下载)
- 未知 | 13750次下载 | 免费
- 7电子制作实例集锦 下载
- 未知 | 8113次下载 | 免费
- 8《LED驱动电路设计》 温德尔著
- 0.00 MB | 6656次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935054次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537798次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420027次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234315次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191187次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183279次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138040次下载 | 免费
评论
查看更多