FPGA运算单元对高算力浮点应用-电子发烧友网

随着机器学习（Machine Learning）领域越来越多地使用现场可编程门阵列（FPGA）来进行推理（inference）加速，而传统FPGA只支持定点运算的瓶颈越发凸显。Achronix为了解决这一大困境，创新地设计了机器学习处理器（MLP）单元，不仅支持浮点的乘加运算，还可以支持对多种定浮点数格式进行拆分。

MLP全称Machine Learning Processing单元，是由一组至多32个乘法器的阵列，以及一个加法树、累加器、还有四舍五入rounding/饱和saturation/归一化normalize功能块。同时还包括2个缓存，分别是一个BRAM72k和LRAM2k，用于独立或结合乘法器使用。MLP支持定点模式和浮点模式。

考虑到运算能耗和准确度的折衷，目前机器学习引擎中最常使用的运算格式是FP16和INT8，而Tensor Flow支持的BF16则是通过降低精度，来获得更大数值空间。

而且这似乎也成为未来的一种趋势。目前已经有不少研究表明，更小位宽的浮点或整型可以在保证正确率的同时，还可以减少大量的计算量。因此，为了顺应这一潮流，MLP还支持将大位宽乘法单元拆分成多个小位宽乘法，包括整数和浮点数。

值得注意的是，这里的bfloat16即Brain Float格式，而block float为块浮点算法，即当应用Block Float16及更低位宽块浮点格式时，指数位宽不变，小数位缩减到了16bit以内，因此浮点加法位宽变小，并且不需要使用浮点乘法单元，而是整数乘法和加法树即可，MLP的架构可以使这些格式下的算力倍增。

精彩推荐

至芯科技12年不忘初心、再度起航3月6日西安中心FPGA工程师就业班开课、线上线下多维教学、欢迎咨询！

FPGA 视频处理中外部SDRAM的作用

英特尔推新款可编程芯片，能否越位AMD？

扫码加微信邀请您加入FPGA学习交流群

欢迎加入至芯科技FPGA微信学习交流群，这里有一群优秀的FPGA工程师、学生、老师、这里FPGA技术交流学习氛围浓厚、相互分享、相互帮助、叫上小伙伴一起加入吧！

点个在看你最好看

原文标题：FPGA运算单元对高算力浮点应用

文章出处：【微信公众号：FPGA设计论坛】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

FPGA

FPGA

+关注

关注
1638

文章
21860

浏览量
609904

原文标题：FPGA运算单元对高算力浮点应用

文章出处：【微信号：gh_9d70b445f494，微信公众号：FPGA设计论坛】欢迎添加关注！文章转载请注明出处。

工业4.0革命利器！明远智睿SSD2351核心板：低成本+高算力，破解产线智能化难题

力：算力突破：四核A35主频1.5GHz，支持Neon/FPU加速，并行处理PLC控制指令与视觉算法； IVE引擎实现高斯滤波、形态学运算（膨胀/腐蚀）硬件加速，图像预处理效率提升5倍

发表于 03-21 14:22

从堆算力到用算力，宁畅用精装算力，助力产业打造智能化摩天大楼

算力

脑极体

发布于 :2025年01月22日 00:00:50

算智算中心的算力如何衡量？

作为当下科技发展的重要基础设施，其算力的衡量关乎其能否高效支撑人工智能、大数据分析等智能应用的运行。以下是对智算中心算力衡量的详细阐述：一、算

发表于 01-16 14:03 •1186次阅读

科技云报到：要算力更要“算利”，“精装算力”触发大模型产业新变局？

科技云报到：要算力更要“算利”，“精装算力”触发大模型产业新变局？

发表于 01-16 10:24 •267次阅读

FPGA中的浮点四则运算是什么

由于定点的四则运算比较简单，如加减法只要注意符号扩展，小数点对齐等问题即可。在本文中，运用在前一节中描述的自定义浮点格式FPGA中数的表示方法（下），完成浮点四则

发表于 11-16 12:51 •634次阅读

FPGA中浮点四则运算的实现过程

由于定点的四则运算比较简单，如加减法只要注意符号扩展，小数点对齐等问题即可。在本文中，运用在前一节中描述的自定义浮点格式FPGA中数的表示方法（下），完成浮点四则

发表于 11-16 11:19 •1009次阅读

算力基础篇：从零开始了解算力

算力即计算能力（Computing Power），狭义上指对数字问题的运算能力，而广义上指对输入信息处理后实现结果输出的一种能力。虽然处理的内容不同，但处理过程的能力都可抽象为算

发表于 11-15 14:22 •1500次阅读

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片CPU

。 █在算力芯片设计中，芯片拓扑(Topology)结构非常重要。 ●环形(Ring)拓扑方式是一种将多个处理单元连接成环形结构的片上总线技术结构中，每个处理单元都与环上的两个相邻处理

发表于 10-20 12:03

《算力芯片高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——算力之巅：从基准测试到CPU微架构的深度探索

。浮点数单元则专门处理浮点运算，其中加法器和乘法器的设计直接影响了CPU的浮点性能。SIMD（单指令多数据）技术如MMX、SSE、AVX等指

发表于 10-19 01:21

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

本帖最后由 1653149838.791300 于 2024-10-16 22:19 编辑感谢平台提供的书籍，厚厚的一本，很有分量，感谢作者的倾力付出成书。本书主要讲算力芯片CPU

发表于 10-15 22:08

请问AURIX TC3xx tricore架构下浮点运算和将浮点数小数点去掉变成整数来计算哪种方式更加节省算力？

AURIX TC3xx tricore架构下浮点运算和将浮点数小数点去掉变成整数来计算哪种方式更加节省算力？比如一个

发表于 08-26 06:54

算力系列基础篇——算力与计算机性能：解锁超能力的神秘力量！

的？要想提高算力，都有哪些方法？一、算力的关键因素从算力的常见计量单位FPOPS（Floatin

发表于 07-11 08:04 •104次阅读

请问esp32 wroom 32u默认开启硬件浮点运算单元了吗？

请问esp32 wroom 32u 默认开启硬件浮点运算单元了吗？感谢

发表于 06-21 11:08

优秀的Verilog/FPGA开源项目-浮点运算器（FPU）介绍

浮点运算器（英文：floating point unit，简称FPU）是计算机系统的一部分，它是专门用来进行浮点数运算的（CPU中也叫ALU）。

发表于 04-26 11:27 •4640次阅读

算力系列基础篇——算力101：从零开始了解算力

相信大家已经感受到，我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么？那必须是：算力！算力！算

发表于 04-24 08:05 •1002次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

FPGA运算单元对高算力浮点应用

评论

工业4.0革命利器！明远智睿SSD2351核心板：低成本+高算力，破解产线智能化难题

从堆算力到用算力，宁畅用精装算力，助力产业打造智能化摩天大楼

算智算中心的算力如何衡量？

科技云报到：要算力更要“算利”，“精装算力”触发大模型产业新变局？

FPGA中的浮点四则运算是什么

FPGA中浮点四则运算的实现过程

算力基础篇：从零开始了解算力

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片CPU

《算力芯片高性能 CPU/GPU/NPU 微架构分析》第1-4章阅读心得——算力之巅：从基准测试到CPU微架构的深度探索

【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

请问AURIX TC3xx tricore架构下浮点运算和将浮点数小数点去掉变成整数来计算哪种方式更加节省算力？

算力系列基础篇——算力与计算机性能：解锁超能力的神秘力量！

请问esp32 wroom 32u默认开启硬件浮点运算单元了吗？

优秀的Verilog/FPGA开源项目-浮点运算器（FPU）介绍

算力系列基础篇——算力101：从零开始了解算力