FPGA：X-DB异构计算实现百万级TPS的技巧 - 全文

X-Engine 是集团数据库事业部研发的新一代存储引擎，是新一代分布式数据库X-DB的根基。为了达到10倍MySQL性能，1/10存储成本的目标，X-DB从一开始就使用了软硬件结合的设计思路，以充分发挥当前软件和硬件领域最前沿的技术优势。而引入FPGA加速是我们在定制计算领域做出的第一个尝试。目前FPGA加速版本的X-DB已经在线上开始小规模灰度，在今年6.18，双11大促中，FPGA将助力X-DB，将在不增加成本的前提下，满足阿里业务对数据库更高的性能要求。

背景介绍

作为世界上最大的在线交易网站，阿里巴巴的 OLTP （online transaction processing）数据库系统需要满足高吞吐的业务需求。根据统计，每天 OLTP 数据库系统的记录写入量达到了几十亿，在2017年的双十一，系统的峰值吞吐达到了千万级TPS (transactions per second)。阿里巴巴的业务数据库系统主要有以下几个特点：

事务高吞吐并且读操作和写操作的低延时；

写操作占比相对较高，传统的数据库workload，读写比一般在 10:1 以上，而阿里巴巴的交易系统，在双十一当天读写比达到了 3:1；

数据访问热点比较集中，一条新写入的数据，在接下来7天内的访问次数占整体访问次数的99%，超过7天之后的被访问概率极低。

为了满足阿里的业务对性能和成本近乎苛刻的要求，我们重新设计开发了一个存储引擎称为X-Engine。在X-Engine中，我们引入了诸多数据库领域的前沿技术，包括高效的内存索引结构，写入异步流水线处理机制，内存数据库中使用的乐观并发控制等。

为了达到极致的写性能水平，并且方便分离冷热数据以实现分层存储，X-Engine借鉴了LSM-Tree的设计思想。其在内存中会维护多个 memtable，所有新写入的数据都会追加到 memtable ，而不是直接替换掉现有的记录。由于需要存储的数据量较大，将所有数据存储在内存中是不可能的。

当内存中的数据达到一定量之后，会flush到持久化存储中形成 SSTable。为了降低读操作的延时，X-Engine通过调度 compaction 任务来定期 compact持久化存储中的 SSTable，merge多个 SSTable 中的键值对，对于多版本的键值对只保留最新的一个版本（所有当前被事务引用的键值对版本也需要保留）。

根据数据访问的特点，X-Engine会将持久化数据分层，较为活跃的数据停留在较高的数据层，而相对不活跃(访问较少)的数据将会与底层数据进行合并，并存放在底层数据中，这些底层数据采用高度压缩的方式存储，并且会迁移到在容量较大，相对廉价的存储介质 (比如SATA HDD) 中，达到使用较低成本存储大量数据的目的。

如此分层存储带来一个新的问题：即整个系统必须频繁的进行compaction，写入量越大，Compaction的过程越频繁。而compaction是一个compare & merge的过程，非常消耗CPU和存储IO，在高吞吐的写入情形下，大量的compaction操作占用大量系统资源，必然带来整个系统性能断崖式下跌，对应用系统产生巨大影响。

而完全重新设计开发的X-Engine有着非常优越的多核扩展性，能达到非常高的性能，仅仅前台事务处理就几乎能完全消耗所有的CPU资源，其对资源的使用效率对比InnoDB,如下图所示：

FPGA：X-DB异构计算实现百万级TPS的技巧

在如此性能水平下，系统没有多余的计算资源进行compaction操作，否则将承受性能下跌的代价。

经测试，在 DbBench benchmark 的 write-only 场景下，系统会发生周期性的性能抖动，在 compaction 发生时，系统性能下跌超过40%，当 compaction 结束时，系统性能又恢复到正常水位。如下图所示：

FPGA：X-DB异构计算实现百万级TPS的技巧

但是如果 compaction 进行的不及时，多版本数据的累积又会严重影响读操作。

为了解决 compaction 的抖动问题，学术界提出了诸如 VT-tree、bLSM、PE、PCP、dCompaction 等结构。尽管这些算法通过不同方法优化了 compaction 性能，但是 compaction 本身消耗的 CPU 资源是无法避免的。据相关研究统计，在使用SSD存储设备时，系统中compaction的计算操作占据了60%的计算资源。因此，无论在软件层面针对 compaction 做了何种优化，对于所有基于 LSM-tree 的存储引擎而言，compaction造成的性能抖动都会是阿喀琉斯之踵。

幸运的是，专用硬件的出现为解决compaction导致的性能抖动提供了一个新的思路。实际上，使用专用硬件解决传统数据库的性能瓶颈已经成为了一个趋势，目前数据库中的select、where操作已经offload到FPGA上，而更为复杂的 group by 等操作也进行了相关的研究。但是目前的FPGA加速解决方案存在以下两点不足：

目前的加速方案基本上都是为SQL层设计，FPGA也通常放置在存储和host之间作为一个filter。虽然在FPGA加速OLAP系统方面已经有了许多尝试，但是对于OLTP系统而言，FPGA加速的设计仍然是一个挑战；

随着FPGA的芯片尺寸越来越小，FPGA内部的错误诸如单粒子翻转（SEU）正在成为FPGA可靠性的越来越大的威胁，对于单一芯片而言，发生内部错误的概率大概是3-5年，对于大规模的可用性系统，容错机制的设计显得尤为重要。

为了缓解compaction对X-Engine系统性能的影响，我们引入了异构硬件设备FPGA来代替CPU完成compaction操作，使系统整体性能维持在高水位并避免抖动，是存储引擎得以服务业务苛刻要求的关键。本文的贡献如下：

FPGA compaction 的高效设计和实现。通过流水化compaction操作，FPGA compaction取得了十倍于CPU单线程的处理性能；

混合存储引擎的异步调度逻辑设计。由于一次FPGA compaction的链路请求在ms级别，使用传统的同步调度方式会阻塞大量的compaction线程并且带来很多线程切换的代价。通过异步调度，我们减少了线程切换的代价，提高了系统在工程方面的可用性。

容错机制的设计。由于输入数据的限制和FPGA内部错误，都会造成某个compaction 任务的回滚，为了保证数据的完整性，所有被FPGA回滚的任务都会由同等的CPU compaction线程再次执行。本文设计的容错机制达到了阿里实际的业务需求并且同时规避了FPGA内部的不稳定性。

问题背景

X-Engine的Compaction

X-Engine的存储结构包含了一个或多个内存缓冲区（memtable）以及多层持久化存储 L0, L1, ... ，每一层由多个SSTable组成。

FPGA：X-DB异构计算实现百万级TPS的技巧

当memtable写满后，会转化为 immutable memtable，然后转化为SSTable flush到L0层。每一个SSTable包含多个data block和一个用来索引data block的index block。当L0层文件个数超过了限制，就会触发和L1层有重叠key range的SSTable的合并，这个过程就叫做compaction。类似的，当一层的SSTable个数超过了阈值都会触发和下层数据的合并，通过这种方式，冷数据不断向下流动，而热数据则驻留在较高层上。

一个compaction过程merge一个指定范围的键值对，这个范围可能包含多个data block。一般来说，一个compaction过程会处理两个相邻层的data block合并，但是对于L0层和L1层的compaction需要特殊考虑，由于L0层的SSTable是直接从内存中flush下来，因此层间的SSTable的Key可能会有重叠，因此L0层和L1层的compaction可能存在多路data block的合并。

FPGA：X-DB异构计算实现百万级TPS的技巧

对于读操作而言，X-Engine需要从所有的memtable中查找，如果没有找到，则需要在持久化存储中从高层向底层查找。因此，及时的compaction操作不仅会缩短读路径，也会节省存储空间，但是会抢夺系统的计算资源，造成性能抖动，这是X-Engien亟待解决的困境。

FPGA加速数据库

从现在的FPGA加速数据库现状分析，我们可以将FPGA加速数据库的架构分为两种，"bump-in-the-wire" 设计和混合设计架构。前期由于FPGA板卡的内存资源不够，前一种架构方式比较流行，FPGA被放置在存储和host的数据路径上，充当一个filter，这样设计的好处是数据的零拷贝，但是要求加速的操作是流式处理的一部分，设计方式不够灵活；

后一种设计方案则将FPGA当做一个协处理器，FPGA通过PCIe和host连接，数据通过DMA的方式进行传输，只要offload的操作计算足够密集，数据传输的代价是可以接受的。混合架构的设计允许更为灵活的offload方式，对于compaction这一复杂操作而言，FPGA和host之间数据的传输是必须的，所以在X-Engine中，我们的硬件加速采用了混合设计的架构。

FPGA：X-DB异构计算实现百万级TPS的技巧

系统设计

在传统的基于LSM-tree的存储引擎中，CPU不仅要处理正常的用户请求，还要负责compaction任务的调度和执行，即对于compaction任务而言，CPU既是生产者，也是消费者，对于CPU-FPGA混合存储引擎而言，CPU只负责compaction任务的生产和调度，而compaction任务的实际执行，则被offload到专用硬件（FPGA）上。

FPGA：X-DB异构计算实现百万级TPS的技巧

对于X-Engine，正常用户请求的处理和其他基于LSM-tree的存储引擎类似：

用户提交一个操作指定KV pair（Get/Insert/Update/Delete）的请求，如果是写操作，一个新的记录会被append到memtable上；

当memtable的大小达到阈值时会被转化为immutable memtable；

immutable memtable转化为SSTable并且被flush到持久化存储上。

当L0层的SSTable数量达到阈值时，compaction任务会被触发，compaction的offload分为以下几个步骤：

从持久化存储中load需要compaction的SSTable，CPU通过meta信息按照data block的粒度拆分成多个compaction任务，并且为每个compaction任务的计算结果预分配内存空间，每一个构建好的compaction任务都会被压入到Task Queue队列中，等待FPGA执行；

CPU读取FPGA上Compaction Unit的状态，将Task Queue中的compaction任务分配到可用的Compaction Unit上；

输入数据通过DMA传输到FPGA的DDR上；

Compaction Unit执行Compaction任务，计算完成后，结果通过DMA回传给host，并且附带return code指示此次compaction任务的状态（失败或者成功），执行完的compaction结果会被压入到Finished Queue队列中；

CPU检查Finished Queue中compaction任务的结果状态，如果compaction失败，该任务会被CPU再次执行；

compaction的结果flush到存储。

详细设计

FPGA-based Compaction

Compaction Unit (CU) 是FPGA执行compaction任务的基本单元。一个FPGA板卡内可以放置多个CU，单个CU由以下几个模块组成：

FPGA：X-DB异构计算实现百万级TPS的技巧

Decoder. 在X-Engine中，KV是经过前序压缩编码后存储在data block中的，Decoder模块的主要作用是为了解码键值对。每一个CU内部放置了4个Decoder，CU最多支持4路的compaction，多余4路的compaction任务需要CPU进行拆分，根据评估，大部分的compaction都在4路以下。放置4个Decoder同样也是性能和硬件资源权衡的结果，和2个Decoder相比，我们增加了50%的硬件资源消耗，获得了3倍的性能提升。

KV Ring Buffer. Decoder 模块解码后的KV pair都会暂存在KV Ring Buffer中。每一个KV Ring Buffer维护一个读指针（由Controller模块维护）和一个写指针（由Decoder模块维护），KV Ring Buffer 维护3个信号来指示当前的状态：FLAG_EMPTY, FLAG_HALF_FULL, FLAG_FULL，当FLAG_HALF_FULL为低位时，Decoder模块会持续解码KV pair，否则Decoder会暂停解码直到流水线的下游消耗掉已经解码的KV pair。

KV Transfer. 该模块负责将key传输到Key Buffer中，因为KV的merge只涉及key值的比较，因此value不需要传输，我们通过读指针来追踪当前比较的KV pair。 Key Buffer. 该模块会存储当前需要比较的每一路的key，当所有需要比较的key都被传输到Key Buffer中，Controller会通知Compaction PE进行比较。

Compaction PE. Compaction Processing Engine （compaction PE）负责比较Key Buffer中的key值。比较结果会发送给Controller，Controller会通知KV Transfer将对应的KV pair传输到Encoding KV Ring Buffer中，等待Encoder模块进行编码。

Encoder. Encoder模块负责将Encoding KV Ring Buffer中的KV pair编码到data block中，如果data block的大小超过阈值，会将当前的data block flush到DDR中。

Controller. 在CU中Controller充当了一个协调器的作用，虽然Controller不是compaction pipeline的一部分，单在compaction 流水线设计的每一个步骤都发挥着关键的作用。

一个compaction过程包含三个步骤：decode，merge，encode。设计一个合适的compaction 流水线的最大挑战在于每一个步骤的执行时间差距很大。比如说由于并行化的原因，decode模块的吞吐远高于encoder模块，因此，我们需要暂停某些执行较快的模块，等待流水线的下游模块。为了匹配流水线中各个模块的吞吐差异，我们设计了controller模块去协调流水线中的不同步骤，这样设计带来的一个额外好处是解耦了流水线设计的各个模块，在工程实现中实现更敏捷的开发和维护。

FPGA：X-DB异构计算实现百万级TPS的技巧

在将FPGA compaction集成到X-Engine中，我们希望可以得到独立的CU的吞吐性能，实验的baseline是CPU单核的compaction线程（Intel(R) Xeon(R) E5-2682 v4 CPU with 2.5 GHz）

FPGA：X-DB异构计算实现百万级TPS的技巧

从实验中我们可以得到以下三个结论：

在所有的KV长度下，FPGA compaction的吞吐都要优于CPU单线程的处理能力，这印证了compaction offload的可行性；

随着key长度的增长，FPGA compaction的吞吐降低，这是由于需要比较的字节长度增加，增加了比较的代价；

加速比（FPGA throughput / CPU throughput）随着value长度的增加而增加，这是由于在KV长度较短时，各个模块之间需要频繁进行通信和状态检查，而这种开销和普通的流水线操作相比是非常昂贵的。

异步调度逻辑设计

由于FPGA的一次链路请求在ms级别，因此使用传统的同步调度方式会造成较频繁的线程切换代价，针对FPGA的特点，我们重新设计了异步调度compaction的方式：CPU负责构建compaction task并将其压入Task Queue队列，通过维护一个线程池来分配compaction task到指定的CU上，当compaction结束后，compaction任务会被压入到Finished Queue队列，CPU会检查任务执行的状态，对于执行失败的任务会调度CPU的compaction线程再次执行。通过异步调度，CPU的线程切换代价大大减少。

FPGA：X-DB异构计算实现百万级TPS的技巧

容错机制的设计

对于FPGA compaction而言，有以下三种原因可能会导致compaction 任务出错

数据在传输过程中被损坏，通过在传输前和传输后分别计算数据的CRC值，然后进行比对，如果两个CRC值不一致，则表明数据被损坏；

FPGA本身的错误（比特位翻转），为了解决这个错误，我们为每一个CU配置了一个附加CU，两个CU的计算结果进行按位比对，不一致则说明发生了比特位翻转错误；

compaction输入数据不合法，为了方便FPGA compaction的设计，我们对KV的长度进行了限制，超过限制的compaction任务都会被判定为非法任务。

对于所有出错的任务，CPU都会进行再次计算，确保数据的正确性。在上述的容错机制的下，我们解决了少量的超过限制的compaction任务并且规避了FPGA内部错误的风险。

FPGA：X-DB异构计算实现百万级TPS的技巧

实验结果

实验环境

CPU：64-core Intel (E5-2682 v4, 2.50 GHz) processor

内存：128GB

FPGA 板卡：Xilinx VU9P

memtable: 40 GB

block cache 40GB

我们比较两种存储引擎的性能：

X-Engine-CPU：compaction操作由CPU执行

X-Engine-FPGA：compaction offload到FPGA执行

DbBench

FPGA：X-DB异构计算实现百万级TPS的技巧

结果分析：

在write-only场景下，X-Engine-FPGA的吞吐提升了40%，从性能曲线我们可以看出，当compaction开始时，X-Engine-CPU系统的性能下跌超过了三分之一；

由于FPGA compaction吞吐更高，更及时，因此读路径减少的更快，因此在读写混合的场景下X-Engine-FPGA的吞吐提高了50%；

读写混合场景的吞吐小于纯写场景，由于读操作的存在，存储在持久层的数据也会被访问，这就带来了I/O开销，从而影响了整体的吞吐性能；

两种性能曲线代表了两种不同的compaction状态，在左图，系统性能发生周期性的抖动，这说明compaction操作在和正常事务处理的线程竞争CPU资源；对于右图，X-Engine-CPU的性能一直稳定在低水位，表明compaction的速度小于写入速度，导致SSTable堆积，compaction任务持续在后台调度；

由于compaction的调度仍然由CPU执行，这也就解释了X-Engine-FPGA仍然存在抖动，并不是绝对的平滑。

YCSB

FPGA：X-DB异构计算实现百万级TPS的技巧

结果分析：

在YCSB benchmark上，由于compaction的影响，X-Engine-CPU的性能下降了80%左右，而对于X-Engine-FPGA而言，由于compaction调度逻辑的影响，X-Engine-FPGA的性能只有20%的浮动；

check unique的存在引入了读操作，随着压测时间的增长，读路径变长，因此两个存储引擎的性能随着时间下降；

在write-only场景下，X-Engine-FPGA的吞吐提高了40%，随着读写比的上升，FPGA Compaction的加速效果逐渐降低，这是因为读写比越高，写入压力越小，SSTable堆积的速度越慢，因此执行compaction的线程数减少，因此对于写密集的workload，X-Engine-FPGA的性能提升越明显；

随着读写比的上升，吞吐上升，由于写吞吐小于KV接口，因此cache miss的比例较低，避免了频繁的I/O操作，而随着写比例的上升，执行compaction线程数增加，因此降低了系统的吞吐能力。

TPC-C （100 warehouses）

ConnectionsX-Engine-CPU X-Engine-FPGA

128

214279

240105

256

203268

230401

512

197001

219618

1024

189697

208532

结果分析：

通过FPGA加速，随着连接数从128增加到1024，X-Engine-FPGA可以得到10%~15%的性能提升。当连接数增加时，两个系统的吞吐都逐渐降低，原因在于随着连接数增多，热点行的锁竞争增加；

TPC-C的读写比是1.8：1，从实验过程来看，在TPC-C benchmark下，80%以上的CPU都消耗在SQL解析和热点行的锁竞争上，实际的写入压力不会太大，通过实验观测，对于X-Engine-CPU系统，执行compaction操作的线程数不超过3个（总共64核心），因此，FPGA的加速效果不如前几个实现明显。

SysBench

在这个实验中我们包含了对于InnoDB的测试（buffer size = 80G）

FPGA：X-DB异构计算实现百万级TPS的技巧

结果分析：

X-Engine-FPGA提高了40%以上的吞吐性能，由于SQL解析消耗了大量的CPU资源，DBMS的吞吐要小于KV接口；

X-Engine-CPU在低水位达到了平衡，原因在于compaction的速度小于写入速度，导致SST文件堆积，compaction持续被调度；

X-Engine-CPU的性能两倍于InnoDB，证明了基于LSM-tree的存储引擎在写密集场景下的优势；

和TPC-C benchmark相比，Sysbench更类似阿里的实际交易场景，对于交易系统而言，查询的类型大部分是插入和简单的点查询，很少涉及范围查询，热点行冲突的减少使得SQL层消耗的资源减少。在实验过程中，我们观测到对于X-Engine-CPU而言，超过15个线程都在执行compaction，因此FPGA加速带来的性能提升更加明显。

总结

在本文中，我们提出的带有FPGA加速的X-Engine存储引擎，对于KV接口有着50%的性能提升，对于SQL接口获得了40%的性能提升。随着读写比的降低，FPGA加速的效果越明显，这也说明了FPGA compaction加速适用于写密集的workload，这和LSM-tree的设计初衷是一致的，另外，我们通过设计容错机制来规避FPGA本身的缺陷，最终形成了一个适用于阿里实际业务的高可用的CPU-FPGA混合存储引擎。

阅读全文

上一页 1 2全文

FPGA(591969) FPGA(591969)
数据库(63273) 数据库(63273)
异构计算(16151) 异构计算(16151)

中国首个异构计算处理器IP核实现可用于机器学习

日前，中国华夏芯公司宣布，其异构计算处理器IP核已经在硅片上成功实现，并已通过HSA（异构系统架构）一致性测试。公司还宣布了新的机器学习和深层神经网络的开源项目，旨在进一步推动HSA异构计算的发展。

2016-09-01 11:42:16

1130

深度解析FPGA异构计算芯片的技术特性

来源：内容来自腾讯架构师，作者austingao。➤ 1. 异构计算：WHY明明CPU用的好好的，为什么

2017-10-24 13:49:42

5772

详解FPGA异构计算芯片

半导体行业观察：随着互联网用户的快速增长，数据体量的急剧膨胀，数据中心对计算的需求也在迅猛上涨。各类应用对计算的需求已远远超出了传统CPU处理器的能力所及。关键词：FPGA，CPU

2017-10-25 05:06:00

6129

加速云发布新品，异构计算加速平台有效满足AI及高性能计算业务需求

致力于提供异构计算加速整体解决方案、业界领先的异构加速和业务卸载方案厂商——杭州加速云信息技术有限公司（简称：加速云）正式启动跨越北京、上海、成都、西安四大城市的 “加速新科技，驱动智未来

2018-04-17 16:52:06

6429

基于Xilinx 16nm Virtex UltraScale+器件VU9P的异构计算实例

基于Xilinx 16nm Virtex UltraScale+ 器件VU9P的异构计算实例F3在阿里云上线了！我们借此机会，对阿里云FPGA计算服务本身，以及这次发布的F3实例的底层硬件架构和平台架构做一个技术解读....

2018-06-28 09:57:56

27698

采用CXL计划应对异构计算中的内存解决方案

在计算世界中，不可思议的事情之一是在数据中心中迅速采用人工智能（AI）和云计算。这些和其他因素正在推动异构计算-使用CPU，GPU，FPGA，ASIC加速器，网络接口控制器（NIC）和其他处理元件

2021-03-19 11:41:14

10288

AMD大中华区总裁潘晓明：异构计算是关键的未来趋势 ADM在三大领域聚焦高性能计算

在南京半导体大会高峰论坛上，AMD大中华区总裁潘晓明表示今天和未来的工作负载需要强大的计算能力，异构计算是关键的未来趋势。AMD未来在计算、图形和解决方案的三个方面聚焦高性能计算，在持续发展的行业中保持高性能计算领导力。

2021-06-14 10:15:37

11215

异构时代：CPU与GPU的发展演变

的特点和优势，能够针对不同的应用场景进行优化和协作，从而实现更高效的计算，不同类型处理器的协同计算被称为异构计算。CPU和GPU是异构计算中最常见和最重要的两种处理器

2023-10-24 10:17:00

484

CPU+FPGA给机器人一个最强大脑

针对数据中心场景，英特尔已经宣布要通过Xeon+FPGA平台和Xeon Phi系列产品来推动异构计算的实施。

2017-06-23 07:33:00

2084

异构计算的前世今生

异构计算已经成了半导体业界不得不思考的一个话题，传统通用计算的性能捉襟见肘，过去承诺的每隔一段时间芯片性能翻倍的豪言壮语已经没有人再提了。如今我们用到的手机中，各种除CPU以外的计算单元层出不穷

2021-12-17 09:35:17

3868

2017双11技术揭秘—X-DB支撑双11进入分布式数据库时代

算法Paxos的统一框架下，第一次提供了跨Region分布式强一致能力，实现高效的跨Region数据同步、跨Region容灾，保证金融级的数据质量服务。X-DB为了降低用户的迁移和学习成本，选择了兼容

2017-12-29 15:06:44

2017双11技术揭秘—阿里巴巴数据库技术架构演进

第三代大规模分库分表向第四代X-DB分布式数据库系统演进的目标。X-DB分布式数据库的落地已经在2017年双11大促中获得了可行性验证，同时底层开始引入存储计算分离架构。分布式在系统稳定性、容灾能力

2018-01-02 16:31:04

FPGA异构计算在图片处理上的应用以及HEVC算法原理介绍

《基于异构计算平台的算法性能优化方法分享》一文。四HEVC图像压缩算法之FPGA和CPU实现差异理论上说，如果不考虑FPGA资源、硬件实现架构和处理性能，CPU图像压缩算法可以完全在FPGA进行“复制

2018-08-01 09:55:53

FPGA具有的优势包括哪些

处理器芯片的概念以及发展历程处理器的分类异构计算的分类和特征能够对智能计算的基础组件芯片有一个比较全面的认知1.相比其他的处理器，FPGA具有的优势包括（）。A.并行能...

2021-07-29 09:28:00

异构计算助力客户春节webp图片编码

。效果本次性能测试所使用样本为512x512的图片，所有测试都在阿里云FaaS F1实例上测试。根据业务方的要求，我们对其中部分数据值做了一些混淆。1）延时在使用了FPGA加速webp编码之后，延迟降为

2018-03-29 11:47:48

异构计算在人工智能什么作用？

能力的需求。因此，具有GPU、ASIC、 FPGA 或其它加速器（Accelerator）等高并行、高密集的计算能力的异构计算持续火热，而异构计算也将成为支撑先进和以后更复杂AI 应用的必然的选择

2019-08-07 08:39:19

异构计算场景下构建可信执行环境

本文转载自 OpenHarmony TSC 《峰会回顾第4期 | 异构计算场景下构建可信执行环境》演讲嘉宾 | 金意儿回顾整理 | 廖涛排版校对 | 李萍萍嘉宾简介金意儿，华为可信计算

2023-08-15 17:35:09

异构计算的前世今生

NVLink的加持，成功将CPU与GPU之间的互联速度做到了夸张的900GB/s，是传统PCIe的10倍以上，CPU更是靠LPDDR5X实现了500GB/s的内存带宽。异构计算真就完美无缺？异构计算就真的

2021-12-26 08:00:00

CPU+FPGA，机器人最强大脑即将问世

基于FPGA的CNN的多种网络实现。OpenCL的编程模型我们机器人系统实验室今年的工作重点便是为机器人搭建基于CPU+FPGA的异构计算平台。根据我们的经验，FPGA能够在一些关键的机器人应用中发挥极大

2017-03-20 17:54:31

TSC峰会回顾04 | 异构计算场景下构建可信执行环境

设计自动化委员会(CEDA)的杰出讲师。文章内容来源第一届开放原子开源基金会OpenHarmony技术峰会——安全及机密计算分论坛正文内容异构，即将CPU、DSP、GPU、ASIC、FPGA等

2023-04-19 15:20:32

smt贴片加工厂百万闸FPGA设计中PC系统的测试基准

百万闸FPGA设计中PC系统的测试基准中国工程师已经开始采用百万闸级FPGA设计产品，那么什么样的PC系统才能满足百万闸级FPGA的综合和布线对计算能力的需求，看完本文后你将会有一个较清晰的概念

2012-12-26 14:06:42

「深圳云栖大会」大数据时代以及人工智能推动下的阿里云异构计算

Caffe,、Caffe2、CNTK、MXNet、TensorFlow、Theano、Torch等框架。而在异构计算领域，FPGA从专用计算领域，走入大众的视野，在通用计算行业崭露头角，也就是近期的事情

2018-04-04 13:44:35

【产品活动】阿里云GPU云服务器年付5折！阿里云异构计算助推行业发展！

的参数空间已从百万级上升到百亿级，这对计算能力提出了新的挑战。相比CPU，GPU更适合深度学习的神经网络模型，可进行高度统异构计算明星规格族“GN5”。阿里云异构计算通用实例“GN5”规格族就是一款

2017-12-26 11:22:09

什么是异构并行计算

、GPU、DSP、ASIC、FPGA等。异构计算用简单的公式可以表示为“CPU+XXX”。举例来说，AMD着力发展的APU就属于异构计算，用公式表示就是CPU+GPU。由于术业有专攻，CPU、GPU、DS...

2021-07-19 08:27:56

国产FPGA简介

、智能汽车、电子设备、电力与电源管理、人工智能。目标市场：金融、电信、政务、汽车、工业互联、物联网等领域。京微齐力核心技术：AiPGA芯片（AI in FPGA）、异构计算HPA芯片

2023-11-20 16:20:37

如何设计一个百万级的消息推送系统？

2021-06-15 07:48:12

扫盲人工智能的计算力基石--异构计算

摘要：本文将带领入门读者了解CPU，GPU，FPGA，ASIC和异构计算的一些基本概念和优缺点，希望帮助入门者和爱好者建立基本的芯片概念人工智能有三要素：算法，计算力，数据。我们今天

2018-06-28 15:55:53

新冒出来的Efinix会革掉FPGA的命么？

，使用CPU消耗的功耗太大，因此大家觉得还是得为了应用开发专用的芯片，用高度优化的架构来实现高性能。　　FPGA成为市场的宠儿　　在异构计算中，FPGA是重要的设计实现方法。FPGA是一种特殊的芯片，它通过

2018-11-01 20:08:07

请问模型推理只用到了kpu吗？可以cpu，kpu，fft异构计算吗？

2023-09-14 08:13:24

采用高级语言开发FPGA的探索

门阵列)。本文主要探索CPU协同FPGA的异构计算方式。传统的FPGA开发方式是采用硬件描述语言Verilog/VHDL，开发难度高，为了在FPGA上实现类似CPU/GPU的开发运行体验， FPGA两大

2017-09-25 10:06:29

异构计算机

fpga云计算cpu/soc

硬十砖家发布于 2021-10-30 14:32:13

超重量级成员高通加盟AMD异构计算组织

六月中旬，AMD联合ARM、Imagination、联发科、德州仪器等行业巨头成立了异构系统架构基金会(HSA Foundation)，推动异构计算的发展，并陆续吸引了多家新厂商的加入，成员数量翻了一番还多

2012-10-05 22:55:47

826

Qualcomm致胜移动行业的战略支柱：异构计算

Murthy Renduchintala发表的大会开幕主题演讲。现在显而易见的是，在用于移动终端的专用计算（或称异构计算）方面树立领先地位，将帮助Qualcomm在移动时代大获全胜。

2013-09-12 10:24:28

634

灵活控制CPU协同工作，详解联发科CorePilot异构计算技术

在2013年，联发科全球首创CorePilot异构计算技术，CorePilot是联发科为旗下多核心产品量身定制的一项新技术，CorePilot异构计算技术可以简单的看做ARM Big.LITTLE

2016-11-04 18:41:19

468

腾讯云首发基于赛灵思FPGA的云服务器

腾讯云推出国内首款高性能异构计算基础设施——FPGA云服务器，以云服务方式将大型公司才能长期支付使用的FPGA推广到更多企业。

2017-02-13 18:13:12

911

面向未来智能纪元_共建共享异构计算

5月25日，2017异构计算标准暨国际人工智能大会在厦门隆重开幕。本次大会以“面向未来智能纪元，共建共享异构计算”为主题，是我国首次召开促进人工智能算法及应用与国际主流芯片平台标准融合发展的大会

2018-04-27 18:07:00

911

异构计算芯片的机遇与挑战

异构计算的机遇与挑战 异构计算是指不同类型的指令集和体系架构的计算单元组成的系统的计算方式，目前 CPU+GPU以及CPU+FPGA 都是最受业界关注的异构计算平台。它最大的优点是具有比传统CPU

2017-09-27 10:22:47

FPGA异构计算现状及优化

。 WHEN？深度学习异构计算现状随着互联网用户的快速增长，数据体量的急剧膨胀，数据中心对计算的需求也在迅猛上涨。同时，人工智能、高性能数据分析和金融分析等计算密集型领域的兴起，对计算能力的需求已远远超出了传统CPU处理器的能力所及。

2017-11-15 11:44:52

8213

给CPU直接开挂！从OpenPOWER的CAPI+FPGA看第二代异构计算

什么是异构计算？可能在很多人看来感觉高深莫测，我们可以先用一个比喻来简单的解释一下。比如在做简单的整数算数时，知道算法口诀的人，心算即可，但遇到比较复杂的算数问题时，就得需要一个计算器了，但在

2017-11-17 11:49:46

4626

异构计算在电磁仿真中的应用

，结合计算统一设备架构（CUDA），以低通滤波器为算例，实现了时域卷积理想匹配层（CPML）吸收边界的三维FDTD高性能加速计算，目标网格数达5百万。实验在Fermi架构的Quadr0 4000和Tesla M2050两款GPU上实测，误差均在101范围内，相对于同时期的C

2017-11-20 14:32:55

异构计算的能效感知调度模型

的精细表述及有效量化，建立面向协同异构计算且易于复用的能效感知云调度模型；另一方面，提出并实现适于超计算机混合体系的多学科背景的元启发式多目标全局优化算法．从技术上解决了面向不同环境目标的云调度实施条件界定及

2018-01-10 15:38:35

异构计算的多目标测试用例优先排序

，多目标测试用例优化排序是寻找同时覆盖多个测试准则的用例执行序列，通常采用演化算法优化求解，但执行时间较长，严重影响了在实际软件测试中的应用．采用先进的GPU图形卡通用并行计算技术，提出了面向CPU+GPU异构计算下的多目

2018-01-15 15:20:53

当CPU碰上FPGA 异构计算又会发生什么样的变化

传统异构方案中，CPU将数据一次性发送给FPGA，处理完成后再交给CPU，加速设备与主机并不同时参与计算。与传统方案不同，本设计采用了设备间流水处理的加速方案，即：将数据集进行了分组，各组数据在被

2018-07-06 09:06:00

2943

一文了解华为云FPGA异构计算技术火爆的原因

2017年12月23日，星期六，华为云FPGA 异构计算技术私享会在上海3W咖啡成功举办。原定150人的活动一经发布，近600人报名参加，虽经多方筛选，会场依然一下子迎来了230多名参会者

2018-06-28 07:49:00

4417

异构计算是未来趋势，看加速云玩转FPGA

在人工智能时代，深度学习和机器学习成为企业进行业务创新的重要基础。而这些有赖于计算力、算法的支撑，于是我们看到异构计算风起云涌。作为专注于异构计算加速平台解决方案的提供商，近日，加速云在“加速新科技

2018-06-08 13:46:00

1336

NVIDIA Tegra K1异构计算平台访存优化研究

和channel冲突消除等方面，对矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上的实现和访存性能优化进行研究。实验结果表明，采用优化方法后的矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上取得了较大的访存性能提升，并且具

2018-03-12 11:11:38

基于FPGA的异构计算是趋势

目前处于AI大爆发时期，异构计算的选择主要在FPGA和GPU之间。尽管目前异构计算使用最多的是利用GPU来加速，FPGA作为一种高性能、低功耗的可编程芯片，在处理海量数据时，FPGA计算效率更高，优势更为突出，尤其在大量服务器部署时，隐形的运营成本会得到显著降低。

2018-04-25 09:17:27

10593

异构计算的两大派别为什么需要异构计算？

20世纪80年代，异构计算技术就已经诞生了。所谓的异构，就是CPU、DSP、GPU、ASIC、协处理器、FPGA等各种计算单元、使用不同的类型指令集、不同的体系架构的计算单元，组成一个混合的系统，执行计算的特殊方式，就叫做“异构计算”。

2018-04-28 11:41:00

22671

异构计算的软硬件分割没有最好，只有更好的详细资料概述

可以看出，一次旅行，其实结合了各种交通工具的优点。随着摩尔定律的失效和CPU在AI等并行计算方面的缺陷，目前数据中心的计算机，已经不仅仅是CPU一种计算芯片，还要结合GPU和FPGA做异构计算体系。

2018-07-06 11:00:48

6059

高通AI芯片异构计算满足AI手机各类不同需求

，能够利用芯片的异构计算能力来加强机器学习。第三代AI芯片骁龙845集成高通最新推出的人工智能引擎AI Engine，能够实现最顶尖的终端AI处理。

2018-07-27 14:28:02

912

异构计算：架构与技术

如果您希望创建优秀的移动体验，那么，优化就不是可有可无的事情，而是关键之举。它可以帮助您将好的想法实现得更加出彩。在上一篇“使用QDN异构计算工具开发项目”文章中，我们讨论了异构计算的概念

2018-09-18 19:18:20

715

Qualcomm：使用QDN异构计算工具开发项目

如何提高应用性能？如何充分利用硬件？如果有限的处理能力、能量管理和发热量问题对于您的产品性能来说十分重要，那么异构计算可能是您解决问题的答案。当我们在谈论异构计算时，我们在谈论如何利用

2018-09-18 19:18:39

265

异构计算，你准备好了么？

摩尔定律失灵了，已是不争的事实。单纯的提升一种芯片性能变的代价越来越高，与此同时，异构计算成为提高计算力的主流方向。什么是异构计算？ 异构计算的前景怎么样？ OpenPOWER系统上FPGA

2018-09-25 17:27:02

349

阿里云异构计算产品是如何保障双11业务的

保驾护航。作为IT基础设施的基石，阿里云ECS为阿里集团双十一业务提供了强有力的计算保障。阿里云异构计算产品——GPU云服务器和FPGA云服务器，作为ECS产品家族中的一员，今年支撑了集团超过10个BU

2018-11-28 16:45:08

210

英特尔超异构计算愿景，实现新“超越”

，从32位到64位，从单核到多核，从同构到异构，每一次架构革命都让芯片产生质的飞跃。而在智能互联的AIoT时代，异构计算芯片成为当仁不让的主角。毕竟，在经历了数字化、互联网化、移动互联网化的洗礼之后，人工智能化时代的海量计算需求、算法迭代让传

2019-04-16 16:39:28

341

新AI时代的“利器”,异构计算将重塑产业格局

异构计算的显著优势在于实现了性能、成本和功耗均衡的技术，同时也是让最适合的专用硬件去做最适合的事如密集计算或外设管理等，从而达到性能和成本的最优化。这

2019-04-28 17:38:03

3101

加速第二代分布式计算 IBM 和赛灵思启动首届异构计算大赛

随着新业务的快速增加和海量数据，业界对于服务器的性能及功耗要求越来越高。基于Xilinx全可编程FPGA，POWER处理器和CAPI异构计算技术的第二代分布式计算是支持行业发展的重要技术，可以为数据中心应用带来数十倍甚至上百倍的性能功耗比提高，同时支持软件定义数据中心发展。

2019-07-30 16:47:26

1743

关于Efinix与FPGA的异同分析和应用

在异构计算中，FPGA是重要的设计实现方法。FPGA是一种特殊的芯片，它通过片上存储器和查找表来实现逻辑。因此，如果你改写片上存储器和查找表的内容，就可以重配置FPGA的逻辑，从而让FPGA实现不同的功能。FPGA因为有这样高度的灵活性，在过去常常用于芯片正式流片前的功能验证。

2019-09-04 17:38:52

2612

赛灵思将与英伟达英特尔展开FPGA芯片大战

据赛灵思介绍，ACAP是一个高度集成的多核异构计算平台，它的核心是新一代FPGA架构，能根据各种应用与工作负载的需求从硬件层对其进行灵活变化。

2019-08-19 14:56:03

608

英特尔发布oneAPI, 引领软件变革，致力未来异构计算

行业计划，为跨多种包括CPU、GPU、FPGA和其他加速器在内的异构计算，提供了一个统一和简化的应用程序开发编程模型。oneAPI的发布源自英特尔数百万小时软件工程开发的努力,并且标志着一个行业内的变革，从今天受限、封闭的编程方法演变到一个开放的、基于标准的模式，

2019-11-18 23:15:34

285

4家OS厂商基于openEuler发布商业发行版，加速多核异构计算产业发展

麒麟软件、普华基础软件、统信软件、中科院软件所4家领先的OS厂家，发布基于openEuler的商业发行版，标志openEuler操作系统已具备规模商用能力，加速多核异构计算产业发展。 openEuler

2020-03-31 09:55:36

2328

异构计算成为“战场”？

异构计算加速的大背景下，巨头吞并成为了今年的代名词。 10月9日，华尔街日报消息称，美国处理器AMD（超威半导体）公司正在就收购竞争对手芯片制造商Xilinx（赛灵思半导体）进行深入谈判，交易

2020-10-14 15:21:28

1581

异构计算或引发芯片巨头割据战

达对ARM的收购，以及AMD对赛灵思的收购，也昭示着芯片巨头们与英特尔的“不谋而合”，它们纷纷将未来的布局瞄准了同一个方向：异构计算。

2020-12-24 09:12:18

1694

国内首款基于FPGA异构计算的SaaS动图转码产品正式上线

近日，国内首款基于FPGA异构计算的SaaS动图转码产品，正式上线阿里云市场。该产品由北京深维科技研发，已经上线为南瓜电影的影片动态海报功能提供服务。除视频点播外，未来还有望在UGC视频、电子商务

2021-01-27 13:47:12

1505

龙芯平台异构计算技术交流会成功举办

2021年4月14日，由江苏航天龙梦信息技术有限公司和南京航空航天大学联合主办的“龙芯平台异构计算技术交流会”在航天龙梦南京公司成功举办。来自中科院计算所、南航、南邮、山东大学等科研院校学者，和龙

2021-04-22 10:32:12

1764

异构混合并行编程模型及其研究综述

随着人工智能和大数据等计算机应用对算力需求的迅猛增长以及应用场景的多样化，异构混合并行计算成为了研究的重点。文中介绍了当前主要的异构计算机体系结构，包括CPU/协处理器、CPU/众核处理器、CPU

2021-05-13 10:30:35

阿里云震旦异构计算加速平台基于NVIDIA Tensor Core GPU

阿里云震旦异构计算加速平台基于NVIDIA Tensor Core GPU，通过机器学习模型的自动优化技术，大幅提升了算子的执行效率，刷新了NVIDIA A100、A10、T4的GPU单卡性能

2021-08-13 10:17:29

3119

异构计算发展趋势的助力

。2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中心继CPU和GPU之后的“第三颗主力芯片”，掀起了一波行业热潮。DPU的出现是异构计算的一个阶段性标志。与GPU的发展类似，DPU是应用驱动的体系结构设计的又一典型案例；但与GPU不同的是，DPU面向的应用更加底层。DPU要解决的核心

2021-10-27 09:16:32

2190

2021 OPPO开发者大会：游戏中的异构计算

2021 OPPO开发者大会：游戏中的异构计算 2021 OPPO开发者大会上介绍了游戏中的异构计算。责任编辑：haq

2021-10-27 11:08:31

1232

2021 OPPO开发者大会：异构计算开发者价值

2021 OPPO开发者大会：异构计算开发者价值 2021 OPPO开发者大会上介绍了异构计算开发者价值。责任编辑：haq

2021-10-27 11:10:30

1551

OPPO开发者大会2021 关于异构计算

关于异构计算系统级性能功耗优化方案的异构部署、异构内核、易购底座等相关内容。

2021-10-27 17:56:20

2969

OPPO开发者大会2021 游戏中的异构计算

异构计算在游戏中的使用，会有什么样的优势？

2021-10-28 15:21:58

2842

华为借助异构计算架构CANN推动技术行业落地

会上，华为昇腾CANN生态高级总监王海彬发表了《昇腾CANN释放硬件澎湃算力》的主题演讲，分享在当前波涛汹涌的AI浪潮中，华为如何借助异构计算架构CANN（Compute Architecture for Neural Networks）进行技术创新和生态开展，持续使能科研和产业关键突破，推动技术行业落地。

2021-12-16 17:29:39

2600

异构计算真就完美无缺吗

2021-12-21 09:25:50

1630

AGM观点：独立FPGA公司将不复存在

未来很可能独立FPGA公司不再有存在的意义，FPGA技术将与CPU/MCU深度融合，成为异构计算的新模式。

2022-03-10 08:57:19

5979

为什么说“众核异构计算”是必然趋势？

经常有朋友问，“为什么认为众核异构计算是必然趋势呢？”。实际上这个问题在业内已经是共识了，所以本文希望从更浅显的角度来解释这个问题。首先，需要解释“为什么当下正处于算力大爆炸时代” 越强大的人

2022-04-01 18:29:57

13567

VMware在vSphere上验证Alveo FPGA性能

　　FPGA 加速器在数据中心的采用正变得越来越普遍，并将继续增加以满足对异构计算和性能提升的日益增长的需求。

2022-06-03 11:28:00

781

异构计算中的挑战与解决方案

　　异构系统是各种技术颠覆的核心。平板电脑、智能手机和科学计算机都是作为专门系统创建的。展望未来，异构架构在创建下一代颠覆性设备方面发挥着至关重要的作用。

2022-06-08 16:43:55

1451

将OpenCL编译到FPGA

OpenCL 框架解决异构计算的挑战

2022-08-29 08:07:36

1835

“加速全真互联”NVIDIA+腾讯云异构计算分享会

“异构计算”平台提供云端磅礴算力和弹性扩缩容能力，也需要基础设施提供强大且稳固的基础算力，其背后支撑的核心就是 NVIDIA GPU。 9 月 2 日下午 230 腾讯云邀请了 NVIDIA 专家以及其他相关的合作伙伴，在深圳将举办一场以“加速全真互联”为

2022-08-30 10:42:37

430

RISC-V如何做好异构计算

未来几年，按照预测RISC-V将会以更加恐怖的速度增长，除了在原有这些领域发挥重要价值，RISC-V肯定还需要拓展更多新的领域，其中异构计算领域对于RISC-V而言至关重要，能够发挥RISC-V指令集的全方位优势，并有望催生全新的计算芯片体系。

2022-09-02 09:52:26

906

【FPGA设计】如何搞定FPGA设计？

异构计算 FPGA处理密集计算优势抢眼面对机器学习和云服务对于算力需求持续增长，异构计算逐渐成为高性能计算的主流解决方案。FPGA也逐渐走到台前，出现在各个数据中心。密集型计算矩阵运算、机器

2022-11-03 08:20:02

382

什么是超异构计算？如何驾驭超异构计算？

为什么现在才提超异构这个概念。这里面其实有很多原因，我们总结了大概4个部分，第一个首先是业务需求驱动，现在软件新应用层出不穷，两年一个新热点；并且，已有的热点技术仍在快速演进。

2022-12-20 12:34:06

1329

从CPU到ASIC，架构越来越碎片化

是超异构计算架构。CPU+GPU+FPGA+DSA等多种架构处理引擎组成的超异构计算；实现既要又要：接近CPU的灵活性，接近ASIC的性能效率，以及多个数量级提升的性能。

2023-01-05 11:31:58

1532

FPGA之异构计算

对于一个开发人员，可能听说过FPGA，甚至在大学课程设计中，可能拿FPGA做过计算机体系架构相关的验证，但是对于它的第一印象可能觉得这是硬件工程师干的事儿。目前，随着人工智能的兴起，GPU 借助

2023-02-03 20:40:03

500

RISC-V给异构计算带来新活力

来源: EEWORLD ChatGPT的火热，持续催生着包括人工智能、大数据等应用的火热。在不断兴起的新应用的背后，需要更复杂的计算方式，而异构计算概念也因此诞生。将不同的计算任务进行分解，利用包括

2023-03-11 00:45:14

409

构建面向异构算力的边缘计算云平台

数据又消费数据，再慢慢到设备与设备之间的信息互联，万物互联的时代已然到来。在万物互联时代，需要计算的数据越来越多，需求在不断的变化，异构计算能够充分发挥 CPU/GPU 在通用计算上的灵活性，及时响应数据处理需求，搭配上 FPGA

2023-05-18 17:15:21

PrimeSimSPICE：异构计算模型实现数量级性能突破

随着对更高计算性能的需求不断增加，HPC 行业正朝着异构计算模型发展，其中 GPU 和 CPU 协同工作以执行通用计算任务。在这种异构计算模型中，GPU 充当 CPU 的加速器，以减轻 CPU

2023-05-24 16:53:00

554

异构计算的初步创新

更高，x16带宽（双向）从64 GB/s提升到了128 GB/s；目前规范制定已迭代至6.0版本，带宽再翻倍。 异构计算的初步创新：在

2023-06-19 11:26:23

389

DPU软件栈五层模型系列（一）DPU异构计算架构五层开发模型

与封装。在定义每一层功能时，要达到以下几个目标：各层职责单一层间边界清晰层内功能实现独立灵活易扩展基于上述目标，将一个异构计算的系统抽象为五层（如下图所示），自下

2022-06-06 18:14:01

559

【技术提升】如何搞定FPGA设计？

异构计算FPGA处理密集计算优势抢眼面对机器学习和云服务对于算力需求持续增长，异构计算逐渐成为高性能计算的主流解决方案。FPGA也逐渐走到台前，出现在各个数据中心。密集型计算矩阵运算、机器视觉、图像

2022-06-09 10:00:56

296

【技术提升】如何搞定FPGA设计？（文末送元器件本）

2022-06-13 09:42:59

446

兆松科技CTO伍华林：RISC-V在异构计算中的机遇和挑战

“RISC-V在异构计算中的机遇和挑战”作主题演讲。兆松科技（武汉）有限公司CTO伍华林异构计算主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。伍华林指

2022-06-23 09:32:52

1205

异构计算面临的挑战和未来发展趋势

导读超异构和异构的本质区别在哪里？这篇文章通过对异构计算的历史、发展、挑战、以及优化和演进等方面的分析，来进一步阐述从异构走向异构融合（即超异构）的必然发展趋势。1、异构计算的历史发展1.1并行计算

2023-04-26 15:18:10

543

新一代计算架构超异构计算技术是什么异构走向超异构案例分析

超异构计算架构是一种将不同类型和规模的硬件资源，包括CPU、GPU、FPGA等，进行异构集成的方法。它通过独特的软件和硬件协同设计，实现了计算资源的灵活调度和优化利用，从而大大提高了计算效率和性能。

2023-08-23 09:57:02

408

异构计算为什么会异军突起？基于FPGA的异构计算讨论

简单的介绍几个概念，同道中人可以忽略这一段。云计算取代传统IT基础设施已经基本成为业界共识和不可阻挡的趋势。

2023-10-26 10:04:13

206

什么是异构集成？什么是异构计算？异构集成、异构计算的关系？

异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部，以增强功能性和提高性能。

2023-11-27 10:22:53

1828

高通NPU和异构计算提升生成式AI性能

异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担，需要配备不同的处理器，如专注于AI工作负载的定制设计的NPU、CPU和GPU。

2024-03-06 14:15:56

144

已全部加载完成

搜索历史

FPGA：X-DB异构计算实现百万级TPS的技巧 - 全文

背景介绍

问题背景

FPGA加速数据库

系统设计

详细设计

异步调度逻辑设计

容错机制的设计

实验结果

SysBench

结果分析：

总结

评论