0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中科驭数第三代DPU芯片K2-Pro,专为数据中心打造的“六边形战士”

中科驭数 来源:中科驭数 作者:中科驭数 2024-06-28 14:50 次阅读

近日,中科驭数重磅发布第三代DPU芯片K2-Pro,是国内首颗面向量产的全功能芯片!

K2-Pro采用自主研发的Kernel Processing Unit架构,集网络、存储、安全及计算等多业务卸载功能于一体,包处理速率翻倍至80Mpps,最高支持200G网络带宽,具备高度可编程性,确保了系统的灵活扩展性,为数据中心的业务增长和算力扩容提供坚实基础。在处理复杂任务时,K2-Pro相比上一代芯片能耗降低30%。

作为一款纯国产的高性能解决方案, K2-Pro以其全面性能的均衡与卓越,成为数据中心战场上的“六边形战士”,可广泛适用于云计算智能计算、及高性能计算等领域,也为数据中心的算力升级提供了全新解题思路。同时,K2-Pro也必将成为推动DPU芯片进入大规模量产的标杆之作。

wKgaomZ-XQ-ADuhlAAx_rX_uPK0713.png

自研KPU架构和KISA指令集

用创新的体系结构理论指导复杂的芯片架构设计

对于中科驭数来说,DPU的研发之路上,架构创新不是可选项,而是必选项。中科驭数在芯片研发领域持续深耕,从底层架构入手,致力于解决DPU芯片面临的高带宽、低延迟及复杂业务需求挑战的决心。

KPU架构——专用计算代表性架构

自主研发KPU芯片架构是中科驭数多年体系结构研究的结晶,基于软件定义硬件的技术路线,创新性地提出了面向专用计算统一计算架构KPU。该架构采用异构计算核作为基本单位,根据上层应用的具体需求定制化设计,具有软件可定义、超高并行处理能力、超强处理性能三大优势,配合数据流驱动的运算激活机制,确保了系统灵活性与高效运行的完美平衡,为DPU芯片设计打造新标杆。

wKgaomZ-XRGAPJeIAAU68wLT0AQ295.png

KISA指令集——业界首个DPU指令集架构

以此为基础,中科驭数进一步推出了首个专为DPU设计的指令集架构——KISA,旨在解决专用计算领域编程范式的碎片化问题。不同于传统的CPU指令集,KISA紧密贴合DPU的特性,强调数据处理而非控制流,高计算密度型而非低计算密度型,采用数据流而非字节作为基本操作单元。更重要的是,KISA首次在指令集层次支持敏捷异构,用一套统一的指令实现了多种异构处理核进行管理调度。

wKgZomZ-XRGAKLeDAALcecOSjlU336.png

目前,KISA指令集涵盖了KISA基础架构、以及面向DPU专用处理扩展指令,包含包解析、转发指令、以及表查询指令等。基于KISA已经覆盖25大类应用场景,累计数百个用例,得到非常充分验证。

wKgZomZ-XRKAGMYZAAV-ntn9cUQ435.png

KISA指令集的推出,将软件定义技术路线向着更加可落地、可执行的方向推进了一大步,系统性地解决了领域专用计算的编程范式混杂的难题,让开发变得更加简单高效,让每一行代码直达DPU算力。

wKgaomZ-XRWAYuuoAAPIl7zm1rQ748.png

实用制胜,量产为王

K2-Pro何以称为数据中心的“六边形战士”?

基于以上两大底层技术创新,不仅打破了传统DPU设计,更推动了DPU芯片向更高性能、更强灵活性和更低功耗方向发展。相较于单一性能的极致追求,中科驭数在DPU设计上秉持全面卓越的理念,致力于打造“全能冠军”而非“单项冠军”。

因此,K2-Pro在立项之初就把“实用制胜,量产为王”作为研发目标,确保技术创新与市场需求紧密结合。历经深度优化以及融合了对数据中心未来中心场景的深入理解,K2-Pro最终实现以下六个方面的极致优化:

wKgZomZ-XRaAE3WVAAaU44kLZCk752.png

K2-Pro是先进、好用的网络芯片

对于DPU来说,首先是一个网卡,才能再谈进一步拓展其复杂业务的处理能力。为此,中科驭数团队在基础网络功能上苦下工夫,将K2-Pro打造成综合能力强悍的网卡芯片。

一方面,在实现基础网络卸载功能上,K2-Pro集成了高通DMA以及硬件虚拟化技术,并通过丰富的软件显著增强了运维能力,这一进步在国产网卡领域中尤为突出,直接对标国外主流产品

另一方面,K2-Pro着重在网络延时、高阶包处理能力上做了增强。通过优化设计,K2-Pro将端到端网络延迟控制在1.2微秒以下,处理带宽达到200Gbps,做到业界领先水平,成功填补了国内低延迟网卡市场的空白。

同时,结合其可编程的包处理引擎,K2-Pro打破了传统网络处理局限于二层包的框架,赋予用户更高的灵活性去执行包解析和深度数据分析任务,根据自身需求设计特定的安全策略、流量优化方案等等,让用户在硬件层面实现个性化配置,极大提升了数据中心网络的智能化和定制化程度。

wKgZomZ-XReAIxXFAATuYeO4nBk697.png

K2-Pro是高通量数据处理芯片

K2-Pro芯片,作为一款面向数据中心的高性能数据处理核心,其优势在于如何高效且有序地管理复杂多变的基础设施层服务。

DPU业务里面有非常鲜明的特点:一是业务类型繁多且性质各异,涵盖网络、存储及各类用户特定应用,每种业务不仅要求精确解析,还需定制化处理逻辑,加之不同业务的处理时延各异,极易引发处理顺序混乱等难题。二是并发级别极高,应对千万级别的数据流、管理动辄数百上千的虚拟机,是数据中心面临的运营常态。三是对延迟高度敏感,与GPU的批处理加速模式不同,DPU要求在严格的时间窗口内完成任务,任何延误都将导致数据丢失。

鉴于此,K2-Pro的高通量数据处理能力成为其核心竞争力,其背后的关键技术在于精细的流调度与隔离机制。经过深入研究与优化,K2-Pro从流的精准识别到并发处理能力均实现了显著提升,确保在极端并发场景下仍能维持高水平性能,几乎不受流量洪峰影响。最终做到了在承载千万级并发流、服务上千租户、处理千万级流表及数十种不同租户配置的复杂业务之下,稳定输出200Gbps数据吞吐率及40Mpps包处理能力的领先性能,让数据处理更加“游刃有余”。

wKgZomZ-XRiAbP6sAAQ1e3mFi2I418.png

K2-Pro是强业务卸载芯片

在复杂的云服务环境中,尤其是面对如服务网格这类高控制复杂度的业务,现有DPU技术往往难以有效承担,其业务卸载效率低下,通常不足20%。业界普遍采取的应对策略是增强控制层面的资源配置,极端时甚至采用服务器级CPU来维系控制功能。但这不仅未能从根本上改善服务质量和降低延迟问题,反而可能导致资源浪费。

基于上述挑战,中科驭数团队一直认为DPU必须轻控制,而非盲目追求与CPU相匹敌的控制能力。在此理念指导下,K2-Pro在设计上实现了多项关键技术突破,包括但不限于精密的流调度技术、高效数据交互协议,以及专门设计的网络卸载、表项卸载、存储卸载、RDMA卸载等重要引擎,将原本在DPU上难以卸载的业务比例从低于20%显著提升至90%以上,大幅减轻了控制面的压力。

服务治理场景下,K2-Pro也实现了量级的跃迁,将原先400us以上的治理延时降到了30us以内,显著优于当前市场上的解决方案,为确保高性能、低延迟的云服务环境提供了强大的技术支持。

wKgZomZ-XRmANPRuAAQ5_psDQCQ563.png

K2-Pro是灵活可扩展处理芯片

虽然DPU出现时间不长,但是它的潜力在加速显现。随着更多业务向DPU转移,以及协议迭代和任务类型的增加,DPU的扩展能力成为关键。因此,K2-Pro芯片在三个维度上实现了独特性的可扩展性设计,让业务与同构算力、异构算力灵活扩展:

可编程与卸载能力:K2-Pro自身不仅配备了高性能的可编程引擎,还融入了协议分析引擎(PPP)与通用算法引擎(CAE),确保了对不断演进的协议和复杂算法的有效支持。中科驭数在金融领域做过一个尝试,通过全面卸载特定的金融通信协议和业务算法至DPU,性能相比现有方案提升了十倍以上,刷新了行业认知。

芯片级联与算力自由扩展:为满足日益增长的算力需求,中科驭数创新设计了DPU间的高速互联技术,支持芯片级联,使多个DPU能够无缝串联,实现DPU算力自由扩展。这一方案与行业标准接轨,为大规模数据中心的算力部署提供了高效路径。举例而言,通过多芯互联,能够轻松部署高性能的NAT网关解决方案,为数据中心的网络架构升级和业务扩展打开了新的可能性。

开放的外接算力集成策略:K2-Pro还致力于与其他类型算力芯片的协同工作,提供了多元化的集成方案,既展现了DPU在构建综合性解决方案中的灵活性,也预示着未来将有更多跨领域的创新合作案例涌现,进一步拓宽DPU的应用边界。如中科驭数在与安全芯片厂商的合作中,共同打造了处理能力达到百Gbps级别的安全解决方案。

wKgaomZ-XR6AZ7_hAAbrMCvILEw959.png

K2-Pro是稳如磐石的“管理”芯片

DPU在一般认知中常被视作辅助或“副手”角色,负责任务卸载,然而实际上,它在数据中心扮演着更为关键的主角身份。DPU不仅参与虚机的生命周期管理、资源调配等核心任务,还必须保证全天候稳定运行,是数据中心最中心的处理核心。

中科驭数对稳定性给予了高度重视,对K2-Pro进行了深度优化:纳秒至毫秒级的分级异常恢复机制确保快速响应;系统与核心间的异常隔离设计,即使内部模拟攻防,也能维持运行不中断。配备的实时状态监测系统,对芯片内每个数据包、每个子系统的状态进行不间断监测,及时发现并预警潜在问题,实现了芯片内每个环节的全天候精准监控。截至目前,这种级别的监测精细度和系统稳定性在同类DPU产品中尚属罕见。

wKgZomZ-XSGAQ5KIAAiXfGJLZIk845.png

K2-Pro是极致能效比的网络芯片

能耗考验也是DPU在设计时面临着的又一大难题。尽管DPU承担的任务远超传统网卡,但在服务器架构中,其安装位置和功耗预算仍旧受限,类似于网卡的配置要求。鉴于此,中科驭数团队深知,要想实现DPU的广泛应用,必须在能效比上取得突破。

中科驭数不仅采用了诸多成熟的低功耗技术,更从应用层面进行了深度优化,通过精细的电源管理策略,实现了在不影响性能的前提下,对芯片面积和运行频率的精准调控,这一过程虽充满挑战,近乎苛刻,却也体现了团队对技术极限的不懈追求。最终,DPU在多种应用场景下展现出了显著的能效优势,相比上一代功耗降低30%,与国际DPU产品相比也有更为出色的能效表现,为DPU的大规模部署奠定了坚实的能效基础。

wKgZomZ-XSKAQyX7AAPnBEEIpy0853.png

中科驭数高级副总裁、CTO卢文岩博士表示,正是我们坚持自主研发,突破技术壁垒,我们才能开发出自主知识产权的KPU架构与KISA指令集,为DPU领域贡献了我们的创新成果;正是这份对六个关键领域“死磕到底”的决心,我们才能在造“芯”路上厚积薄发,见证这个数据中心“六边形战士”的诞生;也正是我们坚持技术与市场的紧密结合,将量产与应用视为同等重要,我们才能见证K2-Pro成为了一款真正可落地、可推广的高性能DPU芯片。相信K2-Pro的问世,将会是数据中心算力技术革新的重要里程碑。期待见到它走向各行各业,未来在数据中心乘风扬帆,在算力征途上破浪前行!

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    450

    文章

    49631

    浏览量

    417106
  • DPU
    DPU
    +关注

    关注

    0

    文章

    343

    浏览量

    24044
  • 算力
    +关注

    关注

    1

    文章

    836

    浏览量

    14567
收藏 人收藏

    评论

    相关推荐

    中科华中总部项目落户光谷

    近日,国内DPU芯片领域的领军企业——中科(北京)科技有限公司与东湖高新区正式签署合作协议,标志着
    的头像 发表于 09-19 17:35 295次阅读

    中科数分析DPU在云原生网络与智算网络中的实际应用

    CCF Chip 2024,精彩不能停!7月21日下午,中科在第二届中国计算机学会(CCF)芯片大会的“
    的头像 发表于 08-02 11:21 502次阅读

    中科DPU是构建高效智算中心基础设施的必选项

    日前,在江苏省未来网络创新研究院、网络通信与安全紫金山实验室举办的“2024智算网络技术与应用创新峰会”上,中科作为DPU算力基础设施领军企业,受邀出席本次峰会。
    的头像 发表于 07-08 10:51 539次阅读

    中科发布第三代DPU芯片K2 Pro,较上一能耗降低30%

    电子发烧友网报道(文/李弯弯)近日,中科(北京)科技有限公司(以下简称“中科”)在北京发
    的头像 发表于 07-01 07:32 3246次阅读

    中科CEO鄢贵海:从计算系统的个视角重新审视DPU的核心价值

    如何找准价值定位?而中科作为国内DPU先行者,又将如何解题,引领DPU行业进入到一个全新的高度? 6月19日,在
    的头像 发表于 06-28 14:27 342次阅读
    <b class='flag-5'>中科</b><b class='flag-5'>驭</b><b class='flag-5'>数</b>CEO鄢贵海:从计算系统的<b class='flag-5'>三</b>个视角重新审视<b class='flag-5'>DPU</b>的核心价值

    芯片软件全上阵 DPU“全家桶”来了!中科数成功举办2024产品发布会

    6月19日,中科2024产品发布会在北京中关村展示中心正式举办。聚焦自研DPU核心技术,中科
    的头像 发表于 06-23 11:09 616次阅读
    <b class='flag-5'>芯片</b>软件全上阵 <b class='flag-5'>DPU</b>“全家桶”来了!<b class='flag-5'>中科</b><b class='flag-5'>驭</b>数成功举办2024产品发布会

    中科发布高性能DPU芯片K2-Pro

    在信息技术领域,每一次芯片技术的突破都代表着行业的一次飞跃。近日,DPU领域的领军企业中科宣布,成功研发并发布了其
    的头像 发表于 06-21 11:41 599次阅读

    重新定义DPU——中科2024产品发布会,6月19日诚邀莅临!

    数据中心正经历着前所未有的变革,DPU作为数据中心第三颗主力芯片,正引领行业步入一个高效、灵活的算力新时代。
    的头像 发表于 06-18 16:17 413次阅读

    中科云、超低时延网络案例双双入选第七届数字中国建设峰会数字化转型典型应用案例

    方案入选。 作为国内领先的DPU芯片及解决方案提供商,中科基于自研KPU芯片架构率先在国内完
    的头像 发表于 05-28 09:21 276次阅读
    <b class='flag-5'>中科</b><b class='flag-5'>驭</b><b class='flag-5'>数</b><b class='flag-5'>驭</b>云、超低时延网络案例双双入选第七届数字中国建设峰会数字化转型典型应用案例

    中科自研第二DPU芯片K2获得行业认可

    近日,中科自研第二DPU芯片K2在众多云生态创
    的头像 发表于 01-18 09:20 872次阅读

    压线钳四边形六边形的特征、性质以及应用

    在几何学中,四边形六边形是两个常见的多边形状。它们在不同的方面具有不同的特点和用途。本文将比较压线钳四边形六边形的特征、性质以及应用,
    的头像 发表于 12-28 17:05 4036次阅读

    武汉市东湖高新区管委会副主任李世庭一行调研中科

    近日,武汉市光谷东湖高新区管委会党工委委员、副主任李世庭一行莅临中科,调研 考察中科
    的头像 发表于 12-19 16:05 781次阅读
    武汉市东湖高新区管委会副主任李世庭一行调研<b class='flag-5'>中科</b><b class='flag-5'>驭</b><b class='flag-5'>数</b>

    是德科技第三代半导体动静态测试方案亮相IFWS

    。 海内外第三代半导体及相关领域的知名专家学者、企业领导、投资机构代表参与大会。中科院、北京大学、香港科技大学、英诺赛科、安光电等科研院所、企业代表围绕第三代半导体技术、应用,深入探
    的头像 发表于 12-13 16:15 629次阅读
    是德科技<b class='flag-5'>第三代</b>半导体动静态测试方案亮相IFWS

    走进创新雄安,中科DPU系列产品亮相雄安中关村创新论坛

    ,分享中科DPU领域的最新创新成果。 ▲  中科
    的头像 发表于 12-01 18:50 402次阅读
    走进创新雄安,<b class='flag-5'>中科</b><b class='flag-5'>驭</b><b class='flag-5'>数</b>携<b class='flag-5'>DPU</b>系列产品亮相雄安中关村创新论坛

    中科受邀出席2023 ODCC冬季全会,共谋开放数据中心创新发展!

    近日,2023年开放数据中心委员会(简称“ODCC”)冬季全会在宁夏银川成功召开,中科作为ODCC的新成员单位,受邀出席本次重要会议。 ▲ 
    的头像 发表于 11-24 19:00 447次阅读
    <b class='flag-5'>中科</b><b class='flag-5'>驭</b><b class='flag-5'>数</b>受邀出席2023 ODCC冬季全会,共谋开放<b class='flag-5'>数据中心</b>创新发展!