电子发烧友网报道(文/李弯弯)近日,中科驭数(北京)科技有限公司(以下简称“中科驭数”)在北京发布了关于DPU(指数据处理器芯片)的一套核心技术,包括国内首颗量产全功能DPU芯片K2Pro,以及基于该芯片的自研芯片架构和专用的指令集技术。
该公司表示,之所以发布一整套技术而非单颗芯片,是因为它们相互依赖、相互增强,共同构成了一个高效、灵活且功能强大的DPU解决方案。
中科驭数已完成三代DPU芯片的迭代研发
中科驭数成立于2018年,是一家专注于DPU芯片研发设计的企业,目前已经完成三代DPU芯片的迭代研发,并成功实现规模化商用。2019年,中科驭数研发了第一代DPU芯片K1,这是业界首颗数据库和持续数据处理融合加速的芯片。
K1能够应用在大数据以及数据计算密集型的场景,如金融计算、数据中心、5G等相关的计算场景。这颗芯片的重要意义在于验证了中科驭数KPU芯片架构的可行性。据介绍,K1已进入金融计算行业,在风控、极速交易等业务场景中实现应用。
KPU是中科驭数基于“软件定义加速器”技术路线自主研发的敏捷异构众核的芯片架构。目前中科驭数已经研发了5个应用领域80余类功能核,其中包括网络协议处理核、大数据处理核等重要的自研技术组件。KPU中不同的功能核可以通过软件定义进行自由配置,大大降低芯片的设计成本,同时KPU每个功能核都是面向特定的功能,因此能做到性能最优。
2022年12月,中科驭数发布了第二代DPU芯片K2,采用28nm制程工艺,支持网络、存储、虚拟化等功能卸载,是当时国内首颗功能较完整的ASIC形态的DPU芯片。K2可达到1.2μs超低时延,支持最高200G网络带宽。K2基于中科驭数自研的KPU芯片架构,可广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。
基于DPU芯片核心技术,中科驭数还研发了超低时延DPU网卡、RDMA加速卡、数据查询加速DPU卡以及面向金融计算领域的极速风控、极速行情等解决方案。
近日,中科驭数正式推出第三代DPU(数据处理器)芯片K2-Pro。K2-Pro是国内首颗量产全功能DPU算力芯片,专为未来数据中心和云原生环境定制优化。该芯片基于自主研发的KPU架构,集网络、存储、安全及计算等多业务卸载功能于一体。
在数据处理方面,K2-Pro的包处理速率翻倍至80Mpps,在网络密集型应用中能提供更高的吞吐量和更低的延迟。它强化了对复杂业务的支持,集成多种硬件卸载引擎,如网络卸载、流表卸载、存储卸载及RDMA网络卸载等。采用PPP、NP内核及P4可编程架构,实现业务与同构算力、异构算力灵活扩展,用户可以根据实际需求动态调整和优化系统配置。
在处理复杂任务时,K2-Pro较上一代芯片能耗降低30%,实现低功耗运行。K2-Pro可应用于超低延迟网络、数据中心、金融计算、大数据处理、高性能计算等场景,提升算力基础设施效率,减少能耗浪费,降低成本。
与K2-Pro DPU芯片同时发布的还有软件开发平台HADOS3.0,它拥有驱动、计算、存储、网络、安全等不同层次的API数量高达2765个,适配了8款CPU平台以及10大主流操作系统,是业内适配最完全、在国内实际落地部署最多的DPU软件平台之一。
还有联合行业内众多合作伙伴共同打造的驭云高性能云底座解决方案,将云计算体系中的基础设施层面完全下沉,为集群提供网络转发、存储服务、安全防护、管理调度等能力,可为云计算提供高性能、高吞吐、高安全的算力底座。
DPU在人工智能发展中的重要作用
DPU的概念最初由美国公司Fungible在2016年提出,旨在优化和提升数据中心效能。DPU被认为是数据中心继CPU和GPU之后的“第三颗主力芯片”,主要用于云计算、数据中心这种大规模算力场景。
最初,DPU是为了加速网络数据包处理而设计的,以降低主机CPU的负载。随着人工智能和大数据分析的发展,DPU的功能逐渐扩展到加速各种数据处理任务,包括深度学习推理、存储加速和安全加密等。
DPU被定位为以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等基础设施层服务。
DPU的有着广泛多样化的应用场景,如,在数据中心中,DPU可以加速网络数据包处理、存储加速和安全加密等任务。在边缘设备上部署DPU可以加速本地数据处理,减少与云端的通信延迟,并提高隐私和安全性。DPU可以用于加速深度学习模型的推理过程,从而实现实时的人工智能应用。在图像识别、语音识别、自然语言处理等场景中,DPU可以提供高性能的计算能力,满足实时性要求。
DPU的发展有着非常重大的价值,随着计算任务的日益密集,以CPU为中心的传统数据中心架构面临性能提升的瓶颈。在大型数据中心,流量处理大约占用20%至30%的计算资源。而DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务,从而释放宝贵的CPU资源以运行上层应用,实现数据为中心的业务和基础设施操作的分离。
中科驭数创始人鄢贵海介绍说:“如果把CPU比作大脑、GPU比作肌肉,那么DPU就相当于神经中枢。DPU负责数据在各种CPU和GPU之间高效流通,决定了系统是否能协同工作。将CPU处理效率低下、GPU处理不了的负载卸载到专用DPU,能够提升计算系统效率、降低整体系统成本。
事实上,在目前火热的AIGC应用方面,AI大模型的训练往往同时使用数千或数万个GPU芯片,整个服务器集群规模超10万,此时DPU可以支持超大规模组网算力互连,并可支持100G+的超高带宽,是AI产业发展的加速器。
写在最后
DPU的发展历程经历了从网络数据包处理到数据中心全方位数据处理能力的转变,其技术不断演进,功能逐渐丰富,应用场景日益广泛。随着云计算、大数据和人工智能等技术的快速发展,DPU将在未来数据中心中扮演更加重要的角色。
该公司表示,之所以发布一整套技术而非单颗芯片,是因为它们相互依赖、相互增强,共同构成了一个高效、灵活且功能强大的DPU解决方案。
中科驭数已完成三代DPU芯片的迭代研发
中科驭数成立于2018年,是一家专注于DPU芯片研发设计的企业,目前已经完成三代DPU芯片的迭代研发,并成功实现规模化商用。2019年,中科驭数研发了第一代DPU芯片K1,这是业界首颗数据库和持续数据处理融合加速的芯片。
K1能够应用在大数据以及数据计算密集型的场景,如金融计算、数据中心、5G等相关的计算场景。这颗芯片的重要意义在于验证了中科驭数KPU芯片架构的可行性。据介绍,K1已进入金融计算行业,在风控、极速交易等业务场景中实现应用。
KPU是中科驭数基于“软件定义加速器”技术路线自主研发的敏捷异构众核的芯片架构。目前中科驭数已经研发了5个应用领域80余类功能核,其中包括网络协议处理核、大数据处理核等重要的自研技术组件。KPU中不同的功能核可以通过软件定义进行自由配置,大大降低芯片的设计成本,同时KPU每个功能核都是面向特定的功能,因此能做到性能最优。
2022年12月,中科驭数发布了第二代DPU芯片K2,采用28nm制程工艺,支持网络、存储、虚拟化等功能卸载,是当时国内首颗功能较完整的ASIC形态的DPU芯片。K2可达到1.2μs超低时延,支持最高200G网络带宽。K2基于中科驭数自研的KPU芯片架构,可广泛适用于金融计算、高性能计算、数据中心、云原生、5G边缘计算等场景。
基于DPU芯片核心技术,中科驭数还研发了超低时延DPU网卡、RDMA加速卡、数据查询加速DPU卡以及面向金融计算领域的极速风控、极速行情等解决方案。
近日,中科驭数正式推出第三代DPU(数据处理器)芯片K2-Pro。K2-Pro是国内首颗量产全功能DPU算力芯片,专为未来数据中心和云原生环境定制优化。该芯片基于自主研发的KPU架构,集网络、存储、安全及计算等多业务卸载功能于一体。
在数据处理方面,K2-Pro的包处理速率翻倍至80Mpps,在网络密集型应用中能提供更高的吞吐量和更低的延迟。它强化了对复杂业务的支持,集成多种硬件卸载引擎,如网络卸载、流表卸载、存储卸载及RDMA网络卸载等。采用PPP、NP内核及P4可编程架构,实现业务与同构算力、异构算力灵活扩展,用户可以根据实际需求动态调整和优化系统配置。
在处理复杂任务时,K2-Pro较上一代芯片能耗降低30%,实现低功耗运行。K2-Pro可应用于超低延迟网络、数据中心、金融计算、大数据处理、高性能计算等场景,提升算力基础设施效率,减少能耗浪费,降低成本。
与K2-Pro DPU芯片同时发布的还有软件开发平台HADOS3.0,它拥有驱动、计算、存储、网络、安全等不同层次的API数量高达2765个,适配了8款CPU平台以及10大主流操作系统,是业内适配最完全、在国内实际落地部署最多的DPU软件平台之一。
还有联合行业内众多合作伙伴共同打造的驭云高性能云底座解决方案,将云计算体系中的基础设施层面完全下沉,为集群提供网络转发、存储服务、安全防护、管理调度等能力,可为云计算提供高性能、高吞吐、高安全的算力底座。
DPU在人工智能发展中的重要作用
DPU的概念最初由美国公司Fungible在2016年提出,旨在优化和提升数据中心效能。DPU被认为是数据中心继CPU和GPU之后的“第三颗主力芯片”,主要用于云计算、数据中心这种大规模算力场景。
最初,DPU是为了加速网络数据包处理而设计的,以降低主机CPU的负载。随着人工智能和大数据分析的发展,DPU的功能逐渐扩展到加速各种数据处理任务,包括深度学习推理、存储加速和安全加密等。
DPU被定位为以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等基础设施层服务。
DPU的有着广泛多样化的应用场景,如,在数据中心中,DPU可以加速网络数据包处理、存储加速和安全加密等任务。在边缘设备上部署DPU可以加速本地数据处理,减少与云端的通信延迟,并提高隐私和安全性。DPU可以用于加速深度学习模型的推理过程,从而实现实时的人工智能应用。在图像识别、语音识别、自然语言处理等场景中,DPU可以提供高性能的计算能力,满足实时性要求。
DPU的发展有着非常重大的价值,随着计算任务的日益密集,以CPU为中心的传统数据中心架构面临性能提升的瓶颈。在大型数据中心,流量处理大约占用20%至30%的计算资源。而DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务,从而释放宝贵的CPU资源以运行上层应用,实现数据为中心的业务和基础设施操作的分离。
中科驭数创始人鄢贵海介绍说:“如果把CPU比作大脑、GPU比作肌肉,那么DPU就相当于神经中枢。DPU负责数据在各种CPU和GPU之间高效流通,决定了系统是否能协同工作。将CPU处理效率低下、GPU处理不了的负载卸载到专用DPU,能够提升计算系统效率、降低整体系统成本。
事实上,在目前火热的AIGC应用方面,AI大模型的训练往往同时使用数千或数万个GPU芯片,整个服务器集群规模超10万,此时DPU可以支持超大规模组网算力互连,并可支持100G+的超高带宽,是AI产业发展的加速器。
写在最后
DPU的发展历程经历了从网络数据包处理到数据中心全方位数据处理能力的转变,其技术不断演进,功能逐渐丰富,应用场景日益广泛。随着云计算、大数据和人工智能等技术的快速发展,DPU将在未来数据中心中扮演更加重要的角色。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
DPU
+关注
关注
0文章
358浏览量
24189 -
中科驭数
+关注
关注
0文章
119浏览量
3990
发布评论请先 登录
相关推荐
第三代半导体产业高速发展
当前,第三代半导体碳化硅(SiC)和氮化镓(GaN)功率器件产业高速发展。其中,新能源汽车市场的快速发展是第三代半导体技术推进的重要动力之一,新能源汽车需要高效、高密度的功率器件来实现更长的续航里程和更优的能量管理。
第三代宽禁带半导体:碳化硅和氮化镓介绍
,被称为第三代宽禁带半导体。 优势 高温、高频、高耐压:相比第一代(Si、Ge)和第二代(GaAs、InSb、InP)半导体材料,第三代半导体材料在这些方面具备明显优势。 导通电阻小:
中科驭数荣获“中国芯”优秀技术创新产品奖
为推动国家集成电路产业高质量发展,2024中国微电子产业促进大会暨第十九届“中国芯”优秀产品征集结果发布仪式近日在横琴粤澳深度合作区举行。中科驭数第
荣耀Magic V3发布,搭载第三代骁龙8移动平台
今日,荣耀召开Magic旗舰新品发布会,正式发布了全新轻薄折叠屏荣耀Magic V3和荣耀Magic Vs3,以及荣耀平板MagicPad 2等新品。其中荣耀Magic V3搭载第三代
iQOO Neo9S Pro+发布,搭载第三代骁龙8移动平台
今日,iQOO在新品发布会上正式带来了Neo系列新成员——iQOO Neo9S Pro+。新机搭载第三代骁龙8移动平台,从性能、外观、屏幕、续航和系统等方面“满级进化”,为用户带来更非凡的移动游戏体验。
红魔9S Pro系列发布,搭载第三代骁龙8移动平台
今日,红魔电竞宇宙新品发布会正式召开。其中,红魔9S Pro+和红魔9S Pro两款AI游戏手机搭载第三代骁龙8移动平台重磅登场,不仅带来旗舰级性能表现,更以AI重构全新使用体验,开启
重新定义DPU——中科驭数2024产品发布会,6月19日诚邀莅临!
数据中心正经历着前所未有的变革,DPU作为数据中心第三颗主力芯片,正引领行业步入一个高效、灵活的算力新时代。 中科
vivo发布新一代折叠旗舰vivo X Fold3系列,搭载第三代骁龙8移动平台
今日,vivo正式发布全新一代折叠旗舰vivo X Fold3系列。其中vivo X Fold3 Pro搭载第三代骁龙8移动平台,vivo X Fold3搭载第二
小米14 Ultra发布,搭载第三代骁龙8移动平台
今日,小米召开主题为“新层次”的新品发布会,正式推出了小米14 Ultra手机。新机搭载第三代骁龙8移动平台,集小米领先技术于一身,带来全方位跨越的新一代专业影像旗舰,让真实有层次。
评论