0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

可重构数据流计算引领架构创新

鲲云科技 来源:鲲云科技 2024-01-04 11:37 次阅读

近日,由中国信息通信研究院、四川省经济和信息化厅、达州市人民政府主办的“首届全国先进计算技术创新大赛总决赛暨先进计算产业发展大会”在四川达州举办。为把握新一轮科技革命和产业变革机遇,推进先进计算技术创新,中国信息通信研究院在会上发布了《先进计算技术发展白皮书(2023 年)》,中国信息通信研究院、联想、长城科技、浪潮信息、鲲云科技等多家单位参编。

白皮书系统介绍了当前全球及我国先进计算技术发展背景与总体发展态势,并从计算芯片、系统架构、计算模式、绿色和安全技术四方面研究了产业技术创新进展,同时介绍了量子计算、类脑计算、光电计算、生物计算等前沿计算技术研究进展,并结合当前我国先进计算技术发展现状提出了先进计算技术发展推进建议。

先进计算技术成为新一轮科技革命的关键突破点

当前,在以大模型为代表的人工智能技术创新与应用驱动下,社会对计算能力的需求空前高涨,但随着“摩尔定律”演进趋势放缓,计算技术的传统演进路径面临挑战,先进计算技术创新成为破局关键,驱动着芯片演进、架构创新,推动计算产品向绿色安全方向发展,探索前沿计算技术落地应用。

白皮书指出,先进计算并非特指某项具体技术,而是指面向未来,相较于传统计算技术在理论、硬件、系统以及应用等方面进行的创新与优化,旨在提高算力、能效、灵活性,实现人、机、物更高效互通的计算技术的统称。先进计算是涵盖理论、材料、工艺、器件、系统、算法、架构、应用等在内的系统工程,具备先进性、泛在性和多样性的特点,是解决计算技术发展问题的集合。

当前,全球先进计算技术正处于密集创新阶段,国内外政府、龙头企业高度重视先进计算技术创新发展,计算芯片、整机系统、前沿技术创新突破不断。白皮书分享到,传统计算硬件不断演进,可重构数据流计算、异构计算、存算一体等多种创新架构涌现,以及量子计算、类脑计算、光计算等前沿计算技术的持续探索,为先进计算产业提供了更多可能性。

可重构数据流计算—从底层创新的计算架构

作为行业内有代表性的创新架构之一,白皮书梳理了“可重构数据流计算”的原理、优势、发展路径及应用现状。据白皮书定义,可重构数据流架构是一种基于可重构的空间连接关系定义计算次序的计算架构方式。

如下图所示,可重构数据流计算单元之间有可重构的计算连线,根据计算次序定义计算单元之间的连接关系,从而定义一个依次计算乘法、累加、激活、池化的案例,无需指令实现对应的计算次序,节省由于数据读写带来的计算单元闲置。

53210c1e-aab2-11ee-8b88-92fbcf53809c.gif

▲可重构数据流计算示意图

在这种计算方式下,可重构数据流架构解决指令集架构的几大核心问题:

(1) 数据流架构中数据流动次序即计算执行次序,没有指令概念,移除了由于指令带来的控制冗余以及等待指令读取译码带来的计算单元闲置;

(2) 数据流架构支持时钟级的精确计算,每个数据流动及计算在每个时钟都可精确预计,从而支持将数据流动与计算深度重叠,大幅降低计算单元闲置;

(3) 数据流架构中一个数据流流水线中可深度整合大量计算单元,从而打破指令集架构中峰值算力提升与芯片利用率的冲突问题:通过不断加深数据流流水线,可以在提升峰值算力同时,不降低流水线中计算单元闲置时间。

2020 年,鲲云科技推出全球首款可重构数据流 AI 芯片 CAISA,CAISA 芯片利用率最高可达 95.4%,在芯片成本为国际同类产品 1/3 的情况下,最高可提供 4.12 倍以上的实测性能。目前,CAISA 芯片已与飞腾、麒麟、浪潮、open 欧拉等完成产品兼容,在算力性价比、芯片利用率、实测性能和处理延时等指标实现了业界领先,为底层的 AI 算力支撑提供了新的选择。

除鲲云科技外,全球研发数据流 AI 芯片的团队还有脱胎于斯坦福大学的 SambaNova、前谷歌 TPU 核心团队创办的 Groq,目前仍处于小规模应用阶段。同时,部分指令集架构芯片也在局部采用了数据流架构,比如 TPU 的 Systolic Array,GPU 里的 Tensor Core 等,以提升芯片利用率。由此可见,可重构数据流计算作为一种新的技术路线获得市场充分认可。

放眼先进计算产业未来发展,白皮书强调,应加强产业链上下游各方协同,加强核心关键技术研发,以技术驱动标准制定,推进示范应用,助力产业加快成熟。作为行业“排头兵”,鲲云科技将基于“可重构数据流计算”持续加强产品、解决方案的研发迭代,为社会提供下一代计算平台,加速人工智能在各行业应用场景落地。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237463
  • 鲲云科技
    +关注

    关注

    0

    文章

    29

    浏览量

    3805
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2457
  • 先进计算
    +关注

    关注

    0

    文章

    36

    浏览量

    73

原文标题:技术分享|《先进计算技术发展白皮书(2023年)》发布,“可重构数据流计算”引领架构创新

文章出处:【微信号:鲲云科技,微信公众号:鲲云科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于相变材料的重构超构表面用于图像处理

    光学超构表面(metasurface)实现了在亚波长尺度内的模拟计算和图像处理,并具备更低的功耗、更快的速度。虽然人们已经展示了各种图像处理超构表面,但大多数考虑的器件都是静态的,缺乏重构性。然而
    的头像 发表于 11-13 10:24 110次阅读
    基于相变材料的<b class='flag-5'>可</b><b class='flag-5'>重构</b>超构表面用于图像处理

    理解ECU数据流的分析方法

    随着汽车电子化程度的提高,ECU在车辆中扮演的角色越来越重要。它们不仅控制着发动机管理、变速箱、制动系统等关键功能,还涉及到车辆的舒适性和安全性。 ECU数据流分析的重要性 故障诊断 :通过
    的头像 发表于 11-05 11:07 281次阅读

    请问TLV320AIC3254EVM-K怎么读取音频数据流

    您好,我在学习TLV320AIC3254EVM-K开发板的过程中碰到一个这样的问题,TI提供的软件是否具备读取I2S的音频数据流的功能,或者是否有PC机软件可以读取音频数据流,或者其它方法?请高手帮忙解决,万分感谢!
    发表于 10-31 06:14

    统一日志数据流

    统一日志数据流图 日志系统数据流图 系统进行日志收集的过程可以分为三个环节: (1)日志收集和导入ElasticSearch (2)ElasticSearch进行索引等处理 (3)可视化操作,查询等
    的头像 发表于 08-21 15:00 269次阅读
    统一日志<b class='flag-5'>数据流</b>图

    使用CYUSB3014实现USB3VISION,不能成功发送DSI数据流是怎么回事?

    /USB3-Vision-DMA-on-Leader-packet-on-FX3...。目前使用eBUS Player这个软件能够成功识别到U3V设备,并且连接成功,但是启动发送数据流时,仅能够发送leader数据,不能够正常发送有效负载
    发表于 07-05 07:58

    ESP32如何在不漏数据的情况下采集数据流

    esp32作为spi从机连接一款AD,该AD芯片上电后就会持续不断地向外发送数据,如果循环调用spi_slave_transmit(),那么两次调用之间就会漏掉一些数据。 请问从机有没有办法在不漏数据的情况下采集这个
    发表于 06-19 08:02

    华为云函数工作引领未来无服务器计算时代

    在当今数字化飞速发展的时代,企业和个人对于计算资源的需求越来越高,但传统的服务器架构带来的管理成本和资源浪费问题也愈发凸显。为解决这一难题,华为云引领着无服务器计算的浪潮,推出了函数工
    的头像 发表于 05-27 10:50 327次阅读
    华为云函数工作<b class='flag-5'>流</b>:<b class='flag-5'>引领</b>未来无服务器<b class='flag-5'>计算</b>时代

    存内计算——助力实现28nm等效7nm功效

    重构芯片尝试在芯片内布设可编程的计算资源,根据计算任务的数据流特点,动态构造出最适合的计算
    的头像 发表于 05-17 15:03 1730次阅读
    存内<b class='flag-5'>计算</b>——助力实现28nm等效7nm功效

    TSN时间敏感网络QoS数据流传输中干扰的三种模式#TSN #时间敏感网络

    数据流TSN
    北汇信息POLELINK
    发布于 :2024年04月24日 12:29:11

    stm32F429串口采用DMA方式发送,数据流使能失败的原因?

    DMA1 时钟稳定 DMA_DeInit(DMA2_Stream7);// 复位初始化DMA数据流 while (DMA_GetCmdStatus(DMA2_Stream7) != DISABLE
    发表于 04-17 07:05

    【量子计算重构未来 | 阅读体验】 跟我一起漫步量子计算

    首先感谢发烧友提供的试读机会。 略读一周,感触颇深。首先量子计算机作为一种前沿技术,正逐步展现出其巨大的潜力,预示着未来社会和技术领域的深刻变革。下面,我将从几个方面探讨量子计算机如何重构我们
    发表于 03-13 19:28

    【量子计算重构未来 | 阅读体验】+ 了解量子叠加原理

    机如何生产制造。。。。。。 近来通过阅读《量子计算机—重构未来》一书,结合网络资料,了解了一点点量子叠加知识,分享给大家。 先提一下电子计算机,电子计算机使用二进制表示信息
    发表于 03-13 17:19

    【量子计算重构未来 | 阅读体验】+ 初识量子计算

    欣喜收到《量子计算机——重构未来》一书,感谢电子发烧友论坛提供了一个让我了解量子计算机的机会! 自己对电子计算机有点了解,但对量子计算机真
    发表于 03-05 17:37

    fx3进行视频数据流的传输的时候,请问如何修改可以达到同步传输的要求?

    在fx3的固件中给出的slavefifo 是通过bulk传输的demo 我想进行视频数据流的传输的时候,请问如何修改可以达到同步传输的要求 我目前在固件里面只看到了bulk的方式,如果有同步传输的demo或者修改教程请不吝赐教 FX3中的ISO数据传输,这一部分
    发表于 02-28 07:50

    Lambda数据架构和Kappa数据架构——构建现代数据架构

    。文章速览:什么是数据架构?基于速度的数据架构Lambda数据架构Kappa
    的头像 发表于 11-26 08:04 650次阅读
    Lambda<b class='flag-5'>数据</b><b class='flag-5'>架构</b>和Kappa<b class='flag-5'>数据</b><b class='flag-5'>架构</b>——构建现代<b class='flag-5'>数据</b><b class='flag-5'>架构</b>