0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产首个4K级高性能GPU “风华1号”重磅发布,性能实现突破

芯动科技Innosilicon 2021-12-02 17:04 次阅读

2021年11月26日,首款国产高性能4K级显卡GPU芯片“风华1号”在上海正式发布。中国一站式IP和芯片定制服务领军企业芯动科技在会上正式发布了“风华1号”的性能参数, 并通过现场多项4K级重度渲染演示,揭开了这款集众多自主技术创新、备受瞩目的国产GPU芯片的神秘面纱。

IMG_256芯动云计算总裁敖海先生概括“风华1号”GPU性能突破

IMG_256芯动云计算总裁敖海先生发布“风华1号”GPU芯片

“风华1号”GPU性能大幅领先, 成倍提升了现有国产GPU水平。“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS;3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体;AI性能为25TOPS(INT8);芯片支持32路SRIOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全;显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps;显存带宽最高可达304GB/s,显存容量最大可扩展至16GB;主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8;视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。风华1号”实测功耗表现非常优秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术, 通过Innolink chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍, 渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。

IMG_256

芯动科技在发布会现场进行了“风华1号”A卡的渲染演示,众多与会嘉宾、客户和合作伙伴近距离观看了“风华1号”在国产CPU操作系统桌面上办公上网、CAD设计、图形工作站、EDA设计、GIS实景地图、重度游戏benchmark、OpenGL4.0 Heaven、Vulkan框架下运行Windows游戏、多路云游戏等多种高清渲染场景下的流畅表现,不时发出赞许和夸奖。有业内人士甚至抑制不住好奇心,亲自操作测试演示室的机器,确认得到满意的体验。会场火热气氛中,还出现了不速之客,居然乘机偷走一块展示的显卡,导致警方介入,为大会增添了一点特别的花絮。

微信图片_20211128204649.jpg与会者参观GPU展台

微信图片_20211128204715.jpg与会者参观“风华1号”演示间

多位与会嘉宾表示,“风华1号”的正式发布意义重大,技术含金量高,一改过去国产显卡不好用的体验,实现了国产5G数据中心服务器GPU和4K桌面GPU这两大应用场景从0到1的突破。“风华1号”显卡实现了多个第一, 如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡,第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU,还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。“风华1号”大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能对标国外服务器级别显卡,效果惊艳全场。在发布会期间的交流洽谈过程中,不少客户当场表达了合作和购买意向。

“风华1号”大型芯片的诞生,绝非偶然,其实是芯动科技15年如一日,长期深耕核心技术厚积薄发的必然。芯动科技工程副总毛鸣明在演讲时提到,“15年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,付出的努力和心血是难以想象的。光是行业创纪录的200多次先进工艺流片,就可见一斑。芯动连续11年细分市场遥遥领先,在重大开发投入的情况下,还能持续盈利,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,包括中兴通讯、华为海思瑞芯微、君正、微软、AMD亚马逊等知名公司逾50亿颗先进SOC芯片背后,都有用到芯动技术。芯动以前是幕后英雄,在to B的圈子非常有名, 为众多客户一次流片成功并做到自主可控, 成就客户,也成就了自己,芯动在长期研发中积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验, 所以‘风华1号’能够一炮打响、性能超群”。

据悉,“风华1号”上搭载的GDDR6X顶级难度的显存技术,目前全球只有英伟达和芯动科技两家拥有,“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比”,这是芯动科技GDDR6X研发负责人高专的切身感悟。“GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来;而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了, 连AMD都没有做到,所以美光的架构师都不禁感叹我们的研发实力之强,令他们印象深刻。事实上,如果没有我们团队十多年的技术基础积累和200次流片打磨的经验,这个成果是无法实现的,芯动科技绝对是国内硬科技企业的代表。”

“风华1号”的成功不是靠资本堆砌出来的, 它是芯动团队怀揣芯片报国的使命感,为客户定制而结出的硕果。正如芯动首席算法科学家杨喜乐博士在发布会上所说的,她自从博士毕业之后,在英国Imagination公司,作为顶级架构师,25年来一直从事GPU核心图形引擎的建模和创新,能够回国投身到国产GPU图形引擎的持续创新,她既感到驾轻就熟,又感到十分欣慰!杨喜乐博士是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家,持有GPU 3D计算机图形学核心领域顶级图形专利共计125项,目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。她在芯动科技提出了性能优越的下一代创新GPU架构和方法,带领来自全球顶尖GPU企业的专家团队,推动国产GPU的发展,助力国产GPU自主可控。杨博士在发布会上生动讲述了GPU技术的前世今生,以及为什么芯动团队能够做好GPU。杨博士感叹, 这绝不像互联网的同质化竞争,“现代GPU的理论基础太深、开发应用坑太多了,技术发展日新月异,竞争极其激烈。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,绝不是一朝一夕的事,对团队紧密协作能力要求很高,必须踏踏实实地长期市场化打磨,靠PPT烧钱只会是死路一条。没有一个跨多领域和有大量流片交付经验的复合型技术团队,不懂GPU底层算法架构和软硬件创新,不能根据实际情况和自身实力长期潜心持续演进架构和开发,不可能在这个领域成功。风华1号的诞生,倾注了数百名芯动GPU工程师的心血,其中凝聚了芯动自有的众多技术积累和来自世界著名GPU公司的顶尖人才的联合参与,风华1号仅仅是个开始,风华2号和3号已经在路上了”。

微信图片_20211128204704.jpg世界知名GPU图形学专家杨喜乐博士分享GPU的前世今生

芯动DX团队负责人、前AMD的图形框架开发的领军人物章涛表示,“投身芯动开发GPU软件感觉非常棒!芯动团队从老板到员工,都是专心做事的文化,没有政治斗争,大家团结互助一起努力,这样的团队没有理由不成功!欢迎更多的有识之士加入我们,一起成就国产GPU大业。明年我们就会发布我们风华显卡Windows操作系统的DX框架。”

fc3a10513066589b2f7cd27ea22155e来自AMD的领军人物章涛先生畅谈加入芯动科技的工作感受

在谈到风华1号的架构时,芯动科技SoC体系架构师何颖先生十分形象地展示了全球知名GPU架构演进和风华1号的架构开发过程,“现代GPU架构已经被成千上万专利所保护,没有哪个初创公司的GPU架构是自己完全从无到有开发出来的,大家无一例外都是在一定授权基础上的开发,那些宣称架构完全自研的初创公司,都是经不起深究的。我们获得授权的架构和苹果M1的GPU一样,并针对未来国产GPU生态建设和国内使用环境进一步深度定制,加上我们自研的核心技术和大量创新,确保了国产GPU持续演进和自主可控。”

在发布环节,芯动云计算总裁敖海先生正式发布了“风华1号”的各项参数和性能,现场进行了大屏幕4K级演示。“风华1号”显卡无论是在国产办公、桌面重度渲染、GIS地图、国产EDA/CAD软件,还是重度游戏benchmark渲染上,都展示了游刃有余的流畅。强劲的实力,引得现场观众阵阵惊叹。无怪乎到场的国产EDA公司--芯和半导体CTO代文亮博士激动地上台表示,“风华1号”的诞生恰逢其时,他对“风华1号”能够支持芯和和华大九天的国产EDA工具感到非常振奋,对芯动科技“锲而不舍,众志成城”的企业文化和芯动人强悍的执行力赞不绝口。

微信图片_20211128204614.jpg芯动云计算总裁敖海先生概括“风华1号”GPU多个第一

IMG_258芯动云计算总裁敖海先生现场演示“风华1号”GPU OpenGL4.0重度应用Heaven

敖海在发布会结尾总结道,“我们的使命是让风华GPU走进千家万户,让大家习惯用国产的GPU办公和娱乐。‘风华1号’是芯动人努力和成果的结晶,这只是风华系列GPU赋能国产生态的开始。芯动正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU等合作伙伴送样的同时,新一代GPU芯片已经在路上了。先进工艺的强悍迭代能力是芯动的固有优势,我们靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比。芯动计划在未来三年里持续每年量产两颗以上、性能不断大幅度提升的GPU芯片,并满足用户的定制需求。明年初‘风华2号’和‘风华3号’将接踵而至, 2022年我们计划投片5纳米加光追技术,赋能国产GPU产业链我们志在必得,请大家拭目以待”。

“风华1号”的诞生正当其时,填补了国产4K级桌面显卡和服务器显卡两大空白,支持国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业。“风华1号”是芯动赋能国产GPU生态链的开始,相信不久的将来,国产高性能GPU就会走进千家万户,全球客户都可以使用风华GPU,在办公、娱乐中体验科技带来的流畅和快乐!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128674
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5775
  • 芯动科技
    +关注

    关注

    2

    文章

    91

    浏览量

    9872
收藏 人收藏

    评论

    相关推荐

    国产自主可控高性能车规MCU芯片发布

    近日,湖北省车规芯片产业技术创新联合体2024年大会召开,会上由东风汽车牵头组建的湖北省车规芯片产业技术创新联合体发布高性能车规MC
    的头像 发表于 11-11 13:53 239次阅读

    如何提高GPU性能

    学习和机器学习等领域发挥着重要作用。 1. 硬件升级 a. 更换高性能GPU 最直接的提高GPU性能的方法是升级到更
    的头像 发表于 10-27 11:21 208次阅读

    GPU高性能服务器配置

    GPU高性能服务器作为提升计算速度和效率的关键设备,在各大应用场景中发挥着越来越重要的作用。在此,petacloud.ai小编为你介绍GPU高性能服务器的配置要点。
    的头像 发表于 10-21 10:42 150次阅读

    曙光存储实现世界级性能突破

    曙光存储召开了主题为“先进存力,凝聚数据要素”的新品暨品牌发布会,震撼发布全球首个亿IOPS集中式全闪存储FlashNexus,重磅升级分
    的头像 发表于 09-19 15:51 243次阅读

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 算力芯片在最近15年有着巨大性能突破,这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA的GPU产品从第一次
    发表于 09-02 10:09

    集特国产风华2显卡性能究竟如何?

    国产计算机找集特智能。这个显卡有点故事—集特GXC501,搭载风华2,百分百国产化BOM,每一颗物料都滚动着中国的热血!VGA+DP+HDMI显示接口,也可拆分为DP+HDMI和V
    的头像 发表于 08-07 08:14 837次阅读
    集特<b class='flag-5'>国产</b><b class='flag-5'>风华</b>2<b class='flag-5'>号</b>显卡<b class='flag-5'>性能</b>究竟如何?

    实测分享,瑞芯微RK3588八核国产处理器性能测评!确实“遥遥领先”!

    的图形处理,适用于需要高运算能力的工业自动化系统和工业物联网设备。 运动控制器:RK3588可提供精确的实时控制和数据处理能力,适用于各种运动控制应用。 医疗智能设备:RK3588可提供多路4K/8K
    发表于 07-17 10:49

    米尔创新设计RK3568全LGA国产核心板,更紧凑可靠省连接器成本

    高性能CPU,含有1Tops NPU,3D GPU Mali G52,VPU 4K高清视频编解码器,支持三屏异显。支持丰富的多媒体接口HDMI,eDP,LVDS,MIPI,Parall
    发表于 06-28 19:37

    高性能NVMe主机控制器,Xilinx FPGA PCIe 3

    独立的数据写入AXI4-Stream/FIFO接口和数据读取AXI4-Stream/FIFO接口,非常适合于超高容量和超高性能的应用。此外,NVMe Host Controller IP支持RAID存储
    发表于 04-20 14:41

    高性能NVMe主机控制器,Xilinx FPGA NVMe Host Accelerator IP

    )读写、DMA读写和数据擦除功能,提供用户一个简单高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大
    发表于 04-10 22:55

    Xilinx FPGA高性能NVMe SSD主机控制器,NVMe Host Controller IP

    )读写、DMA读写和数据擦除功能,提供用户一个简单高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大
    发表于 03-27 17:23

    Xilinx FPGA NVMe主机控制器IP,高性能版本介绍应用

    高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大是512K-Byte。顺序传输长度配置为
    发表于 03-09 13:56

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器~

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期推荐:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情
    发表于 03-01 19:02

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期上新:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情 产品实拍
    发表于 03-01 15:16

    重磅新品】盘古100K开发板,紫光同创PG2L100H,Logos2系列,性能全面提升

    丰富,可以充分满足高速数据的缓存处理需求 海量的外围接口,充分满足多方位开发需求 三:核心板产品概述 盘古100K核心板是基于紫光同创Logos2系列(PG2L100H-FBB484)开发的全新国产高性能
    发表于 12-29 16:31