0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

国产首个4K级高性能GPU “风华1号”重磅发布,性能实现突破

芯动科技Innosilicon 2021-12-02 17:04 次阅读

2021年11月26日,首款国产高性能4K级显卡GPU芯片“风华1号”在上海正式发布。中国一站式IP和芯片定制服务领军企业芯动科技在会上正式发布了“风华1号”的性能参数, 并通过现场多项4K级重度渲染演示,揭开了这款集众多自主技术创新、备受瞩目的国产GPU芯片的神秘面纱。

IMG_256芯动云计算总裁敖海先生概括“风华1号”GPU性能突破

IMG_256芯动云计算总裁敖海先生发布“风华1号”GPU芯片

“风华1号”GPU性能大幅领先, 成倍提升了现有国产GPU水平。“风华1号”单芯片A卡渲染能力达到160GPixel/秒,FP32浮点性能达到5T FLOPS;3D图形渲染处理管线定制优化,支持Linux/龙芯/Windows/安卓操作系统图形框架,同时支持4路4K@60、16路1080P@60fps或32路720P@30fps,集渲染+低延迟编解码+AI计算于一体;AI性能为25TOPS(INT8);芯片支持32路SRIOV虚拟化,内置中国专利的物理不可克隆PUF技术,保护信息安全;显存技术采用全球领先的GDDR6/GDDR6X Combo自研技术,单比特最大传输速率达到19Gbps;显存带宽最高可达304GB/s,显存容量最大可扩展至16GB;主机接口支持PCIe4.0X16,且向下兼容PCIe3.0/2.0X8;视频输出接口方面,“风华1号”配置自研HDMI2.1/DP1.4/VGA等超高清接口,支持多路独立输出。风华1号”实测功耗表现非常优秀,桌面4K重度渲染典型芯片功耗在20W左右,多路重度云渲染典型功耗在50W左右。“风华1号”还首次成功实施了中国自主标准的Innolink Chiplet多晶粒技术, 通过Innolink chiplet扩展,“风华1号”GPU显卡服务器用B卡,在A卡基础上直接性能翻倍, 渲染能力达到320GPixel/秒,FP32浮点性能达到10T FLOPS;同时支持32路1080P@60fps和64路720P@30fps强渲染+低延迟编解码+AI计算,显存达到32GB。

IMG_256

芯动科技在发布会现场进行了“风华1号”A卡的渲染演示,众多与会嘉宾、客户和合作伙伴近距离观看了“风华1号”在国产CPU操作系统桌面上办公上网、CAD设计、图形工作站、EDA设计、GIS实景地图、重度游戏benchmark、OpenGL4.0 Heaven、Vulkan框架下运行Windows游戏、多路云游戏等多种高清渲染场景下的流畅表现,不时发出赞许和夸奖。有业内人士甚至抑制不住好奇心,亲自操作测试演示室的机器,确认得到满意的体验。会场火热气氛中,还出现了不速之客,居然乘机偷走一块展示的显卡,导致警方介入,为大会增添了一点特别的花絮。

微信图片_20211128204649.jpg与会者参观GPU展台

微信图片_20211128204715.jpg与会者参观“风华1号”演示间

多位与会嘉宾表示,“风华1号”的正式发布意义重大,技术含金量高,一改过去国产显卡不好用的体验,实现了国产5G数据中心服务器GPU和4K桌面GPU这两大应用场景从0到1的突破。“风华1号”显卡实现了多个第一, 如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡,第一款图形API达到OpenGL4.0以上,并能实际演示4.0 benchmark的GPU,还是第一款支持多路渲染+编解码+AI服务,硬件虚拟化和chiplet可延展的国产GPU等。“风华1号”大幅提升了国产GPU的渲染能力,在5G数据中心渲染性能对标国外服务器级别显卡,效果惊艳全场。在发布会期间的交流洽谈过程中,不少客户当场表达了合作和购买意向。

“风华1号”大型芯片的诞生,绝非偶然,其实是芯动科技15年如一日,长期深耕核心技术厚积薄发的必然。芯动科技工程副总毛鸣明在演讲时提到,“15年来芯动科技低调务实,敢为人先,攻关克难,团队十年坐得板凳冷,付出的努力和心血是难以想象的。光是行业创纪录的200多次先进工艺流片,就可见一斑。芯动连续11年细分市场遥遥领先,在重大开发投入的情况下,还能持续盈利,为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制,包括中兴通讯、华为海思瑞芯微、君正、微软、AMD亚马逊等知名公司逾50亿颗先进SOC芯片背后,都有用到芯动技术。芯动以前是幕后英雄,在to B的圈子非常有名, 为众多客户一次流片成功并做到自主可控, 成就客户,也成就了自己,芯动在长期研发中积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验, 所以‘风华1号’能够一炮打响、性能超群”。

据悉,“风华1号”上搭载的GDDR6X顶级难度的显存技术,目前全球只有英伟达和芯动科技两家拥有,“核心技术是买不来的,英伟达的高带宽显存技术一直自研,是其保持其竞争优势和70%利润率的一大利器,芯动科技在这方面能与其并驾齐驱,确保了GPU性能和工艺量产的灵活性和性价比”,这是芯动科技GDDR6X研发负责人高专的切身感悟。“GDDR6X的PAM4并行技术超级难做,英伟达与美光在一栋楼里共同研发两年才研发出来;而芯动团队是全球唯一一家,仅凭有限的远程技术支持,只用一年时间就做出来了, 连AMD都没有做到,所以美光的架构师都不禁感叹我们的研发实力之强,令他们印象深刻。事实上,如果没有我们团队十多年的技术基础积累和200次流片打磨的经验,这个成果是无法实现的,芯动科技绝对是国内硬科技企业的代表。”

“风华1号”的成功不是靠资本堆砌出来的, 它是芯动团队怀揣芯片报国的使命感,为客户定制而结出的硕果。正如芯动首席算法科学家杨喜乐博士在发布会上所说的,她自从博士毕业之后,在英国Imagination公司,作为顶级架构师,25年来一直从事GPU核心图形引擎的建模和创新,能够回国投身到国产GPU图形引擎的持续创新,她既感到驾轻就熟,又感到十分欣慰!杨喜乐博士是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家,持有GPU 3D计算机图形学核心领域顶级图形专利共计125项,目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。她在芯动科技提出了性能优越的下一代创新GPU架构和方法,带领来自全球顶尖GPU企业的专家团队,推动国产GPU的发展,助力国产GPU自主可控。杨博士在发布会上生动讲述了GPU技术的前世今生,以及为什么芯动团队能够做好GPU。杨博士感叹, 这绝不像互联网的同质化竞争,“现代GPU的理论基础太深、开发应用坑太多了,技术发展日新月异,竞争极其激烈。要拿出一款对标行业先进水平的图形GPU,且流畅兼容各种应用,绝不是一朝一夕的事,对团队紧密协作能力要求很高,必须踏踏实实地长期市场化打磨,靠PPT烧钱只会是死路一条。没有一个跨多领域和有大量流片交付经验的复合型技术团队,不懂GPU底层算法架构和软硬件创新,不能根据实际情况和自身实力长期潜心持续演进架构和开发,不可能在这个领域成功。风华1号的诞生,倾注了数百名芯动GPU工程师的心血,其中凝聚了芯动自有的众多技术积累和来自世界著名GPU公司的顶尖人才的联合参与,风华1号仅仅是个开始,风华2号和3号已经在路上了”。

微信图片_20211128204704.jpg世界知名GPU图形学专家杨喜乐博士分享GPU的前世今生

芯动DX团队负责人、前AMD的图形框架开发的领军人物章涛表示,“投身芯动开发GPU软件感觉非常棒!芯动团队从老板到员工,都是专心做事的文化,没有政治斗争,大家团结互助一起努力,这样的团队没有理由不成功!欢迎更多的有识之士加入我们,一起成就国产GPU大业。明年我们就会发布我们风华显卡Windows操作系统的DX框架。”

fc3a10513066589b2f7cd27ea22155e来自AMD的领军人物章涛先生畅谈加入芯动科技的工作感受

在谈到风华1号的架构时,芯动科技SoC体系架构师何颖先生十分形象地展示了全球知名GPU架构演进和风华1号的架构开发过程,“现代GPU架构已经被成千上万专利所保护,没有哪个初创公司的GPU架构是自己完全从无到有开发出来的,大家无一例外都是在一定授权基础上的开发,那些宣称架构完全自研的初创公司,都是经不起深究的。我们获得授权的架构和苹果M1的GPU一样,并针对未来国产GPU生态建设和国内使用环境进一步深度定制,加上我们自研的核心技术和大量创新,确保了国产GPU持续演进和自主可控。”

在发布环节,芯动云计算总裁敖海先生正式发布了“风华1号”的各项参数和性能,现场进行了大屏幕4K级演示。“风华1号”显卡无论是在国产办公、桌面重度渲染、GIS地图、国产EDA/CAD软件,还是重度游戏benchmark渲染上,都展示了游刃有余的流畅。强劲的实力,引得现场观众阵阵惊叹。无怪乎到场的国产EDA公司--芯和半导体CTO代文亮博士激动地上台表示,“风华1号”的诞生恰逢其时,他对“风华1号”能够支持芯和和华大九天的国产EDA工具感到非常振奋,对芯动科技“锲而不舍,众志成城”的企业文化和芯动人强悍的执行力赞不绝口。

微信图片_20211128204614.jpg芯动云计算总裁敖海先生概括“风华1号”GPU多个第一

IMG_258芯动云计算总裁敖海先生现场演示“风华1号”GPU OpenGL4.0重度应用Heaven

敖海在发布会结尾总结道,“我们的使命是让风华GPU走进千家万户,让大家习惯用国产的GPU办公和娱乐。‘风华1号’是芯动人努力和成果的结晶,这只是风华系列GPU赋能国产生态的开始。芯动正在加紧与合作伙伴进行‘风华1号’适配调优,在向数据中心和国产桌面GPU等合作伙伴送样的同时,新一代GPU芯片已经在路上了。先进工艺的强悍迭代能力是芯动的固有优势,我们靠自有IP和定制能力以及代工厂合作伙伴的支持,不断演进先进技术,确保性能持续领先、供应链安全和优势性价比。芯动计划在未来三年里持续每年量产两颗以上、性能不断大幅度提升的GPU芯片,并满足用户的定制需求。明年初‘风华2号’和‘风华3号’将接踵而至, 2022年我们计划投片5纳米加光追技术,赋能国产GPU产业链我们志在必得,请大家拭目以待”。

“风华1号”的诞生正当其时,填补了国产4K级桌面显卡和服务器显卡两大空白,支持国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业。“风华1号”是芯动赋能国产GPU生态链的开始,相信不久的将来,国产高性能GPU就会走进千家万户,全球客户都可以使用风华GPU,在办公、娱乐中体验科技带来的流畅和快乐!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4662

    浏览量

    128539
  • GPU芯片
    +关注

    关注

    1

    文章

    303

    浏览量

    5768
  • 芯动科技
    +关注

    关注

    2

    文章

    91

    浏览量

    9868
收藏 人收藏

    评论

    相关推荐

    如何提高GPU性能

    学习和机器学习等领域发挥着重要作用。 1. 硬件升级 a. 更换高性能GPU 最直接的提高GPU性能的方法是升级到更
    的头像 发表于 10-27 11:21 140次阅读

    GPU高性能服务器配置

    GPU高性能服务器作为提升计算速度和效率的关键设备,在各大应用场景中发挥着越来越重要的作用。在此,petacloud.ai小编为你介绍GPU高性能服务器的配置要点。
    的头像 发表于 10-21 10:42 126次阅读

    曙光存储实现世界级性能突破

    曙光存储召开了主题为“先进存力,凝聚数据要素”的新品暨品牌发布会,震撼发布全球首个亿IOPS集中式全闪存储FlashNexus,重磅升级分
    的头像 发表于 09-19 15:51 209次阅读

    名单公布!【书籍评测活动NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架构分析

    纸质媒体的高质量和专业网络媒体的信息更新速度。 算力芯片在最近15年有着巨大性能突破,这些年Intel的CPU芯片从双核128位SIMD到众核512位SIMD;NVIDIA的GPU产品从第一次
    发表于 09-02 10:09

    集特国产风华2显卡性能究竟如何?

    国产计算机找集特智能。这个显卡有点故事—集特GXC501,搭载风华2,百分百国产化BOM,每一颗物料都滚动着中国的热血!VGA+DP+HDMI显示接口,也可拆分为DP+HDMI和V
    的头像 发表于 08-07 08:14 702次阅读
    集特<b class='flag-5'>国产</b><b class='flag-5'>风华</b>2<b class='flag-5'>号</b>显卡<b class='flag-5'>性能</b>究竟如何?

    实测分享,瑞芯微RK3588八核国产处理器性能测评!确实“遥遥领先”!

    的图形处理,适用于需要高运算能力的工业自动化系统和工业物联网设备。 运动控制器:RK3588可提供精确的实时控制和数据处理能力,适用于各种运动控制应用。 医疗智能设备:RK3588可提供多路4K/8K
    发表于 07-17 10:49

    米尔创新设计RK3568全LGA国产核心板,更紧凑可靠省连接器成本

    高性能CPU,含有1Tops NPU,3D GPU Mali G52,VPU 4K高清视频编解码器,支持三屏异显。支持丰富的多媒体接口HDMI,eDP,LVDS,MIPI,Parall
    发表于 06-28 19:37

    高性能NVMe主机控制器,Xilinx FPGA PCIe 3

    独立的数据写入AXI4-Stream/FIFO接口和数据读取AXI4-Stream/FIFO接口,非常适合于超高容量和超高性能的应用。此外,NVMe Host Controller IP支持RAID存储
    发表于 04-20 14:41

    高性能NVMe主机控制器,Xilinx FPGA NVMe Host Accelerator IP

    )读写、DMA读写和数据擦除功能,提供用户一个简单高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大
    发表于 04-10 22:55

    Xilinx FPGA NVMe主机控制器IP,高性能版本介绍应用

    高效的接口实现高性能存储解决方案。NVMe Host Controller IP DMA读写的顺序传输长度可以配置,最小是4K-Byte,最大是512K-Byte。顺序传输长度配置为
    发表于 03-09 13:56

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器~

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期推荐:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情
    发表于 03-01 19:02

    紫光同创新品开发板,盘古PGX系列PGX-MINI 4K开发板,板卡集成下载器

    /Logos2/Titan2/Compa全系列,即将重磅上市! 本期上新:盘古PGX系列PGX-MINI 4K开发板,基于紫光同创Compa系列低功耗CPLD。 产品详情 产品实拍
    发表于 03-01 15:16

    重磅新品】盘古100K开发板,紫光同创PG2L100H,Logos2系列,性能全面提升

    丰富,可以充分满足高速数据的缓存处理需求 海量的外围接口,充分满足多方位开发需求 三:核心板产品概述 盘古100K核心板是基于紫光同创Logos2系列(PG2L100H-FBB484)开发的全新国产高性能
    发表于 12-29 16:31

    对话芯动科技 | 助力云游戏 4K服务器显卡的探索与创新

    2021年芯动科技推出了基于IMGBXTGPUIP的风华1显卡。单块风华1显卡可在台式机和云
    的头像 发表于 11-17 08:27 458次阅读
    对话芯动科技 | 助力云游戏 <b class='flag-5'>4K</b><b class='flag-5'>级</b>服务器显卡的探索与创新

    紫光同创FPGA开发套件,高性能国产FPGA方案

    紫光同创FPGA开发套件,高性能国产FPGA方案,100%国产化,全系列产品,方案可定制,满足多方面需求
    发表于 11-16 17:25