0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

深度解读GPU在历史上的二三事

Linux阅码场 来源:Linux阅码场 作者:Linux阅码场 2021-04-20 11:31 次阅读

历史学家克罗齐有言“一切历史都是当代史”。朱光潜先生注释说 “没有一个过去史真正是历史,如果它不引起现实的思索,打动现实的兴趣,和现实的心灵生活打成一片”,深以为然,是为题记。

笔者学校毕业后第一份工作服务于S3 Graphics。上个世纪90年代初,还是2D图形时代,S3曾经称霸整个显示卡市场。进入3D时代,强敌环伺,不敌ATI, 3Dfx, Nvidia等,渐趋下风。于2000年被威盛收购,仍不见起色,终至一蹶不振,回天乏力。文中关于S3最后命运是这么描述的 “An added issue for S3 was that the cost of building the cards resulted in razor thin profits. The company needed high volume sales in a market dominated by two vendors. HTC were to acquire S3 in July 2012 for $300 million, a move originally seen as leverage in HTC’s and S3’s separate legal disputes with Apple”。

这项交易的背景是HTC作为Android手机第一阵营,风头正劲,苹果为打击Android对手,对HTC发起专利诉讼。同时美国国际贸易委员会(International Trade Commission, ITC)也初步判定苹果侵犯了S3的专利权,HTC希望籍由并购S3获得与苹果谈判的筹码,而该交易中的焦点S3TC纹理压缩专利还是上个世纪S3 Savage产品时代开发的。一个曾经辉煌的公司努力挣扎后获得如此下场,不免让人一声叹息。

Imagination是我颇有好感的一个GPU设计公司。以前服务的公司曾取得过PowerVR SGX IP的授权,所以对其产品相对熟悉,个人觉得其TBDR(关于GPU绘制技术TBDR,TBR和IMR简单说明见文后注释)的设计浑然天成,整体无间,令人心生优美之感。Imagination的前身是Videologic, 从1992年开始图形方面的研究,也就是PowerVR项目,并于90年代中期研制出TBDR技术。

在日本市场,与NEC合作开发,大量供货世嘉的Dreamcast游戏机和Naomi街机系统。另外也与ST Micro携手进军PC图形市场。随着市场环境发生变化,Imagination也进行战略转移,放弃PC市场而专攻移动设备,聚焦IP授权。随着智能手机和平板电脑的兴起,Imagination的GPU IP授权业务获得长足发展。根据2012年JPR公布的移动GPU市场份额来看,Imagination遥遥领先。光鲜之下,危机也在逼近。首先高通

cf74e5ce-a100-11eb-8b86-12bb97331649.png

凭借骁龙Soc在移动处理器上的绝对优势,垂直整合,其Adreno GPU的份额一直居高不下。而ARM Mali也不是善茬,”ARM can offer both CPU and GPU designs to 3rd party licensees, this means ARM can offer the CPU and GPU designs together in a bundle, but perhaps more importantly it means they have the capability design the two in concert with each other.“。

利用CPU和GPU的捆绑销售策略,更重要的是技术上协同设计,Mali在GPU IP市场不断摧城拔寨,侵占Imagination的生存领地。而同时Imagination又太过依靠苹果的出货量,也限制了与Android手机芯片客户的进一步合作,这些大客户纷纷开始转用Mali GPU。到2014年,Imagination的市场直线下滑,已经被ARM反超。另外Imagination欣欣向荣之际,收购了MIPS公司,试图进入ARM主导的移动CPU市场,现在回头看不能不说是个败笔,MIPS已经被边缘化,在移动市场几乎没有份额。

2017年4月,Imagination 迎来最惨痛时刻,苹果通知Imagination苹果产品未来15至24个月后将不再使用该公司的技术,随后,Imagination股价瞬间暴跌了近 69%,当天跌幅更是高达75%。要知道苹果是Imagination的最大客户,其支付给Imagination的许可证费用和专利费为其总收入总额的一半,而之前一年Imagination已出现历史上最大的亏损,需要裁员来削减成本,真可谓雪上加霜。目前Imagination已

cf83f8de-a100-11eb-8b86-12bb97331649.png

经被中国资本收购,但在中美贸易战的背景下,整合之路好像困难重重,不知道还有没有机会重拾旧山河。

另外一个有趣的话题AMD和移动GPU的故事。ATI在2006年收购了BitBoys,并宣布在欧洲成立设计中心。跟Imagination类似,BitBoys是一家提供移动GPU IP的公司,其之前的产品Glaze3D也采用TBR绘制技术。但接着ATI被AMD收购以后,这个被重命名为Imageon的移动设计部门,在2009年竟匪夷所思被6500万美元卖给高通。

依托骁龙Soc,Adreno(与Radeon字母顺序调整下,表示同源?) GPU不断锤炼,终于练成史上最强大的移动GPU,也成为了骁龙Soc核心技术和制胜法宝。在《History of the Modern Graphics Processor》中作者以BitBoys‘ exit and AMD’s blunder为题描述这段过程,并以“in a major lack of management foresight”来形容当时AMD管理层的短视。但最近几年,两大PC GPU巨头Nvidia和AMD也貌似开始重新拥抱TBR绘制技术,见如下有关Nvidia和AMD的报道。

cf8eade2-a100-11eb-8b86-12bb97331649.png

cfa5e2f0-a100-11eb-8b86-12bb97331649.png

这么看来,2019年三星获得AMD的GPU授权用于手机和平板移动市场就一点不奇怪了。兜兜转转,AMD再次杀入移动GPU领域,一旦成功,移动GPU的江湖保不定会再次掀起血雨腥风。

IMR,TBR和TBDR技术比较

TBR(Tile Based Rendering),把屏幕区域网格化,称为tile,一般是16x16或32x32像素大小,绘制的时候先收集一帧所有绘制命令的几何信息,顶点变换后,计算与每个tile的交集。然后再按tile,依次进行渲染。由于tile比较小,中间的的渲染过程包括深度测试都可以在片上内存发生,只有tile中最终可见像素才会输出到系统内存,极大的地减少与系统内存的交互,对性能,功耗水平都有提升。

TBDR(Tile Based Defferred Rendering),TBR并没有解决overdraw的问题,被遮挡的像素也会进入渲染过程,浪费GPU算力。所以TBDR更进一步,渲染之前引入HSR(Hidden Surface Removal,隐藏面消除)步骤,保证渲染过程只渲染可见像素,被遮挡像素会被提前剔除掉。

IMR(Immediate Mode Rendering), 简单,粗暴,直接,来什么,画什么。优点是可预测强,debug和profiling都比较容易。缺点是会有大量的内存带宽负载,同时与TBR类似,IMR没有完全解决overdraw的问题,会浪费一部分GPU算力,这些都会引起功耗水平增加。所以一般是对功耗,发热都不敏感的PC GPU会采用IMR技术。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5419

    浏览量

    133793
  • 三星电子
    +关注

    关注

    34

    文章

    15845

    浏览量

    180855
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4672

    浏览量

    128555
  • IMRT
    +关注

    关注

    0

    文章

    3

    浏览量

    9072

原文标题:GPU历史之二三事

文章出处:【微信号:LinuxDev,微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    GPU深度学习应用案例

    GPU深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是深度学习的核心应用领域之一,
    的头像 发表于 10-27 11:13 275次阅读

    深度学习GPU加速效果如何

    图形处理器(GPU)凭借其强大的并行计算能力,成为加速深度学习任务的理想选择。
    的头像 发表于 10-17 10:07 135次阅读

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--全书概览

    GPU 中的应用历史 第9章 张量处理器设计 9.1 张量的定义 9.2 脉动阵列计算单元 9.3 Volta 架构引入张量核心 9.4 华为异腾Ascend910NPU芯片 第 10 章
    发表于 10-15 22:08

    今年苹果营收预计突破4000亿美元大关,创历史新高

    根据最新外媒报道及市场研究机构的深度分析,苹果公司今年有望迎来其历史上具有里程碑意义的一年——营收预计首次超过4000亿美元。这一壮举不仅彰显了苹果在全球科技行业的持续领导地位,也反映了其硬件与服务业务双轮驱动的强劲增长动力。
    的头像 发表于 08-30 15:02 594次阅读

    墙边的英雄--关于插座的二三

    伙伴。然而,虽然插座如此重要,它的设计、功能以及安全性却常常被人们忽视。在这里我们将深入探讨插座的历史,它是如何从一个简单的电力接入设备发展成为今天这样一个集安全
    的头像 发表于 08-11 08:14 607次阅读
    墙边的英雄--关于插座的<b class='flag-5'>二三</b><b class='flag-5'>事</b>

    深度解读 VCXO VG7050CDN:可变晶体振荡器的卓越之选

    深度解读 VCXO VG7050CDN:可变晶体振荡器的卓越之选
    的头像 发表于 07-24 10:58 306次阅读

    新手小白怎么学GPU云服务器跑深度学习?

    新手小白想用GPU云服务器跑深度学习应该怎么做? 用个人主机通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不动,如何实现更经济便捷的实现GPU云服务器深度学习?
    发表于 06-11 17:09

    AI训练,为什么需要GPU

    ,ArtificialIntelligence)的主要技术。人工智能与深度学习人工智能是一个历史非常长的学科。自上世纪50年代以来,在多个技术方向上进行过探索,也经
    的头像 发表于 04-24 08:05 1075次阅读
    AI训练,为什么需要<b class='flag-5'>GPU</b>?

    FPGA在深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型时面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    AI for Science,开启智能科学时代

    当人工智能遇上科研,让历史上的科学家都闻之落泪……
    的头像 发表于 02-02 09:36 2483次阅读
    AI for Science,开启智能科学时代

    iOS18将迎苹果史上最大革新

    苹果公司正在积极筹备的iOS 18操作系统可能是iPhone历史上最大的一次更新。虽然目前关于iOS 18的具体信息仍然相对较少,但已经有两项重大改进被确认。
    的头像 发表于 01-30 16:55 1455次阅读

    二三四线式接近开关如何接线?

    二三四线式接近开关如何接线? 二三四线式接近开关作为一种常用的传感器,广泛应用于自动控制和检测领域。正确的接线方法是保证其正常工作的基础。本文将详细介绍二三四线式接近开关的接线步骤和注意事项,以帮助
    的头像 发表于 12-20 11:17 839次阅读

    深度解读英特尔拆分FPGA业务的原因

    不了解FPGA的朋友可能没听说过PSG,它是英特尔旗下的一个业务部门,前身是全球第二大FPGA公司Altera,也是我的前司。结果,就在我加入后不久啊,Altera就在2015年被英特尔花167亿美元收购了,这也是英特尔历史上最大的收购案,当时也是震惊了整个芯片行业。
    发表于 12-13 10:34 818次阅读

    GPU深度学习中的应用与优势

    人工智能的飞速发展,深度学习作为其重要分支,正在推动着诸多领域的创新。在这个过程中,GPU扮演着不可或缺的角色。就像超级英雄电影中的主角一样,GPU深度学习中拥有举足轻重的地位。那么
    的头像 发表于 12-06 08:27 1184次阅读
    <b class='flag-5'>GPU</b>在<b class='flag-5'>深度</b>学习中的应用与优势

    争分夺秒:人工智能速度下的战争

    随着武装冲突时间的缩短,会产生哪些技术影响?过去可能耗时数年的战争可能在数月甚至数周内就能决定胜负。历时数周的行动必须在数天或数小时内完成。而指挥官们在做出决定之前,在历史上可能有充足的时间,但现在却不得不在几秒钟内做出决定。
    的头像 发表于 11-20 17:47 713次阅读