0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

关于GPU历史的那些故事

Linux阅码场 来源:Linux阅码场 作者:Linux阅码场 2021-04-20 11:29 次阅读

历史学家克罗齐有言“一切历史都是当代史”。朱光潜先生注释说 “没有一个过去史真正是历史,如果它不引起现实的思索,打动现实的兴趣,和现实的心灵生活打成一片”,深以为然,是为题记。

上周末发了篇灌水贴GPU演义(History of the Modern Graphics Processor),本是为了完成每周更新任务,不想承蒙一些大佬捧场,帮转后,阅读量和新增关注都是节节高。诚惶诚恐,水平高低不论,唯有尽力提供自认为靠谱的内容,希望能够对初学者理解GPU有所帮助。

笔者学校毕业后第一份工作服务于S3 Graphics。上个世纪90年代初,还是2D图形时代,S3曾经称霸整个显示卡市场。进入3D时代,强敌环伺,不敌ATI, 3Dfx, Nvidia等,渐趋下风。于2000年被威盛收购,仍不见起色,终至一蹶不振,回天乏力。文中关于S3最后命运是这么描述的 “An added issue for S3 was that the cost of building the cards resulted in razor thin profits. The company needed high volume sales in a market dominated by two vendors. HTC were to acquire S3 in July 2012 for $300 million, a move originally seen as leverage in HTC’s and S3’s separate legal disputes with Apple”。这项交易的背景是HTC作为Android手机第一阵营,风头正劲,苹果为打击Android对手,对HTC发起专利诉讼。同时美国国际贸易委员会(International Trade Commission, ITC)也初步判定苹果侵犯了S3的专利权,HTC希望籍由并购S3获得与苹果谈判的筹码,而该交易中的焦点S3TC纹理压缩专利还是上个世纪S3 Savage产品时代开发的。一个曾经辉煌的公司努力挣扎后获得如此下场,不免让人一声叹息。

Imagination是我颇有好感的一个GPU设计公司。以前服务的公司曾取得过PowerVR SGX IP的授权,所以对其产品相对熟悉,个人觉得其TBDR(关于GPU绘制技术TBDR,TBR和IMR简单说明见文后注释)的设计浑然天成,整体无间,令人心生优美之感。Imagination的前身是Videologic, 从1992年开始图形方面的研究,也就是PowerVR项目,并于90年代中期研制出TBDR技术。

在日本市场,与NEC合作开发,大量供货世嘉的Dreamcast游戏机和Naomi街机系统。另外也与ST Micro携手进军PC图形市场。随着市场环境发生变化,Imagination也进行战略转移,放弃PC市场而专攻移动设备,聚焦IP授权。随着智能手机和平板电脑的兴起,Imagination的GPU IP授权业务获得长足发展。根据2012年JPR公布的移动GPU市场份额来看,Imagination遥遥领先。光鲜之下,危机也在逼近。首先高通

凭借骁龙Soc在移动处理器上的绝对优势,垂直整合,其Adreno GPU的份额一直居高不下。而ARM Mali也不是善茬,”ARM can offer both CPU and GPU designs to 3rd party licensees, this means ARM can offer the CPU and GPU designs together in a bundle, but perhaps more importantly it means they have the capability design the two in concert with each other.“。利用CPU和GPU的捆绑销售策略,更重要的是技术上协同设计,Mali在GPU IP市场不断摧城拔寨,侵占Imagination的生存领地。而同时Imagination又太过依靠苹果的出货量,也限制了与Android手机芯片客户的进一步合作,这些大客户纷纷开始转用Mali GPU。

到2014年,Imagination的市场直线下滑,已经被ARM反超。另外Imagination欣欣向荣之际,收购了MIPS公司,试图进入ARM主导的移动CPU市场,现在回头看不能不说是个败笔,MIPS已经被边缘化,在移动市场几乎没有份额。2017年4月,Imagination 迎来最惨痛时刻,苹果通知Imagination苹果产品未来15至24个月后将不再使用该公司的技术,随后,Imagination股价瞬间暴跌了近 69%,当天跌幅更是高达75%。要知道苹果是Imagination的最大客户,其支付给Imagination的许可证费用和专利费为其总收入总额的一半,而之前一年Imagination已出现历史上最大的亏损,需要裁员来削减成本,真可谓雪上加霜。目前Imagination已经被中国资本收购,但在中美贸易战的背景下,整合之路好像困难重重,不知道还有没有机会重拾旧山河。

另外一个有趣的话题AMD和移动GPU的故事。ATI在2006年收购了BitBoys,并宣布在欧洲成立设计中心。跟Imagination类似,BitBoys是一家提供移动GPU IP的公司,其之前的产品Glaze3D也采用TBR绘制技术。但接着ATI被AMD收购以后,这个被重命名为Imageon的移动设计部门,在2009年竟匪夷所思被6500万美元卖给高通。

依托骁龙Soc,Adreno(与Radeon字母顺序调整下,表示同源?) GPU不断锤炼,终于练成史上最强大的移动GPU,也成为了骁龙Soc核心技术和制胜法宝。在《History of the Modern Graphics Processor》中作者以BitBoys‘ exit and AMD’s blunder为题描述这段过程,并以“in a major lack of management foresight”来形容当时AMD管理层的短视。但最近几年,两大PC GPU巨头Nvidia和AMD也貌似开始重新拥抱TBR绘制技术,见如下有关Nvidia和AMD的报道。

这么看来,2019年三星获得AMD的GPU授权用于手机和平板移动市场就一点不奇怪了。兜兜转转,AMD再次杀入移动GPU领域,一旦成功,移动GPU的江湖保不定会再次掀起血雨腥风。

IMR,TBR和TBDR技术比较

TBR(Tile Based Rendering),把屏幕区域网格化,称为tile,一般是16x16或32x32像素大小,绘制的时候先收集一帧所有绘制命令的几何信息,顶点变换后,计算与每个tile的交集。然后再按tile,依次进行渲染。由于tile比较小,中间的的渲染过程包括深度测试都可以在片上内存发生,只有tile中最终可见像素才会输出到系统内存,极大的地减少与系统内存的交互,对性能,功耗水平都有提升。

TBDR(Tile Based Defferred Rendering),TBR并没有解决overdraw的问题,被遮挡的像素也会进入渲染过程,浪费GPU算力。所以TBDR更进一步,渲染之前引入HSR(Hidden Surface Removal,隐藏面消除)步骤,保证渲染过程只渲染可见像素,被遮挡像素会被提前剔除掉。

IMR(Immediate Mode Rendering), 简单,粗暴,直接,来什么,画什么。优点是可预测强,debug和profiling都比较容易。缺点是会有大量的内存带宽负载,同时与TBR类似,IMR没有完全解决overdraw的问题,会浪费一部分GPU算力,这些都会引起功耗水平增加。所以一般是对功耗,发热都不敏感的PC GPU会采用IMR技术。

原文标题:GPU历史之二三事

文章出处:【微信公众号:Linuxer】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4672

    浏览量

    128555
收藏 人收藏

    评论

    相关推荐

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】--了解算力芯片GPU

    本篇阅读学习第七、八章,了解GPU架构演进及CPGPU存储体系与线程管理 █从图形到计算的GPU架构演进 GPU图像计算发展 ●从三角形开始的几何阶段 在现代图形渲染中,三角形是最常用的基本图形元素
    发表于 11-03 12:55

    京准时钟科普:关于北斗卫星同步时钟的那些事?

    京准时钟科普:关于北斗卫星同步时钟的那些事?
    的头像 发表于 10-29 09:28 153次阅读
    京准时钟科普:<b class='flag-5'>关于</b>北斗卫星同步时钟的<b class='flag-5'>那些</b>事?

    【一文看懂】大白话解释“GPUGPU算力”

    随着大模型的兴起,“GPU算力”这个词正频繁出现在人工智能、游戏、图形设计等工作场景中,什么是GPU,它与CPU的区别是什么?以及到底什么是GPU算力?本篇文章主要从以下5个角度,让您全方位了解
    的头像 发表于 10-29 08:05 135次阅读
    【一文看懂】大白话解释“<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b>算力”

    常见GPU问题及解决方法

    GPU(图形处理单元)是计算机硬件的重要组成部分,负责处理图形和视频渲染任务。随着技术的发展,GPU在深度学习、游戏、视频编辑等领域扮演着越来越重要的角色。然而,在使用GPU的过程中,我们可能会遇到
    的头像 发表于 10-27 14:12 379次阅读

    Loran 和 LoRaWAN 的警示故事

    作者: Lisa Eitel 如果混淆了基于无线电的 LoRaWAN 和基于无线电的 Loran,后果不堪设想。这两种技术都是关于连接和通信技术如何成为胜出,而其他技术如何被无情抛弃的精彩故事。虽然
    的头像 发表于 10-02 16:49 243次阅读
    Loran 和 LoRaWAN 的警示<b class='flag-5'>故事</b>

    暴涨预警!NVIDIA GPU供应大跳水

    gpu
    jf_02331860
    发布于 :2024年07月26日 09:41:42

    AI训练,为什么需要GPU

    随着由ChatGPT引发的人工智能热潮,GPU成为了AI大模型训练平台的基石,甚至是决定性的算力底座。为什么GPU能力压CPU,成为炙手可热的主角呢?要回答这个问题,首先需要了解当前人工智能(AI
    的头像 发表于 04-24 08:05 1075次阅读
    AI训练,为什么需要<b class='flag-5'>GPU</b>?

    NVLink技术之GPUGPU的通信

    在多 GPU 系统内部,GPU 间通信的带宽通常在数百GB/s以上,PCIe总线的数据传输速率容易成为瓶颈,且PCIe链路接口的串并转换会产生较大延时,影响GPU并行计算的效率和性能。
    发表于 03-27 09:40 3439次阅读
    NVLink技术之<b class='flag-5'>GPU</b>与<b class='flag-5'>GPU</b>的通信

    FPGA在深度学习应用中或将取代GPU

    它们在高温下运行时需要及时冷却,而这并不总是可以实现的。要做到这点需要更多的电力、维护成本等。” 使用寿命也是一个问题。一般来说,GPU 的使用 寿命约为 2-5 年,这对那些每隔几年就换一次电脑
    发表于 03-21 15:19

    Jk触发器的故事

    Jk触发器的故事
    的头像 发表于 02-23 04:32 1104次阅读

    工厂维修电机的小故事

    近日,一名维修电工的帖子引起了广大网友的热议。这位电工讲述了他在工厂维修电机的小故事,他本可以在3分钟内解决故障,却故意修了4个小时。
    的头像 发表于 02-20 12:33 571次阅读

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战。GPU的架构创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。GPU
    的头像 发表于 12-21 08:28 825次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b>架构设计的挑战

    关于射频微机电系统开关的那些事儿

    关于射频微机电系统开关的那些事儿
    的头像 发表于 12-06 14:58 470次阅读
    <b class='flag-5'>关于</b>射频微机电系统开关的<b class='flag-5'>那些</b>事儿

    关于MLCC(多层陶瓷电容)替代Film Cap (薄膜电容)的那些

    关于MLCC(多层陶瓷电容)替代Film Cap (薄膜电容)的那些
    的头像 发表于 12-04 17:35 1828次阅读
    有<b class='flag-5'>关于</b>MLCC(多层陶瓷电容)替代Film Cap (薄膜电容)的<b class='flag-5'>那些</b>事

    什么是虚拟GPU?虚拟GPU的优势有哪些?

    虚拟 GPU,也称为 vGPU,是通过将数据中心 GPU 进行虚拟化,用户可在多个虚拟机中共享该 GPU
    的头像 发表于 11-10 09:48 1747次阅读
    什么是虚拟<b class='flag-5'>GPU</b>?虚拟<b class='flag-5'>GPU</b>的优势有哪些?