电子发烧友网报道(文/周凯扬)自研芯片在当下似乎已经成了一种潮流,无论是消费电子厂商、互联网公司还是汽车厂商,都在拿自研芯片做文章。作为时刻都在与计算打交道的云端,自然也参与其中,甚至是先进工艺自研芯片的主力军。
自研芯片能省下多少钱?
早在芯片产业有布局,或者以收购来掌握芯片设计实力的云服务厂商,几乎都选择了自研服务器芯片这条路线,比如亚马逊、谷歌、阿里巴巴等等。自研芯片的范围也从网络芯片到通用计算的CPU,再到用于AI计算的ASIC芯片。
亚马逊就靠着自研芯片省下了一大笔成本,这也是其他云服务厂商目前都没能复制的成功。首先自研芯片通过架构上的创新,为其定制化实例提供了更高的性能,比如Nitro芯片靠卸载任务可以多省出两个CPU内核;其次,对于某些特定的工作负载来说,自研芯片带来了更容易把握的战略控制以及硬件锁定;最后,自然也省去了找第三方fabless设计公司的成本。
考虑到云服务厂商在硬件投入上的规模,以及亚马逊作为全球第一大云服务厂商的体量,其中省下的成本还是相当庞大的。这也是亚马逊走自研芯片可行的原因,其他云服务厂商或许能通过自研把设计成本压下去,但制造成本绝对没法像亚马逊一样压这么低,这也是为何AWS过去能做到频繁降价。
AI时代下自研芯片优势有,但不多
亚马逊在收购后,接连推出了Trainium和Inferentia这两大训练和推理加速器,并将其集成到自己的云端实例中去,以优异的性能为客户提供高性价比的AI硬件方案。但这似乎并没有为其在最近的AI热潮中带来优势,反倒是微软凭借英伟达的GPU率先以ChatGPT开启了这场恶战,谷歌的Bard也紧随其后。
亚马逊则选择了与Hugging Face合作,作为其首选云供应商,用户可以借助AWS上的先进工具,比如SageMaker托管服务,以及Trainium和Inferentia硬件,去训练、微调和部署模型,从而为社区创造更加开放易用的AI。
但事实上是,这一合作激起的水花很快就被淹没在了如倾盆大雨般落地的AI应用中。而且对于Hugging Face来说,他们想要打造的是开放式的生成式AI模型,也就是说其他厂商也都能从中获益,也就是两家共同提到的机器学习民主化。
况且在部署上,早在与亚马逊合作之前,Hugging Face就已经在2022年与微软Azure达成合作,在Azure的ML终结点上部署Hugging Face的机器学习推理服务。所以这次合作即便充分利用了亚马逊的自研AI芯片,但给其带来的优势并不算大。无论是在性能还是在软件生态上,现有的自研芯片都存在如鲠在喉的地方,而这不仅局限于亚马逊这样的大厂,不少初创AI芯片公司也都或多或少面临这样的困境。
结语
其实自研芯片也并非真的毫无灵活性可言,比如亚马逊的Graviton和阿里的倚天710,虽说是自研芯片,但用到的毕竟还是Arm的Neoverse公版方案,还有不少第三方方案也是如此,比如英伟达的Grace、Ampere Computing的Altra等等。
这样一来其实开发灵活性依然很高,比如英伟达为了给Grace做铺垫,也对同类产品的软件栈提供了支持。比如英伟达的HPC SDK全面支持AWS的Graviton 3,也支持对SVE和NEON的自动矢量化。而英伟达推出的Arm HPC开发套件,也是由Ampere的Altra Q80-30 CPU与A100 GPU组合打造的,与Grace芯片共用同一套软件环境。
只不过在AI领域,这样的自研路线优势会更小一点,毕竟现在AI模型与算法发展迅速,自研GPU有着各种难以突破的专利壁垒,自研ASIC又存在迭代适应和软件生态移植的问题。而这对于云服务厂商这种为客户赋能更快产品上市速度的企业来说,或许在AI仍在快速演进的当下,GPU会是更优解,这也是云服务厂商即便选择了自研AI芯片,主打的却依然是GPU实例的原因。
自研芯片能省下多少钱?
早在芯片产业有布局,或者以收购来掌握芯片设计实力的云服务厂商,几乎都选择了自研服务器芯片这条路线,比如亚马逊、谷歌、阿里巴巴等等。自研芯片的范围也从网络芯片到通用计算的CPU,再到用于AI计算的ASIC芯片。
亚马逊就靠着自研芯片省下了一大笔成本,这也是其他云服务厂商目前都没能复制的成功。首先自研芯片通过架构上的创新,为其定制化实例提供了更高的性能,比如Nitro芯片靠卸载任务可以多省出两个CPU内核;其次,对于某些特定的工作负载来说,自研芯片带来了更容易把握的战略控制以及硬件锁定;最后,自然也省去了找第三方fabless设计公司的成本。
考虑到云服务厂商在硬件投入上的规模,以及亚马逊作为全球第一大云服务厂商的体量,其中省下的成本还是相当庞大的。这也是亚马逊走自研芯片可行的原因,其他云服务厂商或许能通过自研把设计成本压下去,但制造成本绝对没法像亚马逊一样压这么低,这也是为何AWS过去能做到频繁降价。
AI时代下自研芯片优势有,但不多
亚马逊在收购后,接连推出了Trainium和Inferentia这两大训练和推理加速器,并将其集成到自己的云端实例中去,以优异的性能为客户提供高性价比的AI硬件方案。但这似乎并没有为其在最近的AI热潮中带来优势,反倒是微软凭借英伟达的GPU率先以ChatGPT开启了这场恶战,谷歌的Bard也紧随其后。
亚马逊则选择了与Hugging Face合作,作为其首选云供应商,用户可以借助AWS上的先进工具,比如SageMaker托管服务,以及Trainium和Inferentia硬件,去训练、微调和部署模型,从而为社区创造更加开放易用的AI。
但事实上是,这一合作激起的水花很快就被淹没在了如倾盆大雨般落地的AI应用中。而且对于Hugging Face来说,他们想要打造的是开放式的生成式AI模型,也就是说其他厂商也都能从中获益,也就是两家共同提到的机器学习民主化。
况且在部署上,早在与亚马逊合作之前,Hugging Face就已经在2022年与微软Azure达成合作,在Azure的ML终结点上部署Hugging Face的机器学习推理服务。所以这次合作即便充分利用了亚马逊的自研AI芯片,但给其带来的优势并不算大。无论是在性能还是在软件生态上,现有的自研芯片都存在如鲠在喉的地方,而这不仅局限于亚马逊这样的大厂,不少初创AI芯片公司也都或多或少面临这样的困境。
结语
其实自研芯片也并非真的毫无灵活性可言,比如亚马逊的Graviton和阿里的倚天710,虽说是自研芯片,但用到的毕竟还是Arm的Neoverse公版方案,还有不少第三方方案也是如此,比如英伟达的Grace、Ampere Computing的Altra等等。
这样一来其实开发灵活性依然很高,比如英伟达为了给Grace做铺垫,也对同类产品的软件栈提供了支持。比如英伟达的HPC SDK全面支持AWS的Graviton 3,也支持对SVE和NEON的自动矢量化。而英伟达推出的Arm HPC开发套件,也是由Ampere的Altra Q80-30 CPU与A100 GPU组合打造的,与Grace芯片共用同一套软件环境。
只不过在AI领域,这样的自研路线优势会更小一点,毕竟现在AI模型与算法发展迅速,自研GPU有着各种难以突破的专利壁垒,自研ASIC又存在迭代适应和软件生态移植的问题。而这对于云服务厂商这种为客户赋能更快产品上市速度的企业来说,或许在AI仍在快速演进的当下,GPU会是更优解,这也是云服务厂商即便选择了自研AI芯片,主打的却依然是GPU实例的原因。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
服务器
+关注
关注
12文章
8933浏览量
85049
发布评论请先 登录
相关推荐
云服务器主要应用行业及优势
云服务器作为一种基于云计算技术的虚拟化计算资源,正逐渐成为众多行业数字化转型的重要支撑。它不仅提供了灵活的资源配置,还带来了诸多传统物理服务器难以比拟的优势。以下是云服务器的主要应用行
比亚迪最快于11月实现自研算法量产,推进智驾芯片自研进程
10月21日市场传出消息,比亚迪正计划整合其新技术院下的自研智能驾驶团队,目标是在今年11月实现自研智能驾驶算法的量产,并持续推进智能驾驶芯片
美国硅谷RAKsmart服务器的优势
RAKsmart是一家总部位于美国加州硅谷的全球领先的IDC服务提供商,以其高性能、高可靠性和定制化的服务器托管及云服务闻名。以下几点概述了RAKsmart服务器的主要
什么是AI服务器?AI服务器的优势是什么?
AI服务器是一种专门为人工智能应用设计的服务器,它采用异构形式的硬件架构,通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合来满足高吞吐量互联的需求,为自然语言处
硅谷物理服务器有哪些关键优势和特点
硅谷的物理服务器设施全球知名,为各类企业提供了卓越的IT基础设施支持。下面将逐一探讨硅谷物理服务器的关键优势和特点,rak小编为您整理发布硅谷物理服务器有哪些关键
IaaS云服务器的优势是什么?
云计算的基本定义是,使用部署在远程机器/系统上的计算资源(硬件/软件),并通过网络(私人/公共)作为服务交付给最终用户。 IaaS云计算(云服务器)的优势 1、节省成本。云服务器有助于
洛杉矶裸机云大宽带服务器的特性和优势
洛杉矶裸机云大宽带服务器是结合了物理服务器性能和云服务灵活性的高性能计算服务,为用户提供高效、安全的计算和存储能力。在了解如何使用洛杉矶裸机云大宽带
高通自研服务器芯片"SD1"揭晓,核心搭载Oryon
据国外科技媒体Android Authority透露,高通公司在公布骁龙X Elite / Plus芯片之后,内部正在研发代号为“SD1”、内置Oryon处理器的服务器芯片。
服务器远程不上服务器怎么办?服务器无法远程的原因是什么?
访问服务器
PS:检查端口是否能正常通信,可以通过命令tcping ip端口来确定,如果端口不通,检查防火墙远程端口策略有没有把现在
的远程端口加入策略之中,如果防火墙策略正常,那么检查服务器
发表于 02-27 16:21
linux服务器和windows服务器
,这在满足个性化需求和增强服务器安全
性上具有优势。
Linux服务器还具有出色的性能和稳定性。相比之下,Windows服务器在性能和稳定性方面稍有不足。特别是在处理高负载和
大数据量
发表于 02-22 15:46
选择云服务器租用托管有哪些优势?
云服务器租用托管服务好吗?选择云服务器租用托管有哪些优势?关于云服务器租用托管的话题RAKsmart小编今天来为您做详细的解答。
站群服务器的优势与挑战
站群服务器(也称为网站集群或站群架构)是一种通过将多个服务器协同工作来分担负载和提高可用性的解决方案。它在某些方面具有优势,但也面临一些挑战。 一、站群服务器的
评论