电子发烧友网报道(文/李弯弯)日前消息,据相关人士透露,甲骨文(Oracle)和微软(Microsoft)最近讨论了一项不同寻常的协议,如果任何一家公司为使用大规模AI的云客户提供的计算能力不足,双方将相互租用服务器。
这笔交易将帮助这两家互为竞争对手的云服务提供商满足市场对可运行AI软件的服务器日益增长的需求,这种需求已导致服务器短缺。
微软和甲骨文曾多次合作
微软和甲骨文虽然互为竞争对手,但却曾多次携手合作。2013年6月,微软与甲骨文宣布达成合作,将Java、甲骨文数据库以及其他甲骨文软件带到微软WindowsServerHyper-V和WindowsAzure云平台,这种合作为开发人员提供了极大的便利。
消费者可以在WindowsServerHyper-V和WindowsAzure上部署甲骨文软件,包括Java、甲骨文数据库、甲骨文WebLogicServer,甲骨文将提供完整支持。
作为合作的一部分,甲骨文将认证和支持自家软件在微软平台上的运行,并为WindowsAzure用户提供OracleLinux,微软也向WindowsAzure用户提供上述甲骨文软件。
甲骨文与微软的强强联合,Java开发人员和企业用户获益最大,甲骨文数据库与微软云计算平台的整合,使得他们可以直接将桌面上的传统软件迁移至云计算系统。
2019年6月,微软和甲骨文又宣布建立一个新的合作关系,两家公司将通过网络直连他们的云服务,以便用户可以在两者之间无缝地迁移其工作负载和数据。
微软和甲骨文发布的联合声明显示,企业用户将可以无缝地使用微软Azure的分析和人工智能等服务,以及甲骨文自主数据库等云服务。整体来说,双方为用户提供了一站式的服务,为用户提供经营整个企业的所有云服务和应用程序。
据分析,微软和甲骨文携手合作是为了应对共同的竞争压力。随着移动互联网快速发展,云计算市场重要性日益凸显。微软的AZure始终无法赶上亚马逊云服务AWS的步伐,甲骨文更是由于最初对云计算前景的估计失误而处境尴尬。
根据Synergy Research Group数据显示,亚马逊云服务以超过30%的市场占有率,成为全球云计算市场上的领跑者。微软Azure以大约15%的市场份额位列第二,紧随其后的是IBM Cloud以及谷歌Cloud。甲骨文(Oracle)这样的小型云计算服务商,更是在上述四大云计算巨头加强市场控制的压力下,业务增速有所放缓。两者携手合作对于双方来说都很有必要。
AI服务器需求快速增长
ChatGPT的出现掀起了全球AI大模型研究热潮,无论是训练还是推理,这都需要消耗大量的算力,尤其是训练阶段。以ChatGPT为例,根据OpenAI在2020年发表的论文,训练阶段算力需求与模型参数数量、训练数据集规模等有关,且为两者乘积的6倍:训练阶段算力需求=6×模型参数数量×训练集规模。
GPT-3模型参数约1750亿个,预训练数据量为45 TB,折合成训练集约为3000亿tokens。即训练阶段算力需求=6×1.75×1011×3×1011=3.15×1023 FLOPS=3.15×108 PFLOPS
依据谷歌论文,OpenAI公司训练GPT-3采用英伟达V100 GPU,有效算力比率为21.3%。GPT-3的实际算力需求应为1.48×109 PFLOPS(17117 PFLOPS-day)。
假设应用A100 640GB服务器进行训练,该服务器AI算力性能为5 PFLOPS,最大功率为6.5 kw,则根据测算,训练阶段需要服务器数量=训练阶段算力需求÷服务器AI算力性能=2.96×108台(同时工作1秒),即3423台服务器工作1日。
在ChatGPT及各种AI大模型的推进下,AI服务器市场需求呈现高速增长趋势。美国服务器供应商超微电脑在5月初的财报会议上表示,AI服务器业务正迎来创纪录暴涨。公司向主要客户交付新平台的速度加快,2023财年有望迎来强劲收尾。
不过也因为需求强劲,AI服务器硬件资源也面临短缺的问题,超微电脑就表示,AI服务器出货量可能会受到供应链瓶颈的限制。
事实上,今年3月微软公司就已经传出面临内部AI服务器硬件短缺的窘境。为此,微软不得不对硬件资源采取配额供应的方式,限制其他内部AI工具开发团队的使用量,从而确保基于GPT-4的新版必应聊天机器人和即将发布的新款Office工具获得足够的资源。
小结
可以看到,随着AI大模型的研究推进,算力需求与日俱增,AI服务器企业也迎来大幅增长。然而由于受到供应链,比如高算力GPU芯片等限制,AI服务器硬件资源仍然面临短缺。微软和甲骨文的再次携手合作,正是其应对当前困境的方式之一。
-
微软
+关注
关注
4文章
6590浏览量
104026 -
AI
+关注
关注
87文章
30734浏览量
268896
发布评论请先 登录
相关推荐
评论