0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

也想造个ChatGPT?看你的算力跟得上吗?

戴尔企业级解决方案 来源:戴尔企业级解决方案 2023-01-08 15:29 次阅读

近年来人工智能领域的发展可谓是日新月异主要突出个“大”“快”“准”

参数和算力规模越来越大、新模型的出现和迭代越来越快、预测结果越来越准。

回看刚刚过去的2022,好像每隔几个月就会有公司发布一个新的AI模型,让有史以来最大的AI模型这一称号反复易手,全球各大顶尖的科技公司在此展开“军备竞赛”并乐此不疲。

当然,模型的“大”也带来了性能的“强”,最近大火的ChatGPT已经能为你写出代码,甚至改变现有的搜索格局。就比如微软正在将ChatGPT加入到Bing中来对抗Google,可谓是火药味满满。

人工智能赛道的激烈交火

自从2018年谷歌推出3亿模型参数的BERT模型,大规模预训练模型逐渐进入人们的视野。随后OpenAI推出了15亿参数的GPT-2,这场军备竞赛便已开始了“低烈度”交火。

到了2020年,GPT-3的出现将这场军备竞赛直接拉升到千亿级别。现在,万亿级别的Switch Transformer模型已经出现。在未来这场“军备竞赛”也许会更加激烈。

人工智能模型已然成长为一个“巨无霸”,就目前来看,大型语言模型的参数量依然保持增长势头,你几乎看不到低于1亿参数量的AI模型。

当然,这并不代表小模型是没有潜力或是不好的。相较于大型AI模型,小型模型的投入更低,落地更加简单,能够更快更好的解决现实问题。只不过,大模型的泛用性及其强大的性能代表了未来人工智能发展的方向,因此也就更加容易被我们注意到。

“大”和“强”的背后是更多的挑战

然而,强悍的性能与巨大的规模背后则是无数的资本投入,这些日渐庞大的AI模型也为现有的AI基础设施和开发流程带来了更多的挑战。

众所周知,一个强大的AI模型从诞生到商业化落地,需要大量的数据投喂、精巧的算法优化以及强大的算力支持。

现如今大模型的权重可达100GB以上,但我们的开发工具却滞后于规模,使用起来十分费力,部署时往往要等上好几小时,编译时间长达两分钟,降低了AI工程师的工作效率,研发与迭代速度也会受到影响。

同时,训练数据量也在以惊人的速度上涨,高质量的数据往往能加快训练速度,而糟糕的数据可能会让算法的效用大大降低。根据Scale AI的《人工智能准备情况》调查发现,数据质量成为获取训练数据时面临的最大挑战。

而随着逐渐变大的体量,其参数量和算力要求给整个团队和工程环节带来极大的压力。

戴尔科技集团助力AI持续前行

算力、算法、数据作为人工智能的三大要素缺一不可,强大的基础设施总是能够让您更好地把握成功的机遇。

戴尔科技集团作为全球领先的数字化解决方案供应商,在AI和HPC领域深耕多年,致力于将算力转化为业务创新能力,以科技赋能各行各业。

戴尔PowerEdge XE8545拥有强大的GPU加速器优化性能,专为高性能AI计算设计,使用业界领先的NVLink GPU直连设计,帮助您突破数据流和计算能力的界限,应对当下严苛的算力需求。

面向未来,戴尔科技集团用于AI的下一代PowerEdge产品组合也即将到来:PowerEdge XE9680、PowerEdge XE9640和PowerEdge XE8640,它们均为提供更高性能和更强大的计算结果而构建,帮助企业从容应对未来AI发展。

fe6643a4-8e80-11ed-bfe3-dac502259ad0.jpg

目前,非结构化数据用于AI的占比持续扩大,面对日益庞大且复杂的训练数据量,高效的存储系统对于工程师团队的帮助则愈发显著。在这方面,戴尔PowerScale横向扩展NAS存储能够进一步消除I/O瓶颈,加快您的AI模型训练和验证速度,释放非结构化数据的价值。

无论是大模型的军备竞赛,还是小模型的实用为先,AI正在以前所未有的速度持续发展,每一次突破都将为行业带来颠覆性的变革。

戴尔科技集团将以全面的解决方案,助力越来越多的AI落地,持续以科技推动人工智能行业的发展。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46840

    浏览量

    237520
  • 模型
    +关注

    关注

    1

    文章

    3162

    浏览量

    48709
  • ChatGPT
    +关注

    关注

    29

    文章

    1548

    浏览量

    7480

原文标题:也想造个ChatGPT?看你的算力跟得上吗?

文章出处:【微信号:戴尔企业级解决方案,微信公众号:戴尔企业级解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基础篇:从零开始了解

    即计算能力(Computing Power),狭义上指对数字问题的运算能力,而广义上指对输入信息处理后实现结果输出的一种能力。虽然处理的内容不同,但处理过程的能力都可抽象为。比
    的头像 发表于 11-15 14:22 319次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基础篇:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    浅析三大之异同

    随着一年多前ChatGPT的出现引爆人工智能(AI)浪潮,支撑大模型背后的“”概念突然闯进我们的视野,成为科技圈炙手可热的新词,引领着最新潮流。作为数字经济时代新生产,也许不少人
    的头像 发表于 08-30 12:56 630次阅读
    浅析三大<b class='flag-5'>算</b><b class='flag-5'>力</b>之异同

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    基础设施的风险与挑战

    编者按网络有一美好的愿景,就是希望网,能像电力和电网一样:
    的头像 发表于 06-13 08:27 499次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施的风险与挑战

    AI智中心算服务商探索智完成A轮融资

    近日,领先的AI智中心算服务商探索智宣布成功完成A轮融资。本轮融资由无锡云林产业发展投资基金领投,旨在为公司提供强大的资金支持,助力其业务的进一步拓展和升级。
    的头像 发表于 05-30 09:33 417次阅读

    急!OpenAI再推王炸GPT-4o,跟得上吗?

    近期,OpenAI 举办春季发布会,正式发布了 GPT-4o,掀起了全球AI大模型领域的新热潮。 仅相隔一天,谷歌在其I/O开发者大会上发布「AI 全家桶」反击,展示了其AI助手Astra和旗舰大模型Gemini。 5月16日,小米公司宣布,小米大语言模型MiLM正式通过大模型备案,小米大模型将逐步应用于小米汽车、手机、智能家居等产品中。 在大模型如火如荼之际,AI技术对服务器性能需求不断上升,处理高强度计算任务需要更强大的硬件支持。而高强度计算往往带来功耗瓶
    的头像 发表于 05-17 17:34 391次阅读

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    究竟是啥?

    计算系统的越高,处理数据的速度越快,能完成的任务越复杂。
    的头像 发表于 04-19 10:54 654次阅读

    十问:超,通存比

    邬贺铨指出,现有测算方法难以精准衡量。国内企业服务器的出货量并不等于国内市场的使用量,而且进口国外的服务器未统计在内;服务器出货量不等于上架量,更不等于已经加电使用量。通常服务器集群的
    的头像 发表于 04-13 11:40 4221次阅读

    智能规模超通用,大模型对智能提出高要求

    电子发烧友网报道(文/李弯弯)是设备通过处理数据,实现特定结果输出的计算能力,常用FLOPS作为计量单位。FLOPS是Floating-point Operations Per Second
    的头像 发表于 02-06 00:08 6089次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    ChatGPT芯片如何做输出

    卡的核心当然还是计算芯片,会搭配大容量高带宽的内存、缓存,以及搭载CPU用于调度,为了帮助数据传输,便会使用高速通道,这便是PCIe(高速串行计算机扩展总线标准)在系统中的作用:提供总线通道。
    发表于 01-11 10:01 451次阅读
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片如何做<b class='flag-5'>算</b><b class='flag-5'>力</b>输出

    芯科技,解密ChatGPT畅聊之芯片

    在今日飞速发展的科技浪潮中,OpenAI的ChatGPT如一颗璀璨明星,引领着智能对话的新潮流。ChatGPT不仅是一款聊天机器人程序,它背后的驱动力是一庞大而复杂的
    的头像 发表于 12-27 07:45 936次阅读
    芯科技,解密<b class='flag-5'>ChatGPT</b>畅聊之<b class='flag-5'>算</b><b class='flag-5'>力</b>芯片

    网络发展的三阶段分别是

    网络是指通过网络将分布在不同地点的计算机资源连接起来,共同完成大规模的计算任务。随着科技的不断发展,网络经历了三
    的头像 发表于 12-19 16:21 1047次阅读

    平台赋能,共建,智贯东西 “2023 英特尔大会暨东数西大会”成功举办

    近日,以“共建,智贯东西”为主题的2023 英特尔大会暨东数西大会在丽江成功举办。大会由英特尔主办,齐聚
    的头像 发表于 12-08 19:15 784次阅读
    平台赋能,<b class='flag-5'>算</b><b class='flag-5'>力</b>共建,智贯东西 “2023 英特尔<b class='flag-5'>算</b><b class='flag-5'>力</b>大会暨东数西<b class='flag-5'>算</b>大会”成功举办