0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

天翼云,AI取经路上的逐梦人

脑极体 来源:脑极体 作者:脑极体 2024-09-05 16:06 次阅读

wKgaombZZmmAR0BSAAqS_cypi5k000.jpg

最近,国产第一部3A游戏大作《黑神话:悟空》问世,引发了全网热潮。游戏中的主角,重走西游之路,克服重重难关,向世界展现了中国文化的绝美与中国科技的自信。

而在现实当中,通往产业智能化的AI之路,同样可以说是一条取经之路。广大行业大模型开发者,也像“取经人”一样需要跨越重重难关,克服九九八十一难。那么,谁能来帮助他们攻克艰险,踏上灵山?

9月4日,天翼云在线上举办了息壤一体化智算服务平台大模型训推服务能力升级发布会。面向行业大模型的真实开发需求与应用场景,天翼云将2023年推出的智算服务平台进行了升级与革新,从而能够为大模型开发训练、行业模型微调提供全生命周期的工具链。

经过一年的精进,天翼云智算服务平台具有全流程覆盖、全方位支持、适配国内行业大模型AI开发需求的特性。旨在简化大模型从训练到部署整个流程的息壤一体化智算服务平台,已经可以在AI取经之路上,助力每一位行业大模型开发者“取经人”。

作为云服务国家队,天翼云所打造的息壤一体化智算服务平台训推服务能力的跃迁,正在帮助中国AI开发者踏上智能化之路,盎然西行,直面天命。

wKgaombZZm6AZN44AADnGjfKUhE018.jpg

就像西天取经之路一样,大模型开发者与千行百业的AI进阶之路,需要面临重重艰险。从AI大模型训练所需的数据准备,到模型训练、推理部署,每一个环节对于行业大模型开发者来说都蕴藏着不小的挑战。我们可以拣选具有代表性的几个“AI取经难关”进行讨论:

1.数据的黑风山。

AI大模型训练需要大量高质量数据,但对于行业大模型开发者来说,AI所需的优质数据获取难度其实是非常大的。在各行各业中,数据资源呈现出极其有限,且分布非常分散的特点。在收集到一定的数据之后,开发者还需要面对数据标注、数据清洗等一系列工作,开发成本极大。除此之外,行业大模型开发者还需要与行业内的专家紧密配合,从而将专业知识与AI算法进行紧密结合。这些行业数据相关的难题,构成了一座重重险阻的“黑风山”,成为阻挡开发者踏上AI取经路的第一道难关。

2.训练的狮驼岭。

在化解数据难题之后,开发者还需要面对AI大模型训练这个关键环节,而这个环节也是综合成本开销最大,且不确定性最高的一个。

对于行业大模型开发者来说,大模型训练面临着AI算力稀缺的核心问题,而在极高的AI算力成本之下,还需要应对传统算子运行效率差、训练集群故障多、故障定位与恢复时间漫长等重重困难。极高的训练难度和训练稳定性,成为困扰大模型智能化发展的高山。

3.模型的通天河。

对于众多行业领域来说,进行独立的大模型研发并非唯一选择,如果能够基于先进、成熟的大模型再结合自身行业所需进行“定制化”开发可取得事半功倍的效果。然而在这种需求下,行业模型开发者也面临着业界优秀的模型与模型应用实践难以获取,模型的本地化水平低等问题。模型的应用部署,限制住了大模型在行业智能化的“最后一公里”。

能不能找到一个方法,连续攻克这重重难关,给予行业大模型开发者一站式的帮助?

面对这个问题,能够一站式全流程覆盖的智算服务平台成为关键的答案。天翼云对息壤一体化智算服务平台训推服务能力的升级,就是希望瞄准真实的行业大模型开发,与开发者一起踏破AI取经的九九八十一难。

wKgaombZZnCAH-87AAEfWoQop-A315.jpg

西天取经需要一步步走,一关关过。对行业大模型开发的赋能,也需要了解每个环节行业大模型开发者真正面对的挑战,给出具有突破性的解决方案。

息壤一体化智算服务平台训推服务能力升级的特点,就是洞察真实的行业AI大模型开发工作的诉求,针对每个环节都给出对应的解法。我们可以将天翼云息壤一体化智算服务平台训推服务能力的演进,分为多个层面进行理解。看看天翼云如何帮助AI路上的“取经人”,一步步踏碎AI难关,走上阳关大道。

1.筋斗云,翻越模型天堑。

智算服务平台对行业智能化的赋能,首先需要提供完善、优质的大模型。天翼云在息壤一体化智算服务平台打造的大模型库,拥有国内领先的丰富大模型。其中包含Llama系列、Qwen系列、智谱系列、书生浦语系列等众多主流大模型,涵盖不同参数量级,供用户灵活选择。在原来29个模型的基础之上,本次新增上线重量级商业闭源大语言模型Baichuan4、主流开源大语言模型书生浦语2系列的InternLM2-Chat-7B和InternLM2-Chat-20B、图文多模态大模型Qwen-VL-Chat,以及Qwen2系列、Qwen1.5系列和Llama3系列的诸多模型。在这样的大模型阵容下,各行业可以轻松调用到符合自身需求的大模型,快速实现大模型到行业场景的孵化。

2.七十二变,化身数据万千。

在困扰行业大模型开发者的数据工作中,息壤一体化智算服务平台内置了专业的大模型数据集。中国电信在数据发展上开展的算数融合工程,首批推出超120万对文本和语义识别类通用大模型训练所必需的问答对数据,主要面向客服问答场景,解决了大量中小型企业训练数据不足的难题。

尤其需要注意的是,息壤一体化智算服务平台内置的数据集,在数据来源上经过了严格的审核,可以确保数据的准确性与真实性,并且通过多维度的数据验证,确保了数据集的完整性与一致性。行业大模型开发者可以获得高质量的数据支持,并且在该平台中直接将数据应用到训练、推理任务中。化身千万的数据集,就像齐天大圣的七十二变,可以带来堪称神奇的大模型训练效果。

3.金箍棒,打出最强训练。

面对开发者在大模型训练中的系列痛点, 天翼云在北京、上海建成两个万卡规模的公共智算中心,并在其资源池上搭载了息壤一体化智算服务平台,使其成为国内首个单集群万卡国产化全功能预训练云服务平台,可支持目前业内最大参数规模开源单体稠密模型Llama3 405B在内的大模型训练。训练测试结果显示,Llama3 405B模型集群有效计算效率MFU在国产化万卡规模情况下达到43%,达到业界领先水平。

息壤一体化智算服务平台具有全链路故障感知和恢复、全链路日志监控和断点续训等核心技术,能够实现1分钟检测、5分钟定位、1分钟内告警,本次平台升级还增加了网络I/O监控,为训练稳定性添加了保障。在断点续训方面,在Llama2-70b模型万卡规模测试场景下,在主机故障、NPU卡故障、进程退出故障、网络超时故障四大类具体场景下断点续训测试平均秒级故障检测,分钟级故障定位和自动化处理,分钟级训练恢复,其能力达到行业前沿水平。此次平台升级还新增了对芯片故障的优雅容错,能够做到无需重调度直接修复节点故障。目前,智算服务平台已经应用于大量用户的训推场景,如深圳市智算中心、人工智能实验室等。

4、火眼金睛,勘破场景应用。

面对不同行业、不同企业的多样化大模型应用场景,息壤一体化智算服务平台做了深度的洞察,就像点亮了“火眼金睛”,看到不同行业与企业对大模型的真实期待。

无论是具备深厚专业背景的行业客户,还是对大模型推训能力有严格要求的大模型厂商,都可以通过息壤一体化智算服务平台获得准确的支持,可通过直接调用预置的大模型服务,使得开发者能够轻松地将先进的AI技术集成到自己的业务中。

如今,AI取经之路上行者不绝,息壤一体化智算服务平台训推服务能力也为诸多“取经人”提供了深层次的帮助。

比如说,中医与大模型的结合,是近段时期的产业热点话题。中国中医科学院中医药信息研究所与天翼云合作,共同探索AI+中医药应用创新。在中医垂类大模型的微调、应用发布平台等环节中,天翼云提供的息壤一体化智算服务平台为中医药信息研究所提供了多样化的算法支持与模型优化工具,帮助大模型能够更好地挖掘中医药数据的潜在价值,实现中医瑰宝与AI技术的融合发展。

这些真实的大模型落地场景,证明了息壤一体化智算服务平台为行业智能化带来的有力推助。作为国家云的天翼云,正在通过智算服务踏碎AI难关,助力行业大模型开发顺利西行。

wKgaombZZnWAJiiJAAKul3CMSrM815.jpg

让每一位“AI取经人”都找到契合的产业助力,离不开围绕智算平台的生态建设。基于平台能力,天翼云联合伙伴上线了魔乐(Modelers.cn)开发者社区。

魔乐开发者社区真实贴合了中国的产业智能化环境,以及中国AI开发者的需求。就像《黑神话:悟空》展示的中国文化底蕴那样,天翼云承载国家云之责,不断加速构建满足AI产业发展所需的智算社区。具体而言,社区具有三大特色:

1.极致易用的工具链。

魔乐开发者社区能够提供高易用性的API,快速实现开发者和研究人员的创意,并且支持千款大模型一键式离线复现,使能开发者快速搭建开发环境,构建AI应用。

2.中文优质AI资源。

魔乐开发者社区已经拥有超过1000个大模型,构建了5大专区,能够为开发者提供通义千问、chatGLM、百川、书生系列、星辰Telechat等主流中文大模型资源。

3.国产化算力使能。

面对国产化AI算力需求的发展,魔乐开发者社区还构建了体验空间,提供限时免费的国产化算力资源,支持MindSpeed、Accelerator等加速库,应对大模型时代分布式训练的挑战,显著提升大模型训练效率。

面向着数据、训练、推理的重重AI难关,天翼云选择步步前行,关关踏破。

经过不断的精进升级,天翼云智算服务平台已经在技术能力、资源积累、生态构建等方面展露出了极高的产业化水准。伴随各个领域的行业大模型开发者对智算服务平台的深度应用,产业智能化的路途正在变得愈发顺遂,前途更加光明。

踏智能路,选国家云。随着天翼云的息壤一体化智算服务平台训推服务能力的不断升级完善,会让每一位行业大模型开发者在AI世界中,都成为自己故事中的“取经人”。

wKgZombZZnaAfXa_AAERChVImSM283.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    31493

    浏览量

    270128
  • AI算力
    +关注

    关注

    0

    文章

    74

    浏览量

    8822
  • 大模型
    +关注

    关注

    2

    文章

    2544

    浏览量

    3076
收藏 人收藏

    评论

    相关推荐

    紫光国芯与完成兼容互认证

    近日,紫光国芯全国产服务器内存模组SCC32GP12C2F1C-32AA与CTyunOS系统V2.0完成了产品兼容性认证,取得互认证明。
    的头像 发表于 01-06 16:55 260次阅读

    息壤商用落地,智能生花

    “人工智能+”时代,展开新蓝图
    的头像 发表于 12-10 09:22 2616次阅读
    息壤商用落地,<b class='flag-5'>天</b><b class='flag-5'>翼</b><b class='flag-5'>云</b>智能生花

    高压放大器在水下扑软体机器研究中的应用

    实验名称:水下扑软体机器的实验平台搭建 实验目的: 良好的运动性能是水下软体机器的基本功能要求。而实验是检验设计是否合理、实验样机是否达到功能要求的重要手段。为了验证设计的可行性,通过对水下扑
    的头像 发表于 12-04 13:51 158次阅读
    高压放大器在水下扑<b class='flag-5'>翼</b>软体机器<b class='flag-5'>人</b>研究中的应用

    天地与腾讯携手成立联合创新实验室

    近日,创天地发布公告,宣布其中国综合联属主体深圳市创天地科技有限公司与腾讯计算(北京)有限责任公司(简称“腾讯”)正式订立战略合作协议。此次合作标志着双方在游戏
    的头像 发表于 11-21 13:58 445次阅读

    弹性负载均衡介绍

    采用负载均衡策略,将请求分发至多台服务器上进行处理。负载均衡在现代IT架构中扮演着至关重要的角色,尤其是在大型分布式系统和计算环境中。
    的头像 发表于 10-25 16:20 700次阅读
    <b class='flag-5'>天</b><b class='flag-5'>翼</b><b class='flag-5'>云</b>弹性负载均衡介绍

    物通博联工业智能网关实现数据采集到物联网平台

    与生产管理水平。 对此,物通博联提供工业智能网关实现设备数据采集到物联网平台的解决方案,实现设备运行状态、生产参数的采集、传输、处理和存储等全流程数据闭环,为企业生产经营赋能,加速像智造迈进。 配置操作 一
    的头像 发表于 09-26 14:45 439次阅读
    物通博联工业智能网关实现数据采集到<b class='flag-5'>天</b><b class='flag-5'>翼</b>物联网平台

    DTCC2024前瞻:数据库专家共话TeleDB发展蓝图

    数据库是IT基础设施领域重要的组成部分,紧跟数据库行业技术方向与创新趋势,强化核心技术的自研实力,助力企业释放数据价值。在8月22日-24日的第15届中国数据库技术大会(DTCC2024)上
    的头像 发表于 08-19 14:53 411次阅读
    DTCC2024前瞻:<b class='flag-5'>天</b><b class='flag-5'>翼</b><b class='flag-5'>云</b>数据库专家共话TeleDB发展蓝图

    AI上线,字节跳动挑战Sora等AI创作平台

    字节跳动近期动作频频,其剪映团队精心研发的“即AI”移动版已正式登陆苹果App Store,标志着字节在AI创作领域的又一重要布局。即AI
    的头像 发表于 08-07 16:47 665次阅读

    如何冲破大模型时代的算力关卡?给出答案

    越过了向智能发展的拐点,开启新一轮智算征程
    的头像 发表于 07-18 09:13 2077次阅读
    如何冲破大模型时代的算力关卡?<b class='flag-5'>天</b><b class='flag-5'>翼</b><b class='flag-5'>云</b>给出答案

    低空,中国电信再放大招

    从被列为国家战略性新兴产业,到无人机广泛应用于各行各业,再到5G、计算、AI等ICT技术取得长足进步,低空经济在多重利好因素驱动下正日益展现出巨大的发展潜力和广阔的市场前景。要想富,先修路。低空
    的头像 发表于 06-21 08:05 342次阅读
    <b class='flag-5'>逐</b><b class='flag-5'>梦</b>低空,中国电信再放大招

    发布智算平台能力体系

    在第七届数字中国建设峰会期间,2024智算生态大会于福州盛大召开。中国电信集团有限公司总经理助理、科技有限公司董事长、总经理胡志强亲临大会主论坛,并隆重发布了
    的头像 发表于 05-28 09:20 602次阅读

    AI师,大模型正在孵化下一个黄金职业

    AI电影造师这个领域,一切都将是新的
    的头像 发表于 05-28 09:20 1751次阅读
    <b class='flag-5'>AI</b>造<b class='flag-5'>梦</b>师,大模型正在孵化下一个黄金职业

    阿里巴巴投资际动力,深化智能机器布局

    近日,阿里巴巴集团对深圳际动力科技有限公司(简称:际动力)进行战略投资,此举再次体现了阿里巴巴在智能机器领域的坚定布局。
    的头像 发表于 05-22 11:52 858次阅读

    终端发布AI+终端新品:平板、AI学习机和FTTR-B等

    平板电脑:此款平板电脑搭载联发科八核处理器(未知型号),采用全金属机身,厚度为 7.65mm,重约 490g,配备 11 英寸 IPS 高清显示屏,分辨率高达 1920×1200。
    的头像 发表于 05-17 15:41 1153次阅读

    中兴通讯受邀助力天全球化布局

    中国电信网高峰论坛在巴塞罗那隆重举行,此次论坛汇聚了全球通信业的领袖和专家,共同探讨如何释放全球互连的数字潜力。论坛的亮点之一是的全球发布仪式,这标志着中国电信
    的头像 发表于 03-03 15:41 945次阅读