0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型后训练时代,九章云极DataCanvas公司打造普惠算力服务新范式

爱云资讯 2024-09-14 16:00 次阅读

9月12日,由工业信息化新闻宣传中心承办的“算力服务高质量发展论坛”在2024中国国际服务贸易交易会期间召开,九章云极DataCanvas公司AI首席科学家缪旭受邀出席论坛,并发表“大模型后训练时代的算力服务思考”主旨演讲。

本次论坛以“以算凝力,融创未来”为主题,汇聚来自政、产、学、研界多位重量嘉宾,剖析算力产业最发展新趋势,分享算力基础设施建设实践经验,共同探讨算力服务高质量发展之道。

论坛上,缪旭先生在演讲中表示,随着基础模型面临的挑战不断升级与复杂化,大模型后训练模式正在崛起,成为应对上述挑战的关键路径。然而后训练模式的复杂性与高度定制化需求,对算力资源的精准调度、灵活配置和高效利用提出了前所未有的高标准挑战,企业亟需高质量、高效能、更经济、更好用的算力服务新范式

wKgZomblQqmAXikdAAfckuDBgSE217.png

九章云极DataCanvas公司AI首席科学家缪旭发表演讲

更自动、更高效、更精准大模型后训练模式崛起

缪旭指出,当前基础模型发展迅猛,拥有广泛的行业应用潜力,但也面临着提示词工程复杂度高、难以规避的幻觉问题、规划能力不足以及高昂的成本负担等核心挑战。缪旭表示,通过大模型后训练策略的补足,可以有效应对上述瓶颈。

大模型后训练的核心策略为,在大模型基础训练完成后,通过使用新的数据集或任务对模型进行再次训练,以提高模型的适应性和性能。这个过程通常包含提示词设计、模型微调、embedding优化及调度优化等多个环节。

具体而言,大模型后训练的过程如下:将复杂的业务逻辑梳理并封装成独立的、可管理的任务模块;随后针对每个单一任务模块实施精准的后训练微调,以增强其针对特定任务的适应性和性能。在完成模块集成重组后,结合业务系统及用户的互动反馈,持续进行自我学习和自我增强,最终实现模型性能自动、高效的持续提升。

wKgZomblQqqAW3QRAAOAM_pDtcc532.png

大模型后训练方法的补足

新标准、新需求、新模式普惠算力开启AI新时代

在大模型后训练的过程中,算力调度尤为关键,包括训练期的数据准备调度、微调任务编排,以及推理阶段的动态加载和异构算力管理。通过在调度过程中引入可训练的调度模型,在优化目标时增加效率和成本计算,结合线上、线下收集的数据持续优化调度模型,可以从软件层面有效提升算力调度能力,并降低计算成本,使算力应用更加贴近实际应用场景。

wKgZomblQqmARmvQAAJXCKyCe1A284.png

不同任务工作流的安排调度

在数据存储与处理的关键环节,大模型后训练模式对系统的安全性提出了更高要求,以确保算力资源能够无缝且安全地融入各类业务系统。依托业务系统与互联网的海量数据资源,以任务为驱动,大模型可以智能识别任务需求,自动收集并处理所需数据,生成高质量的微调数据集。此外,应用存算一体架以构可以有效降低数据传输的带宽消耗,提升数据处理的整体效率与安全性。

面对不同行业、不同场景的多样化大模型后训练需求,基于Alaya NeW高效的算力管理内核,九章云极DataCanvas公司提出国际首创的算力服务新范式,凭借统一性能基准、资源管理优化、方便估算成本收益、算力一体化等优势,提出了统一的算力服务计量单位“度”(DCU),并用其实现标准化的算力计量计费,让算力消费者轻松获得好用、经济、普惠的算力服务,实现算力资源0浪费。此外,通过提供完整的大模型+Agent开发工具链,Alaya NeW为各行业用户提供灵活的大模型和AI Agent定制能力,加速人工智能技术在各领域的深度融合与广泛应用。

作为国内领先的人工智能基础设施提供商,九章云极DataCanvas公司将继续坚持AI技术的自主创新,以领先的AI智算产品推动算力服务向更高质量、更高水平迈进,深度赋能千行百业的数智化转型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    28818

    浏览量

    266155
  • 算力
    +关注

    关注

    1

    文章

    823

    浏览量

    14565
  • 大模型
    +关注

    关注

    2

    文章

    2126

    浏览量

    1964
收藏 人收藏

    评论

    相关推荐

    筑基,九章DataCanvas公司闪耀2024年服贸会

    9月12日,2024年中国国际服务贸易交易会在北京隆重开幕,九章DataCanvas公司携A
    的头像 发表于 09-14 16:02 140次阅读
    智<b class='flag-5'>算</b>筑基,<b class='flag-5'>九章</b><b class='flag-5'>云</b><b class='flag-5'>极</b><b class='flag-5'>DataCanvas</b><b class='flag-5'>公司</b>闪耀2024年服贸会

    模型时代需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型,以及相关的稳定性和性能
    发表于 08-20 09:04

    【书籍评测活动NO.41】大模型时代的基础架构:大模型中心建设指南

    。 全书总计13。第1讲解AI与大模型时代对基础架构的需求;第2讲解软件程序与专用硬件的结合,涉及GPU并行运算库、机器学习程序的开
    发表于 08-16 18:33

    九章DataCanvas Alaya NeW智操作系统震撼亮相WAIC 2024

    模型、机器人、自动驾驶等关键领域,集中展示“人工智能+”创新应用的最新成果。九章
    的头像 发表于 07-05 14:53 416次阅读
    <b class='flag-5'>九章</b><b class='flag-5'>云</b><b class='flag-5'>极</b><b class='flag-5'>DataCanvas</b> Alaya NeW智<b class='flag-5'>算</b>操作系统震撼亮相WAIC 2024

    九章DataCanvas公司入选北京市通用人工智能产业创新伙伴计划

    作为北京市标杆人工智能企业,九章DataCanvas公司将持续发挥产业优势,继续坚持将自主创新的AI技术注入产业,以大
    的头像 发表于 07-03 15:41 227次阅读
    <b class='flag-5'>九章</b><b class='flag-5'>云</b><b class='flag-5'>极</b><b class='flag-5'>DataCanvas</b><b class='flag-5'>公司</b>入选北京市通用人工智能产业创新伙伴计划

    九章DataCanvas公司强势入选IDC生成式AI图谱7大核心板块

    九章DataCanvas公司把握既有前沿技术和服务经验,将AI软件以核心操作系统的形式深度融
    的头像 发表于 06-29 10:39 215次阅读
    <b class='flag-5'>九章</b><b class='flag-5'>云</b><b class='flag-5'>极</b><b class='flag-5'>DataCanvas</b><b class='flag-5'>公司</b>强势入选IDC生成式AI图谱7大核心板块

    摩尔线程和滴科技完成大模型训练与推理适配

    近日,摩尔线程与滴科技宣布了一项重要合作成果。摩尔线程的夸娥(KUAE)千卡智集群与滴科技的企业大模型Deepexi已完成训练及推理适
    的头像 发表于 05-30 10:14 403次阅读

    摩尔线程千卡智集群与滴企业大模型已完成训练及推理适配

    近日,摩尔线程与国内领先的数据智能服务商滴科技共同宣布,摩尔线程夸娥(KUAE)千卡智集群与滴企业大模型Deepexi已完成
    的头像 发表于 05-29 10:28 344次阅读
    摩尔线程千卡智<b class='flag-5'>算</b>集群与滴<b class='flag-5'>普</b>企业大<b class='flag-5'>模型</b>已完成<b class='flag-5'>训练</b>及推理适配

    解锁未来,华为耀服务器 X 实例引领柔性时代

    在数字化浪潮的推动下,计算已经成为企业发展的必然选择,但传统服务器常常束缚了企业的发展步伐。耀
    的头像 发表于 04-11 22:23 931次阅读
    解锁未来,华为<b class='flag-5'>云</b>耀<b class='flag-5'>云</b><b class='flag-5'>服务</b>器 X 实例引领柔性<b class='flag-5'>算</b><b class='flag-5'>力</b>新<b class='flag-5'>时代</b>

    深入了解浮点运算—CPU和GPU是如何计算的?

    随着国家大力发展数字经济,的提升和变得越来越重要。在数字化时代
    的头像 发表于 01-18 18:20 3136次阅读
    深入了解浮点运算—CPU和GPU<b class='flag-5'>算</b><b class='flag-5'>力</b>是如何计算的?

    AGI时代的奠基石:Agent++大模型是构建AI未来的三驾马车吗?

    AI Agent的训练离不开服务器作为一个强大的计算中心,为AI Agent提供基础,
    的头像 发表于 12-21 13:34 1049次阅读
    AGI<b class='flag-5'>时代</b>的奠基石:Agent+<b class='flag-5'>算</b><b class='flag-5'>力</b>+大<b class='flag-5'>模型</b>是构建AI未来的三驾马车吗?

    九章 数模和模数转换

    电子发烧友网站提供《第九章 数模和模数转换.ppt》资料免费下载
    发表于 11-18 09:14 0次下载
    第<b class='flag-5'>九章</b> 数模和模数转换

    GPT-4 Turbo 发布 | 大模型训练的新时代:超互联网的调度与调优

    训练模型的重要性日益凸显。随着大模型训练的流行,全球显卡和
    的头像 发表于 11-09 09:06 1326次阅读
    GPT-4 Turbo 发布 | 大<b class='flag-5'>模型</b><b class='flag-5'>训练</b>的新<b class='flag-5'>时代</b>:超<b class='flag-5'>算</b>互联网的调度与调优

    中国科学家成功研制“九章三号” 255个光子的量子计算原型机

           中国科学家再立新功,中国科学技术大学潘建伟、陆朝阳、刘乃乐等组成的研究团队与中国科学院上海微系统与信息技术研究所、国家并行计算机工程技术研究中心成功研制“九章三号”量子计算原型机
    的头像 发表于 10-11 17:06 1311次阅读

    九章完成3亿元融资,加速多模态大模型行业落地

    2023年6月,九章宣布产品体系升级,发布DataCanvas Alaya九章元识大模型、D
    的头像 发表于 10-09 10:10 852次阅读