0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

全域 Serverless+AI,华为云加速大模型应用开发

jf_81200783 来源:jf_81200783 作者:jf_81200783 2023-10-25 21:30 次阅读

日前,华为全联接大会 2023 在上海召开。华为云 CTO 张宇昕在大会上发布了基于 Serverless 技术的大模型应用开发框架,框架以面向 AI 领域全新升级的 FunctionGraph3.0 为核心,将 BaaSforAI后端和开放平台快速无缝集成,助力企业轻松商用 AI 应用。

wKgaomU5GICAErLYAABs25w9N_E63.jpeg

在“全域 Serverless+AI加速应用创新”专题演讲上,华为云首席产品官方国伟、华为 2012 实验室中软分布式与并行软件实验室主任谭焜,分享了 Serverless 和 AI 如何结合的前沿理念和实践,深度解析华为云在 Serverless 领域核心产品及基于元戎架构构建的分布式内核能力,为开发者打造 ServerlessAI 极优体验,帮助企业加速应用创新;广联达科技股份有限公司首席业务专家/副总裁祁长福分享了在建筑行业,如何基于华为云 Serverless 产品 FunctionGraph 优化 AI 应用开发,提升交付效率。

全域 Serverless 为千行万业深度用云

带来新体验

方国伟介绍,在 AI 时代背景下,软件开发的方式由以代码为中心,走向以模型为中心,如何将 AI 大模型能力充分利用起来,是当下云厂商积极探索的事情。

wKgZomU5GIGAe8LxAAB47r4ny-434.jpeg

华为云首席产品官方国伟

企业研发人员在构建 AIGC 应用时更多关注开发部署门槛能否降低,更快的完成企业需求。运维人员要确保系统能够稳定运行,在业务量高峰时刻做到快速弹性,业务量小时节约成本,企业既能实现业务目标,又能保证系统可靠性高、成本较低。

为了更好的支撑 AIGC 应用,华为云提供了全域 Serverless 能力,推出了 CCEAutopilot、FunctionGraph、CAE 等 Serverless 产品,将一系列的 AI 原生技术构筑成后端服务,形成 BaaSforAI 能力,调用即可得。结合完善的工具链,帮忙企业快速构建应用。

wKgaomU5GIGAKs4BAAQs0Ki6_OA874.png

Serverless容器 CCEAutopilot、CCI 让用户无需关注底层资源,自动运维,帮助用户降低运维成本。

在 CloudBursting 场景,去哪儿网基于 CCI 打造了灵活上云新体验,完成业务 0 改造,实现 4000 实例/30s 的极致弹性。

FunctionGraph3.0 八大关键能力,

助力 AIGC 应用创新

全新升级的 FunctionGraph3.0,新增 Serverless 应用中心、独创 Snapshot 冷启动加速、预留实例智能推荐特性,配合异构资源虚拟化技术,实现 AIGC 应用低成本、低延迟,加上端到端的全链路压测和全栈可观测能力,助力 AIGC 应用快速开发,天级上线。

wKgZomU5GIKAaA_rAAOEIb3r2Wk412.png

杭州曼孚科技有限公司是行业领先的 AI 基础架构与数据智能平台服务商,基于 FunctionGraph 构建自动化 AI 训练平台,更细粒度的 GPU 算力供给加上按需全自动资源弹性,实现成本降低 40%。

华为云 Serverless 事件总线服务事件网格 EventGrid 能够支持统一事件中心、事件驱动引擎、开放与集成、降低开发成本四大典型场景,为企业提供中心化的事件集成、治理和驱动能力。

在车联网场景,某 Top 车企使用 EventGrid 构建 Serverless 化的事件驱动架构的同时,实现上下游异步解耦,便于扩展和避免单点故障;作为无码化对接的事件中心,避免云服务间点对点对接,减少 50%开发工作量以及数据高可靠 0 丢失和数据规则调整 0 变更。降低成本。

Serverless 应用托管 CAE 产品升级:支持应用 0 代码修改平迁上云,用户无需修改业务代码;支持 Web/微服务应用 Serverless 化,帮助企业降本增效,提升业务稳定性。

香港新世界旗下广州新合创科技有限公司,使用 CAE 全托管模式提升 50%效率;后续还会根据商场人流峰值设定定时伸缩,节省资源以降低成本。

BaaSforAI:华为云 BaaS 服务 DWS3.0提供 PayByResource 弹性模式和 PayByQuery 弹性模式,帮助企业实现后端服务 Serverless 化。

“华为云提供全域 Serverless 能力,让开发者 5 倍速开发行业大模型,支撑千行万业的 AI 应用开发。面向 AI 领域全新升级的 FunctionGraph3.0,真正实现大模型应用即开即关、即时响应,无限扩展。”

Serverless挺进AI,

强强联合加速 AI 应用创新

wKgaomU5GIKAMKUsAACLVd98qD821.jpeg

华为 2012 实验室中软分布式与并行软件实验室主任谭焜

基于自主创新元戎内核构建的 FunctionGraph3.0 如何保障 AI 应用开发部署低成本和响应低时延,谭焜做了深入的技术分享:

模型开发部署依赖昂贵的异构资源。传统的异构函数,CPU 和 XPU 资源绑定分配,单一推理函数包含 CPU 和 XPU 操作,操作 CPU 时 XPU 空闲,操作 XPU 时 CPU 空闲,资源利用率低。元戎独创的纯 XPU 异构函数,CPU 和 XPU 资源绑定解耦,用户可把不同类型资源的操作写成不同的函数,执行时分解到不同算力处理器上,无闲置资源。

wKgZomU5GIOAUA8LAADTeEfPNNs133.png

FunctionGraph 打造 ServerlessAI 最佳平台

在大模型推理场景,包括全量推理和增量推理两个阶段。全量推理阶段算力需求远高于增量推理阶段,增量推理阶段,耗时可能远长于全量推理阶段。针对这类场景,元戎可以做到全量推理和增量推理解耦,各自按需弹性扩缩,精确算力供给,真正按使用量计费,降低用户成本。

更快的应用响应速度意味着更好的用户体验。元戎自主创新的 FoldFormerAI 模型可在线持续预测用户业务负载,提前进行实例预热,达到 85%~95%准确率,大大降低了冷启动概率。无法被准确预测的流量,通过一系列优化措施加速冷启动。在用户模型下载阶段,基于内置的内存数据系统和 SSD 构建的分级高速缓存,实现系统内缓存模型文件,大幅缩短下载时间。计算时,模型按 Layer 分批加载,并根据用户 SLA 和模型推理时延历史数据构建最优 pipeline,降低参数加载和模型推理总时延,冷启动优化到秒级。

谭焜最后总结道:“基于元戎内核,FunctionGraph3.0 提供异构函数极速冷启动,细粒度异构资源管理和按需弹性扩缩,打造 ServerlessAI 极低成本和极致性能;依托华为云丰富的 BaaS 服务和全托管的开发环境,打造 ServerlessAI 极优体验。”

AI 赋能建筑行业数字化

广联达科技股份有限公司首席业务专家/副总裁祁长福发表 AI 赋能建筑行业数字化主题演讲。“广联达作为数字建筑平台服务商,立足建筑产业,围绕工程项目的全生命周期,为客户提供数字化解决方案,公司提出“数字建筑”理念,希望通过“数字建筑”系统、全面、深度地助力建筑产业转型升级。”

wKgaomU5GISADC66AAB-TphkY0k22.jpeg

广联达科技股份有限公司首席业务专家/副总裁祁长福

祁长福介绍,在技术方面,广联达通过大力研发 BIM和云计算、大数据、物联网、移动互联网、人工智能信息技术引领产业转型升级。

在 AI 领域,广联达围绕行业难点,围绕设计、成本、施工等重点领域,打造核心 AI 应用。应用设计采用 Serverless 理念,依托华为云 Serverless 服务构建解决方案,将 AI 模型以镜像方式部署在 FunctionGraph,对外提供通用 API,无需管理运维异构资源(GPU 等),模型实例随业务量全自动扩缩容,无请求时实例缩容到 0,低成本高可用运行。上层应用采用 FaaS+BaaS 的 Serverless 应用架构,集成模型推理接口,只需专注于业务逻辑代码,可函数级粒度并行开发,快速迭代应用。

华为云 FunctionGraph 技术极大的优化了 AI 应用的开发过程,让 AI 团队可以更关注业务实现,而无需关注底层技术细节。

“广联达以推动建筑行业数字化为己任,着力打造‘数字+连接+算法’的系统性数字化。围绕行业痛点,我们以智能化技术为基础,依托华为云 FunctionGraphSeverless 架构,打造建筑从业人员的 CoPilot,帮助行业人员提升作业效率,提高管理水平和决策质量。”

未来,华为云将持续落地全域 Serverless 产品,与华为 2012 实验室深度合作,以 FunctionGraph3.0 为核心,打造 ServerlessAI 极低成本和极致性能,充分满足大模型应用的敏捷要求,助力千行万业深度用云。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为云
    +关注

    关注

    3

    文章

    2703

    浏览量

    17640
  • 大模型
    +关注

    关注

    2

    文章

    2652

    浏览量

    3267
收藏 人收藏

    评论

    相关推荐

    NVIDIA推出加速物理AI开发的Cosmos世界基础模型

    经数百万小时的驾驶和机器人视频数据训练的先进模型,可用于普及物理 AI 开发,并以开放模型许可形式提供。
    的头像 发表于 01-09 11:05 311次阅读

    华为 Flexus X 实例部署安装 Jupyter Notebook,学习 AI,机器学习算法

    的,由于华为 Flexus X 实例做了很多底层的性能优化,依托创新的大模型支持和智能全域调度,X-Turbo 加速技术让常见应用的性能最
    的头像 发表于 01-02 13:43 173次阅读
    <b class='flag-5'>华为</b><b class='flag-5'>云</b> Flexus X 实例部署安装 Jupyter Notebook,学习 <b class='flag-5'>AI</b>,机器学习算法

    LG AI Research使用亚马逊科技开发AI模型 加快癌症诊断速度

    16日 /美通社/ -- 亚马逊科技在2024 re:Invent全球大会上宣布,韩国LG集团旗下人工智能研究中心LG AI Research基于全球领先的计算平台开发了新的病理基
    的头像 发表于 12-16 15:13 150次阅读
    LG <b class='flag-5'>AI</b> Research使用亚马逊<b class='flag-5'>云</b>科技<b class='flag-5'>开发</b><b class='flag-5'>AI</b><b class='flag-5'>模型</b> 加快癌症诊断速度

    华为徐峰:AI 赋能应用现代化,加速软件生产力跃升

    ,分享了智能化应用的行业实践,并发布了华为在应用开发、运行、运维、集成领域的智能化新产品能力。 在主题为“ AI 赋能应用现代化,加速软件
    的头像 发表于 10-14 09:45 589次阅读
    <b class='flag-5'>华为</b><b class='flag-5'>云</b>徐峰:<b class='flag-5'>AI</b> 赋能应用现代化,<b class='flag-5'>加速</b>软件生产力跃升

    华为全域 Serverless 8 月更新盘点

    【摘要】 近年来,华为持续构筑全域 Serverless 服务,推出了一系列竞争力领先的 Serve
    的头像 发表于 09-27 00:06 930次阅读
    <b class='flag-5'>华为</b><b class='flag-5'>云</b><b class='flag-5'>全域</b> <b class='flag-5'>Serverless</b> 8 月更新盘点

    华为盘古汽车大模型通过可信AI汽车大模型评估

    近日,国内科技界传来喜讯,华为盘古汽车大模型在信通院组织的可信AI汽车大模型首轮评估中脱颖而出,成功获得4+级证书,成为国内首批通过该评估
    的头像 发表于 07-15 17:34 899次阅读

    HDC 2024软通动力携手华为共启AI原生应用引擎全域生态合作

    华为开发者大会2024(HDC 2024)期间,华为开天aPaaS高峰论坛首发“AI原生应用引擎”。软通动力高级副总裁、数字基础设施与集成
    的头像 发表于 06-25 19:19 1380次阅读
    HDC 2024软通动力携手<b class='flag-5'>华为</b><b class='flag-5'>云</b>共启<b class='flag-5'>AI</b>原生应用引擎<b class='flag-5'>全域</b>生态合作

    华为昇腾AI服务可适配100多个大模型

    在近日举办的华为开发者大会2024上,华为常务董事、华为CEO张平安向全球开发者们宣布了一项重
    的头像 发表于 06-24 10:49 914次阅读

    华为HDC 2024看点 华为盘古大模型5.0正式发布

    华为开发者大会2024(HDC 2024)上,华为常务董事、华为CEO张平安正式发布盘古大模型
    的头像 发表于 06-23 11:41 1489次阅读
    <b class='flag-5'>华为</b>HDC 2024看点  <b class='flag-5'>华为</b><b class='flag-5'>云</b>盘古大<b class='flag-5'>模型</b>5.0正式发布

    英特尔助力京东用CPU加速AI推理,以大模型构建数智化供应链

    英特尔助力京东用CPU加速AI推理,以大模型构建数智化供应链
    的头像 发表于 05-27 11:50 618次阅读
    英特尔助力京东<b class='flag-5'>云</b>用CPU<b class='flag-5'>加速</b><b class='flag-5'>AI</b>推理,以大<b class='flag-5'>模型</b>构建数智化供应链

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型 小编给大家汇总一下近期的AI
    发表于 04-15 12:32 455次阅读

    华为 Serverless 应用中心:一键开启 AI 文生图新时代,引领行业创新浪潮

    随着数字化时代的快速发展,AI 技术已成为推动行业创新的关键动力。华为紧跟时代步伐,全新上线 Serverless 应用中心,为用户提供海量应用模板,实现一键部署函数和周边依赖资源,
    的头像 发表于 03-19 22:57 517次阅读

    华为 Serverless 应用中心崭新上线,一键部署 AI 文生图应用引领创新潮流

    近日,华为再次展现其技术实力,全新推出了 Serverless 应用中心,为用户提供了海量的应用模板,让一键部署函数及关联资源成为现实,极大提升了应用的部署效率。无论是开发者还是运维
    的头像 发表于 03-19 22:56 574次阅读
    <b class='flag-5'>华为</b><b class='flag-5'>云</b> <b class='flag-5'>Serverless</b> 应用中心崭新上线,一键部署 <b class='flag-5'>AI</b> 文生图应用引领创新潮流

    鸿蒙原生应用元服务实战-Serverless华为账户认证登录需尽快适配

    一、ArkTS\\\\API9,服务器端基于serverless开发的应用与元服务华为账号注册登录功能暂时是不支持的 二、3月1日后的审核要求 3月1日的时间是快到了。 三、会导致的结果
    发表于 02-20 10:14

    鸿蒙应用/元服务开发实战-Serverless存储没法创建处理方式

    新账户,Serverless存储没法创建 ,没法进行下一步。 解决方式 请按照这个方式修改一下就能正常创建了,浏览器中打开控制台输入 window.top.cfpConfig.cloudStorageSwitch=‘off’ 后再创建桶
    发表于 02-19 11:21