0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

昇腾与昇思原生,助力智谱打造自主创新大模型体系!

爱云资讯 2024-08-20 18:29 次阅读

【北京】2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。会上,华为昇腾计算业务副总裁刘鑫发表演讲介绍昇腾原生进展,智谱CEO张鹏作专题分享,张鹏简要介绍了昇腾对自主创新的智谱大模型的助力,以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video。

其中,代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练,依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等,将大幅提升模型开发、训练的效率及模型精度。

wKgaombEcACASt93AADdKMLSlCo748.jpg

华为昇腾计算业务副总裁 刘鑫

wKgZombEcACAIdQnAADhfl6nqFM251.jpg

智谱CEO 张鹏

模型能力

1.代码生成大模型CodeGeeX4

第四代代码模型 CodeGeeX4堪称代码生成大模型的“六边形战士”,已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上,相对于更大的模型实现了性能反超。

CodeGeeX4单一模型实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景,支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K,支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时,在模型推理可实现单卡部署,最低24GB显存即可进行量化推理,用户可在本地私有化部署,保护企业代码安全。

wKgaombEcACARrSoAAEnyvjMtWI350.jpgwKgZombEcACAcCv-AACbaM5uG5U825.jpg

2.多模态大模型CogVLM2-video(视频生成文本)

多模态大模型CogVLM2-video实现视频生成文本能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示,CogVLM2-video在多个视频问答任务上达到了 state-of-the-art (SOTA模型)的性能,并能够实现一分钟内的视频理解,在几个主流性能测试数据集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表现不俗,展现出全面竞争力,同时在多类主要指标上完成对其他模型的领先。

wKgaombEcACALy5iAADbOUXaPGU564.jpgwKgaombEcACAO4dyAABNa4pVLEQ393.jpgwKgZombEcACAOsZEAAB3ve3Dab4451.jpg

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4在训练过程中,调用昇腾原生的融合算子,利用昇思MindSpore AI框架的提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,解决内存瓶颈、降低计算空泡、提升通信效率,实现“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率20%提升,加速模型的迭代创新。

另外,该模型也采用MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加自动算子融合优化,以接近动态图的启动时间获取了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得15%的性能收益。

未来,智谱将与昇腾AI持续携手,打造更多领先的自主创新大模型,加速人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。

wKgZombEcACAY3aGAAFF4PwDGFk160.jpg

昇腾使能AI产业生态打造原生成果

自从昇腾全面启动原生开发,越来越多的生态伙伴选择昇腾,大模型生态从“应用迁移”走向“原生开发”,充分依托昇腾AI基础软硬件平台和完备的原生开发工具,提升开发效率、强化模型性能、加速应用落地,面向不同行业客户提供个性化的解决方案,与昇腾共同推进中国人工智能产业的蓬勃发展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238251
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2640
收藏 人收藏

    评论

    相关推荐

    迅龙软件受邀参加华为人工智能框架峰会,展示X香橙派的创新AI案例

    12月14日,人工智能框架峰会在北京中关村国际创新中心召开,本次大会以“创新源动力,框架新选择”为主题,由
    的头像 发表于 12-17 18:02 400次阅读
    迅龙软件受邀参加华为<b class='flag-5'>昇</b><b class='flag-5'>思</b>人工智能框架峰会,展示<b class='flag-5'>昇</b><b class='flag-5'>思</b>X香橙派的<b class='flag-5'>创新</b>AI案例

    商汤参与基于AI框架的大模型原生开发成果发布

    近日,人工智能框架峰会暨成果发布会在北京举办。AI框架作为大模型开发及产业落地的基础软件,在人工智能技术栈中起到使能算法开发、释放硬件性能的“承上启下”作用。
    的头像 发表于 12-17 15:04 259次阅读

    云天励飞携手华为打造智算中心解决方案

    当前,人工智能技术正在加速向各行业深度渗透,成为驱动产业转型和社会进步的重要引擎。构建开放协作的AI生态体系、推动技术和应用深度融合,已成为行业发展的重要趋势。 云天励飞基于AI基础软硬件平台
    的头像 发表于 12-12 16:05 654次阅读

    香橙派与MindSpore合作提速,软硬结合助力开发者构建创新AI应用

    AIpro开发板构建创新AI应用,助力开发者积累开发经验、繁荣人工智能产业生态。目前,MindSporeAI框架已实现预置在香橙派AIpro开发板,并在官方网站上线
    的头像 发表于 11-01 17:02 784次阅读
    香橙派与<b class='flag-5'>昇</b><b class='flag-5'>思</b>MindSpore合作提速,软硬结合<b class='flag-5'>助力</b>开发者构建<b class='flag-5'>创新</b>AI应用

    谷东科技民航维修智能决策大模型荣获华为技术认证

    经过华为专业评测,谷东科技民航维修智能决策大模型1.0成功与华为Atlas 800T A2训练服务器完成并通过了相互兼容性测试认证,正式荣获华为技术认证,被授予Ascend Compatible认证证书及认证徽标的使用权,成
    的头像 发表于 09-30 15:22 435次阅读

    香橙派亮相AI开发者创享日,打造“AI+鸿蒙”高算力开发板

    6月29日,AI开发者创享日·广东站在广州成功举办。本次活动汇聚人工智能领域顶尖人才,为开发者带来AI生态最新进展、案例实践应用及原生
    的头像 发表于 07-05 15:31 608次阅读
    香橙派亮相<b class='flag-5'>昇</b><b class='flag-5'>腾</b>AI开发者创享日,<b class='flag-5'>打造</b>“AI+鸿蒙”高算力开发板

    基于AI Yolov7模型迁移到平台EA500I边缘计算盒子的实操指南

    近年来,国产化替代的进程正在加快。在众多国产平台中,平台具有高性能、低功耗、易扩展、软件栈全面成熟等优势,其产品和技术在国内众多领域实现了广泛应用;作为的APN伙伴和IHV合作
    的头像 发表于 06-26 17:51 623次阅读
    基于<b class='flag-5'>昇</b><b class='flag-5'>腾</b>AI  Yolov7<b class='flag-5'>模型</b>迁移到<b class='flag-5'>昇</b><b class='flag-5'>腾</b>平台EA500I边缘计算盒子的实操指南

    引领高校原生人才新生态 北京大学鲲鹏科教创新卓越中心正式成立

    计算产业前沿课题研究、课程体系建设、研究人才培养等方面展开深入合作,助力鲲鹏优秀原生人才培养,加快孵化出世界级科研
    的头像 发表于 06-25 16:23 406次阅读
    引领高校<b class='flag-5'>原生</b>人才新生态 北京大学鲲鹏<b class='flag-5'>昇</b><b class='flag-5'>腾</b>科教<b class='flag-5'>创新</b>卓越中心正式成立

    浙江大学 鲲鹏科教创新卓越中心正式成立,推动高校原生创新加速

    才培养方面展开深入合作,基于鲲鹏技术路线进行计算机体系架构和科学应用的原生创新,同步开展专业竞赛、课程建设、工程实践等培养鲲鹏
    的头像 发表于 06-23 13:18 639次阅读
    浙江大学 鲲鹏<b class='flag-5'>昇</b><b class='flag-5'>腾</b>科教<b class='flag-5'>创新</b>卓越中心正式成立,推动高校<b class='flag-5'>原生</b><b class='flag-5'>创新</b>加速

    开启原生创新引擎,中国科学技术大学 鲲鹏科教创新卓越中心正式成立

    中心,在科研创新与人才培养方面展开深入合作,基于鲲鹏技术路线实现计算机体系架构和科学应用的原生创新
    的头像 发表于 06-21 10:39 348次阅读
    开启<b class='flag-5'>原生</b><b class='flag-5'>创新</b>引擎,中国科学技术大学 鲲鹏<b class='flag-5'>昇</b><b class='flag-5'>腾</b>科教<b class='flag-5'>创新</b>卓越中心正式成立

    英码科技受邀参加鲲鹏南北双峰会, 共同打造数智化新质生产力!

    基于平台推出的一系列算力产品,以吸睛的直观方式演示行业创新解决方案,以及分享英码科技如何携手、鲲鹏共同
    的头像 发表于 05-17 16:23 1254次阅读

    华为发布会大模型翻车?社区回应!

    针对网传华为发布会大模型生成图片疑人工操控的消息,社区回应:5月10日,在鲲鹏腾开发者大会的一场技术讨论上,演示了mxRAG SDK功能。
    的头像 发表于 05-16 14:14 615次阅读
    华为发布会大<b class='flag-5'>模型</b>翻车?<b class='flag-5'>昇</b><b class='flag-5'>腾</b>社区回应!

    软通动力受邀参加华为举办的“AI框架及大模型技术论坛”

    5月11日,鲲鹏腾开发者大会2024期间,华为举办“AI框架及大模型技术论坛”,软通动力数字基础设施与集成事业部总经理谢睿受邀出席、软通动力数字基础设施与集成事业部技术总监单继岭
    的头像 发表于 05-13 09:30 582次阅读

    共建中国原生计算生态,拓维信息精彩亮相鲲鹏腾开发者大会

    计算产业前沿技术及应用发展方向,加速行业智能化升级。兆瀚使能,共绽AI“光芒”作为华为“AI+鲲鹏”战略的重要合作伙伴,拓维信息旗下湘江鲲鹏坚持自主创新,专注
    的头像 发表于 05-12 08:14 370次阅读
    共建中国<b class='flag-5'>原生</b>计算生态,拓维信息精彩亮相鲲鹏<b class='flag-5'>昇</b>腾开发者大会

    迅龙软件加入华为APN,共同推动人工智能行稳致远

    软件服务商,迅龙软件与华为在现场签署合作协议,正式成为APN(伙伴网络)伙伴之一。作为新一批APN伙伴体系中的一员,迅龙软件将携手华
    的头像 发表于 12-29 15:36 843次阅读
    迅龙软件加入华为<b class='flag-5'>昇</b><b class='flag-5'>腾</b>APN,共同推动人工智能行稳致远