华为公司推出一款名为“盘古 Chat”的多模态千亿级大模型产品,直接对标 ChatGPT。该产品基于华为云内部项目,于2020年11月立项成功,主要面向To B / G 政企端客户。
盘古大模型基于华为自研的MindSpore框架开发,参数最多可达1.085万亿。此前,盘古大模型已经在2021年4月和2022年4月分别升级到2.0版本和3.0版本。其中,NLP大模型、CV大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。
据了解,华为盘古系列基础大模型于2021发布,包括NLP、CV和科学计算大模型,后续发布了矿山、药物分子、气象、海浪等行业大模型。
其中,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。
华为开发者大会2023 ( Cloud )将在今天举办,在此次大会上华为将发布盘古大模型3.0。
根据大会主题演讲议程,华为云盘古大模型将迎重大升级,从演讲主题来看,盘古大模型将首次明确定位,即“为行业而生”,盘古基础大模型的全栈创新和行业大模型的“炼成术”也将首次对外公布。
时间方面,预计今天下午14:50开始介绍盘古大模型,15:30至16:00揭秘盘古大模型如何从基础大模型炼成行业大模型,以及基础大模型全栈创新。
盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成。这些模型可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。通过模型泛化,盘古大模型解决了传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。
-
人工智能
+关注
关注
1789文章
46545浏览量
236822 -
nlp
+关注
关注
1文章
483浏览量
21984 -
大模型
+关注
关注
2文章
2252浏览量
2314 -
盘古大模型
+关注
关注
1文章
109浏览量
229
发布评论请先 登录
相关推荐
评论