电子发烧友网报道(文/李弯弯)日前,中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更,股东新增美团旗下天津三快科技有限公司,注册资本由约1480.69万人民币增至约1652.86万人民币。
智谱AI在大模型上的技术积累
智谱AI成立于2019年,由清华大学计算机系知识工程实验室的技术成果转化而来,致力于打造新一代认知智能通用模型。
智谱AI与清华大学知识工程实验室合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM(chatglm.cn)。此外,智谱AI还推出了认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品,提供智能API服务,链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座。
GLM-130B于2022年8月正式上线。据公开资料显示,在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,GLM表现依然出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上,甚至超过了GPT-3和Meta的OPT大模型。
GLM-130B支持中英双语,在多个公开评测集上性能超过GPT-3。同时该模型还支持英伟达、华为昇腾、海光DCU以及神威超算等多种芯片,支持快速推理,通过量化仅需4张英伟达RTX3090就可以运行千亿模型,实现真正的大模型普惠。
2023年3月,智谱AI开源了GLM系列模型的新成员——中英双语对话模型ChatGLM-6B,支持在单张消费级显卡上进行推理使用。
这是继此前开源GLM-130B千亿基座模型之后,智谱AI再次推出大模型方向的研究成果。与此同时,基于千亿基座模型的ChatGLM也同期推出,初具问答和对话功能。
ChatGLM-6B 模型基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。
据悉,经过约1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62亿参数的ChatGLM-6B 虽然规模不及千亿模型,但大大降低了推理成本,提升了效率,并且已经能生成相当符合人类偏好的回答。
美团在大模型领域的大力布局
在投资入股智谱AI之前,今年6月,美团宣布以总价2.85亿美元(约合20.65亿元)收购了创立仅四个月、美团联合创始人王慧文成立的大模型公司光年之外。
对于此次并购,美团表示,光年之外是中国领先的AGI创新者,其目前的管理与技术团队具有开发深度学习框架的高水平经验。公司通过收购事项可以获得领先的AGI技术及人才,有机会加强其于快速增长的人工智能行业中的竞争力。
光年之外虽然成立时间不长,却在两个月时间便完成了以产品和技术人才为主的团队搭建,吸引了多名人工智能领域顶级专家和创业者的加入,包括有着“搜狗输入法之父”之称的马占凯、北京智源人工智能研究院副院长刘江、曾任微软亚洲研究院主管研究员的袁进辉等。业界人士认为,这些人才过渡到美团,如果能把价值发挥出来,将会创造出无限可能。
此次投资入股智谱AI,也足以看出美团大模型领域的发展极其看好。目前,美团投资架构主要包括美团战投,以及2017年成立的私募股权基金美团龙珠,前身是“美团点评产业基金”。美团龙珠,主要专注于消费与科技方向布局。
美团龙珠创始合伙人朱拥华表示,从今年的维度来看,内部认为AI会有可能影响一切,尤其大模型的影响是方方面面的。他预计2025-2030年期间,所有行业都会因为AI有巨大的调整。他强调,“这个时代的脚步大家要抓住。”
智谱AI在知识智能方有着深厚的技术积累,在人才方面,智谱AI汇聚了顶尖技术研发团队和资深顾问。核心团队中,CEO张鹏毕业于清华计算机系,董事长刘德兵系中国工程院高文院士弟子,总裁王绍兰为清华创新领军博士。
在应用上,智谱AI打造的认知大模型平台以及数字人和科技情报产品,已经在中国科协、北京市科委、华为、腾讯等1000余家企事业单位得到引用。同时,智谱AI已与北京中医药大学东方医院共同开发了数字中医大模型。
据相关负责人介绍,数字中医大模型目前已完成千余本中医古籍书籍、中西医教材、期刊、医案、诊疗信息等数据的收集与加工,人们可以在“中医小助手”线上平台,初步体验基于大模型能力所实现的根据症状描述生成处方、中医中药知识问答等功能。
小结
先是并购大模型相关企业光年之外,后是投资入股人才技术兼备的AI大模型研发商智谱华章,足见美团对大模型未来发展的极度看好。经过大半年时间的发展,如今大模型已经进入应用落地探索期,美团未来在其中能够取得怎样的成绩,越来越值得期待了。
-
AI
+关注
关注
87文章
30677浏览量
268847 -
AI大模型
+关注
关注
0文章
314浏览量
305
发布评论请先 登录
相关推荐
评论