12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
据了解,Qwen-72B是基于3T tokens高质量数据进行训练的模型,在10个权威基准测试中表现出色,超越了闭源的GPT-3.5和GPT-4。
阿里云是国内最早开源自研大模型的科技企业,通义千问是第一个全尺寸开源的大模型,从18亿、70亿、140亿到720亿参数规模。用户可以在魔搭社区直接体验Qwen系列模型的效果,也可以通过阿里云灵积平台调用模型API,或者在阿里云百炼平台上定制大模型应用。此外,阿里云人工智能平台PAI为通义千问全系列模型提供了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。
开源模型Qwen-1.8B在推理2K长度的文本内容时只需3G显存,可以在消费级终端上进行部署。而Qwen-Audio可以感知和理解各种语音信号,包括人声、自然声、动物声和音乐声等。用户可以输入一段音频,并要求模型对音频进行理解,甚至进行文学创作、逻辑推理和故事续写等任务。
阿里云CTO周靖人表示,开源生态对于推动中国大型模型的技术进步和应用实践至关重要。通义千问将继续投入开源,并希望成为“AI时代最开放的大型模型”,与合作伙伴共同推动大型模型生态建设。
审核编辑:黄飞
-
人工智能
+关注
关注
1789文章
46576浏览量
236899 -
GPT
+关注
关注
0文章
351浏览量
15272 -
阿里云
+关注
关注
3文章
931浏览量
42919 -
大模型
+关注
关注
2文章
2258浏览量
2335
发布评论请先 登录
相关推荐
评论