0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云通义千问720亿参数模型宣布开源

要长高 来源:网络整理 作者:网络整理 2023-12-01 17:08 次阅读

12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

据了解,Qwen-72B是基于3T tokens高质量数据进行训练的模型,在10个权威基准测试中表现出色,超越了闭源的GPT-3.5和GPT-4。

阿里云是国内最早开源自研大模型的科技企业,通义千问是第一个全尺寸开源的大模型,从18亿、70亿、140亿到720亿参数规模。用户可以在魔搭社区直接体验Qwen系列模型的效果,也可以通过阿里云灵积平台调用模型API,或者在阿里云百炼平台上定制大模型应用。此外,阿里云人工智能平台PAI为通义千问全系列模型提供了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

开源模型Qwen-1.8B在推理2K长度的文本内容时只需3G显存,可以在消费级终端上进行部署。而Qwen-Audio可以感知和理解各种语音信号,包括人声、自然声、动物声和音乐声等。用户可以输入一段音频,并要求模型对音频进行理解,甚至进行文学创作、逻辑推理和故事续写等任务。

阿里云CTO周靖人表示,开源生态对于推动中国大型模型的技术进步和应用实践至关重要。通义千问将继续投入开源,并希望成为“AI时代最开放的大型模型”,与合作伙伴共同推动大型模型生态建设。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1789

    文章

    46576

    浏览量

    236899
  • GPT
    GPT
    +关注

    关注

    0

    文章

    351

    浏览量

    15272
  • 阿里云
    +关注

    关注

    3

    文章

    931

    浏览量

    42919
  • 大模型
    +关注

    关注

    2

    文章

    2258

    浏览量

    2335
收藏 人收藏

    评论

    相关推荐

    通义三款主力模型再降价

    阿里百炼平台再次掀起降价风暴,三款通义主力模型——Qwen-Turbo、Qwen-Plus
    的头像 发表于 09-20 16:46 727次阅读

    通义发布第二代视觉语言模型Qwen2-VL

    阿里巴巴旗下的通义近日宣布,其第二代视觉语言模型Qwen2-VL正式问世,并
    的头像 发表于 09-03 16:31 503次阅读

    阿里通义Qwen2大模型发布并同步开源

    阿里巴巴集团旗下的通义团队宣布,全新的Qwen2大模型正式发布,并在全球知名的
    的头像 发表于 06-11 15:33 1005次阅读

    阿里通义Qwen2大模型发布

    阿里巴巴最近发布了其通义系列的新成员——Qwen2大模型,并在Hugging Face和ModelScope两大平台上实现了同步
    的头像 发表于 06-07 15:59 700次阅读

    阿里正式发布通义2.5,中文性能全面赶超GPT-4 Turbo

    通义模型发布一周年之际,阿里迈出了历史性的一步。近日,阿里正式发布
    的头像 发表于 05-13 11:16 900次阅读

    阿里发布通义2.5

    阿里近日正式发布了通义2.5,标志着其人工智能技术在中文语境下取得了重要突破。据阿里
    的头像 发表于 05-10 09:57 463次阅读

    阿里发布通义2.5大模型,多项能力超越GPT-4

    阿里隆重推出了通义 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及
    的头像 发表于 05-09 14:17 897次阅读

    通义开源千亿级参数模型

    通义近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源
    的头像 发表于 05-08 11:01 680次阅读

    通义推出1100亿参数开源模型

    通义近日震撼发布1100亿参数开源模型Qwen
    的头像 发表于 05-06 10:49 534次阅读

    阿里通义发布320亿参数模型,优化性能及效率

    与之前的模型相比,新版320亿参数模型在性能、效率以及内存占用方面取得了明显改善。具体来说,32B在智能体场景下能力优于14B模型,并且推理成本较小。
    的头像 发表于 04-08 14:44 757次阅读

    联发科天玑9300等旗舰芯片搭载通义模型,成功实现

    通义模型可在离线环境下轻松应对多轮AI对话。此外,阿里也承诺与联发科进行深度合作,为全球
    的头像 发表于 03-28 16:35 735次阅读

    联发科旗舰芯片部署阿里模型

    全球智能手机芯片出货量领先的半导体公司联发科近日宣布,已成功在天玑9300等旗舰芯片上集成阿里通义
    的头像 发表于 03-28 13:59 458次阅读

    通义首次落地天玑9300移动平台!阿里携手MediaTek探索端侧AI智能体

    3月28日,阿里与知名半导体公司MediaTek联合宣布通义18
    发表于 03-28 10:51 220次阅读
    <b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>首次落地天玑9300移动平台!<b class='flag-5'>阿里</b><b class='flag-5'>云</b>携手MediaTek探索端侧AI智能体

    联发科天玑9300搭载通义模型阿里提供解决方案

    通义模型开源多项版本,包括18亿、70亿、1
    的头像 发表于 03-28 09:55 492次阅读

    阿里通义重磅升级,免费开放1000万字长文档处理功能

    近日,阿里巴巴旗下的人工智能应用通义迎来重磅升级,宣布向所有人免费开放1000万字的长文档处理功能,这一创新举措使得
    的头像 发表于 03-26 11:09 718次阅读