0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里云通义千问720亿参数模型宣布开源

要长高 来源:网络整理 作者:网络整理 2023-12-01 17:08 次阅读

12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。与此同时,他们还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。

据了解,Qwen-72B是基于3T tokens高质量数据进行训练的模型,在10个权威基准测试中表现出色,超越了闭源的GPT-3.5和GPT-4。

阿里云是国内最早开源自研大模型的科技企业,通义千问是第一个全尺寸开源的大模型,从18亿、70亿、140亿到720亿参数规模。用户可以在魔搭社区直接体验Qwen系列模型的效果,也可以通过阿里云灵积平台调用模型API,或者在阿里云百炼平台上定制大模型应用。此外,阿里云人工智能平台PAI为通义千问全系列模型提供了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

开源模型Qwen-1.8B在推理2K长度的文本内容时只需3G显存,可以在消费级终端上进行部署。而Qwen-Audio可以感知和理解各种语音信号,包括人声、自然声、动物声和音乐声等。用户可以输入一段音频,并要求模型对音频进行理解,甚至进行文学创作、逻辑推理和故事续写等任务。

阿里云CTO周靖人表示,开源生态对于推动中国大型模型的技术进步和应用实践至关重要。通义千问将继续投入开源,并希望成为“AI时代最开放的大型模型”,与合作伙伴共同推动大型模型生态建设。

审核编辑:黄飞

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1800

    文章

    48083

    浏览量

    242144
  • GPT
    GPT
    +关注

    关注

    0

    文章

    365

    浏览量

    15631
  • 阿里云
    +关注

    关注

    3

    文章

    991

    浏览量

    43389
  • 大模型
    +关注

    关注

    2

    文章

    2781

    浏览量

    3432
收藏 人收藏

    评论

    相关推荐

    摩尔线程支持阿里通义QwQ-32B开源模型

    近日,阿里云团队正式开源全新推理模型——通义QwQ-32B。摩尔线程在该
    的头像 发表于 03-07 17:48 328次阅读
    摩尔线程支持<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>通义</b><b class='flag-5'>千</b><b class='flag-5'>问</b>QwQ-32B<b class='flag-5'>开源</b><b class='flag-5'>模型</b>

    广和通基于阿里通义模型推出随身智能解决方案,赋能消费电子终端行业

    2月,广和通与全球领先的解决方案提供商阿里达成合作:广和通AI模组及解决方案,基于阿里通义
    的头像 发表于 03-03 17:55 370次阅读
    广和通基于<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>通义</b>大<b class='flag-5'>模型</b>推出随身智能解决方案,赋能消费电子终端行业

    阿里通义Qwen2.5-Max模型全新升级

    )模型领域的最新探索成果。该模型经过了超过20万亿tokens的预训练数据洗礼,展现出了极强劲的综合性能。在多项公开主流模型评测基准上,Qwen2.5-Max均取得了高分,全面超越了目前全球领先的
    的头像 发表于 02-05 14:07 416次阅读

    阿里开源推理大模型QwQ

    推理能力,尤其在数学和编程方面表现突出。其整体推理水平已经可以与OpenAI的o1模型相媲美,这充分展示了QwQ的强大实力和潜力。 QwQ(Qwen with Questions)是通义
    的头像 发表于 11-29 11:30 754次阅读

    阿里通义代码模型全系列开源

    近日,阿里通义模型团队宣布了一项重大决策:将通义
    的头像 发表于 11-14 15:26 586次阅读

    阿里通义Qwen2大模型发布并同步开源

    阿里巴巴集团旗下的通义团队宣布,全新的Qwen2大模型正式发布,并在全球知名的
    的头像 发表于 06-11 15:33 1204次阅读

    阿里通义Qwen2大模型发布

    阿里巴巴最近发布了其通义系列的新成员——Qwen2大模型,并在Hugging Face和ModelScope两大平台上实现了同步
    的头像 发表于 06-07 15:59 876次阅读

    阿里正式发布通义2.5,中文性能全面赶超GPT-4 Turbo

    通义模型发布一周年之际,阿里迈出了历史性的一步。近日,阿里正式发布
    的头像 发表于 05-13 11:16 1181次阅读

    阿里发布通义2.5

    阿里近日正式发布了通义2.5,标志着其人工智能技术在中文语境下取得了重要突破。据阿里
    的头像 发表于 05-10 09:57 647次阅读

    阿里发布通义2.5大模型,多项能力超越GPT-4

    阿里隆重推出了通义 2.5 版,宣称其“技术进步,全面超越GPT-4”,尤其是在中文环境中的多种任务(如文本理解、文本生成、知识问答及
    的头像 发表于 05-09 14:17 1140次阅读

    通义开源千亿级参数模型

    通义近日开源了其首个千亿级参数模型Qwen1.5-110B,这是其全系列中首个达到千亿级别的开源
    的头像 发表于 05-08 11:01 887次阅读

    通义推出1100亿参数开源模型

    通义近日震撼发布1100亿参数开源模型Qwen
    的头像 发表于 05-06 10:49 682次阅读

    阿里通义发布320亿参数模型,优化性能及效率

    与之前的模型相比,新版320亿参数模型在性能、效率以及内存占用方面取得了明显改善。具体来说,32B在智能体场景下能力优于14B模型,并且推理成本较小。
    的头像 发表于 04-08 14:44 981次阅读

    联发科天玑9300等旗舰芯片搭载通义模型,成功实现

    通义模型可在离线环境下轻松应对多轮AI对话。此外,阿里也承诺与联发科进行深度合作,为全球
    的头像 发表于 03-28 16:35 939次阅读

    联发科天玑9300搭载通义模型阿里提供解决方案

    通义模型开源多项版本,包括18亿、70亿、1
    的头像 发表于 03-28 09:55 735次阅读