0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

号称全球最强开源模型 ——Qwen2.5 系列震撼来袭!PerfXCloud同步上线,快来体验!

胡优妮 来源:jf_33463055 作者:jf_33463055 2024-09-25 16:52 次阅读

9月19日凌晨,阿里通义千问正式开源Qwen2.5系列大模型最新发布包括了语言模型Qwen2.5,以及专门针对编程的Qwen2.5-Coder和数学的Qwen2.5-Math模型。PerfXCloud(澎峰云)大模型开发与服务平台第一时间支持Qwen2.5 72B并在平台完成上线,赶快来体验吧!

Qwen2.5系列模型

更大的训练数据集:Qwen2.5语言模型的所有尺寸都在最新的大规模数据集上进行了预训练,该数据集包含多达18Ttokens。相较于Qwen2,Qwen2.5获得了显著更多的知识(MMLU:85+),并在编程能力(HumanEval 85+)和数学能力(MATH 80+)方面有了大幅提升。

更强的指令遵循能力:新模型在指令执行、生成长文本(超过8K标记)、理解结构化数据(例如表格)以及生成结构化输出特别是JSON方面取得了显著改进。Qwen2.5模型总体上对各种system prompt更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。

长文本支持能力:与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。

强大的多语言能力:它们同样保持了对包括中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文、韩文、越南文、泰文、阿拉伯文等29种以上语言的支持。

专业领域的专家语言模型能力增强:即用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math,相比其前身CodeQwen1.5和Qwen2-Math有了实质性的改进。具体来说,Qwen2.5-Coder在包含5.5T tokens编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。同时,Qwen2.5-Math支持中文和英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和TIR(Tool-Integrated Reasoning)。

wKgZombzzuyAIeM5AADwdHdI9ZU839.png

Qwen2.5-72B在多个基准测试中的结果

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3458

    浏览量

    42899
  • 模型
    +关注

    关注

    1

    文章

    3402

    浏览量

    49440
  • 大模型
    +关注

    关注

    2

    文章

    2746

    浏览量

    3388
收藏 人收藏

    相关推荐

    阿里巴巴Qwen模型助力开发低成本DeepSeek替代方案

    近日,阿里巴巴的开源Qwen2.5模型在AI领域再次展现其强大实力,为斯坦福大学与伯克利大学的研究人员提供了低成本的AI训练解决方案。借助这一技术,两所知名学府的研究团队成功开发出价格低于50美元
    的头像 发表于 02-12 13:42 489次阅读

    Qwen模型助力开发低成本AI推理方案

    阿里巴巴的开源Qwen2.5模型近期在AI领域引发了广泛关注。这一大模型的推出,为斯坦福大学与伯克利大学的研究人员提供了强大的技术支持,使他们能够成功开发出低成本的AI推理
    的头像 发表于 02-12 09:19 267次阅读

    阿里云通义Qwen2.5-Max模型全新升级

    )模型领域的最新探索成果。该模型经过了超过20万亿tokens的预训练数据洗礼,展现出了极强劲的综合性能。在多项公开主流模型评测基准上,Qwen2.5-Max均取得了高分,全面超越了目
    的头像 发表于 02-05 14:07 373次阅读

    阿里云通义开源长文本新模型Qwen2.5-1M

    近日,阿里云通义宣布了一项重大开源举措,推出了支持100万Tokens上下文的Qwen2.5-1M模型。这一新模型在处理长文本任务中展现出了卓越的性能,稳定超越了GPT-4o-mini
    的头像 发表于 02-05 14:01 226次阅读

    阿里通义千问发布Qwen2.5-Turbo开源AI模型

    近日,阿里通义千问官方宣布,经过数月的精心优化与改进,正式推出了Qwen2.5-Turbo开源AI模型。这款新模型旨在满足社区对更长上下文长度的迫切需求,为用户带来更加便捷、高效的AI
    的头像 发表于 11-19 18:07 821次阅读

    阿里通义千问代码模型系列开源

    近日,阿里云通义大模型团队宣布了一项重大决策:将通义千问代码模型系列正式开源。此次开源模型
    的头像 发表于 11-14 15:26 554次阅读

    阿里云开源Qwen2.5-Coder代码模型系列

    近日,阿里云通义大模型团队宣布开源其通义千问代码模型系列,共包含6款Qwen2.5-Coder模型
    的头像 发表于 11-14 11:28 511次阅读

    PerfXCloud重磅升级 阿里开源最强视觉语言模型Qwen2-VL-7B强势上线

    「重磅通知」 :PerfXCloud 再度华丽升级,现已全面支持迄今为止 最为卓越的开源视觉模型 Qwen2-VL-7B 。这一重大突破将为用户带来更加
    的头像 发表于 10-23 11:07 424次阅读
    <b class='flag-5'>PerfXCloud</b>重磅升级  阿里<b class='flag-5'>开源</b><b class='flag-5'>最强</b>视觉语言<b class='flag-5'>模型</b><b class='flag-5'>Qwen</b>2-VL-7B强势<b class='flag-5'>上线</b>!

    零一万物正式开源Yi-Coder系列模型 PerfXCloud火速支持等你体验!

    今日,零一万物宣告正式开源Yi-Coder系列模型:Yi-Coder 1.5B和Yi-Coder 9B,PerfXCloud(澎峰云)大模型
    的头像 发表于 09-05 16:07 454次阅读
    零一万物正式<b class='flag-5'>开源</b>Yi-Coder<b class='flag-5'>系列</b><b class='flag-5'>模型</b> <b class='flag-5'>PerfXCloud</b>火速支持等你体验!

    PerfXCloud 重大更新 端侧多模态模型 MiniCPM-Llama3-V 2.5 闪亮上架

    近日,PerfXCloud完成重大更新,上架了面壁小钢炮 MiniCPM 系列的端侧多模态模型 MiniCPM-Llama3-V 2.5,现已对平台用户免费开放体验!
    的头像 发表于 08-27 18:20 597次阅读
    <b class='flag-5'>PerfXCloud</b> 重大更新  端侧多模态<b class='flag-5'>模型</b> MiniCPM-Llama3-V <b class='flag-5'>2.5</b> 闪亮上架

    阿里Qwen2-Math系列震撼发布,数学推理能力领跑全球

    阿里巴巴近期震撼发布了Qwen2-Math系列模型,这一系列模型基于其强大的
    的头像 发表于 08-12 15:19 873次阅读

    PerfXCloud顺利接入MOE大模型DeepSeek-V2

    今日,在 PerfXCloud 重磅更新支持 llama 3.1 之后,其平台再度实现重大升级!目前,已顺利接入被誉为全球最强的 MOE 大模型 DeepSeek-V2 ,已在
    的头像 发表于 07-27 10:08 931次阅读
    <b class='flag-5'>PerfXCloud</b>顺利接入MOE大<b class='flag-5'>模型</b>DeepSeek-V2

    阿里通义千问Qwen2大模型发布并同步开源

    阿里巴巴集团旗下的通义千问团队宣布,全新的Qwen2大模型正式发布,并在全球知名的开源平台Hugging Face和ModelScope上同步
    的头像 发表于 06-11 15:33 1184次阅读

    Meta推出最强开源模型Llama 3 要挑战GPT

    Meta推出最强开源模型Llama 3 要挑战GPT Facebook母公司Meta Platforms(META.US)推出了开源AI大模型“Llama”的最新升级版本“Llama
    的头像 发表于 04-19 17:00 952次阅读

    号称全球最强开源AI模型DBRX登场

    洞见分析
    电子发烧友网官方
    发布于 :2024年03月28日 11:10:51