0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Qwen2强势来袭,AIBOX支持本地化部署

Firefly开源团队 2024-06-27 08:02 次阅读

Qwen2 是阿里通义推出的新一代多语言预训练模型,经过更深入的预训练和指令调整,在多个基准评测结果中表现出色,尤其在代码和数学方面有显著提升,同时拓展了上下文长度支持,最高可达128K。目前 AIBOX-1684X 已适配 Qwen2 系列模型,并已集成在 FireflyChat 对话应用中,开机即可体验。

模型基础更新

预训练和指令微调模型

Qwen2系列包含5个尺寸的预训练和指令微调模型,所有尺寸模型都使用了 GQA(分组查询注意力)机制,方便用户体验到推理加速和显存占用降低的优势。

8c14884e-3418-11ef-a655-92fbcf53809c.png

加强27种语言的训练数据

Qwen团队通过扩展多语言预训练和指令微调数据的规模,针对除中英文以外的27种语言进行加强,提升模型的多语言能力。

8c2f0fd4-3418-11ef-a655-92fbcf53809c.png

模型多方面测评

8bfd3bbc-3418-11ef-a655-92fbcf53809c.png

基准测评结果

相比 Qwen1.5,得益于预训练数据及训练方法的优化,Qwen2 在大模型实现大幅度的效果提升。在针对预训练语言模型的评估中,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均表现卓越。

8c591f18-3418-11ef-a655-92fbcf53809c.jpg

小模型方面,相比近期推出的领先模型,Qwen2-7B-Instruct 依然能在多个评测上取得显著的优势,尤其是代码及中文理解。

8c83bef8-3418-11ef-a655-92fbcf53809c.jpg

代码和数学能力显著提升

代码方面,沿用 Qwen1.5 的代码能力,实现 Qwen2 在多种编程语言上的效果提升;数学方面,投入了大规模且高质量的训练数据提升 Qwen2-72B-Instruct 的数学解题能力。

8c936d3a-3418-11ef-a655-92fbcf53809c.jpg

长文本处理

Qwen2 系列模型中较为关注的功能是它能够理解和处理扩展的上下文序列,对于冗长文档的应用程序,Qwen2 可以提供更准确、全面的响应,实现长文本自然语言高效处理。在Needle in a Haystack的测试集上显示:Qwen2-7B-Instruct 几乎完美地处理长达128k的上下文。

8caacade-3418-11ef-a655-92fbcf53809c.png

Qwen2-7B本地化部署

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46820

    浏览量

    237459
  • 模型
    +关注

    关注

    1

    文章

    3158

    浏览量

    48701
  • 语言模型
    +关注

    关注

    0

    文章

    502

    浏览量

    10244
收藏 人收藏

    评论

    相关推荐

    PerfXCloud重磅升级 阿里开源最强视觉语言模型Qwen2-VL-7B强势上线!

    「重磅通知」 :PerfXCloud 再度华丽升级,现已全面支持迄今为止 最为卓越的开源视觉模型 Qwen2-VL-7B 。这一重大突破将为用户带来更加震撼的视觉体验,进一步拓展创意的边界,快来
    的头像 发表于 10-23 11:07 220次阅读
    PerfXCloud重磅升级  阿里开源最强视觉语言模型<b class='flag-5'>Qwen2</b>-VL-7B<b class='flag-5'>强势</b>上线!

    利用OpenVINO部署Qwen2多模态模型

    多模态大模型的核心思想是将不同媒体数据(如文本、图像、音频和视频等)进行融合,通过学习不同模态之间的关联,实现更加智能的信息处理。简单来说,多模态大模型可以可以理解多种不同模态的输入数据,并输出相应反馈结果,例如图像理解,语音识别,视觉问题等。
    的头像 发表于 10-18 09:39 296次阅读

    号称全球最强开源模型 ——Qwen2.5 系列震撼来袭!PerfXCloud同步上线,快来体验!

    最新的大规模数据集上进行了预训练,该数据集包含多达18Ttokens。相较于Qwen2Qwen2.5获得了显著更多的知识(MMLU:85+),并在编程能力(Human
    的头像 发表于 09-25 16:52 520次阅读
    号称全球最强开源模型 ——<b class='flag-5'>Qwen</b>2.5 系列震撼<b class='flag-5'>来袭</b>!PerfXCloud同步上线,快来体验!

    阿里Qwen2-Math系列震撼发布,数学推理能力领跑全球

    阿里巴巴近期震撼发布了Qwen2-Math系列模型,这一系列模型基于其强大的Qwen2 LLM构建,专为数学解题而生,展现了前所未有的数学推理能力。Qwen2-Math家族包括1.5B、7B及72B三种规模,旨在满足不同场景下的
    的头像 发表于 08-12 15:19 691次阅读

    AIBOX青春版上线!1399把AI带回家

    AIBOX-1684X上市后,这个小巧的盒子凭借本地化AI的能力,获得市场一致好评。现Firefly推出新一款入门级AI盒子:AIBOX-1688该盒子搭载SOPHON算能八核AI处理器
    的头像 发表于 08-08 08:02 597次阅读
    <b class='flag-5'>AIBOX</b>青春版上线!1399把AI带回家

    基于Qwen-Agent与OpenVINO构建本地AI智能体

    Qwen2 是阿里巴巴集团 Qwen 团队研发的大语言模型和大型多模态模型系列。Qwen2 具备自然语言理解、文本生成、视觉理解、音频理解、工具使用、角色扮演、作为 AI Agent 进行互动等多种能力。
    的头像 发表于 07-26 09:54 720次阅读
    基于<b class='flag-5'>Qwen</b>-Agent与OpenVINO构建<b class='flag-5'>本地</b>AI智能体

    涂鸦HEDV本地化部署方案,助你低成本实现定制化开发!

    在日新月异的信息科技领域,软件定制需求不断增长,尤其在智慧校园、智慧园区和智慧能源等多元业务场景中,许多企业和组织对本地化部署的需求日益强烈。然而,传统软件应用往往难以跟上企业智能
    的头像 发表于 07-06 08:15 644次阅读
    涂鸦HEDV<b class='flag-5'>本地化</b><b class='flag-5'>部署</b>方案,助你低成本实现定制化开发!

    阿里通义千问Qwen2大模型发布并同步开源

    阿里巴巴集团旗下的通义千问团队宣布,全新的Qwen2大模型正式发布,并在全球知名的开源平台Hugging Face和ModelScope上同步开源。这一里程碑式的事件标志着中国在人工智能领域的又一次重要突破。
    的头像 发表于 06-11 15:33 1032次阅读

    阿里通义千问Qwen2大模型发布

    阿里巴巴最近发布了其通义千问系列的新成员——Qwen2大模型,并在Hugging Face和ModelScope两大平台上实现了同步开源。这一举措无疑为人工智能领域的研究者和开发者们提供了更多选择和可能。
    的头像 发表于 06-07 15:59 721次阅读

    AIBOX上手指南】快速部署Llama3

    Firefly开源团队推出了Llama3部署包,提供简易且完善的部署教程,过程无需联网,简单快捷完成本地化部署。点击观看Llama3快速部署
    的头像 发表于 06-06 08:02 587次阅读
    【<b class='flag-5'>AIBOX</b>上手指南】快速<b class='flag-5'>部署</b>Llama3

    AIBOX】装在小盒子的AI足够强吗?

    Firefly推出大语言模型本地部署的产品:AIBOX-1684X,目前已适配主流的大语言模型,包括ChatGLM3-6B,以下是ChatGLM3在AIBOX-1684X上的实机演示
    的头像 发表于 05-15 08:02 400次阅读
    【<b class='flag-5'>AIBOX</b>】装在小盒子的AI足够强吗?

    简单两步使用OpenVINO™搞定Qwen2的量化与部署任务

    英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件,可帮助开发人员和企业加速生成式人工智能 (AIGC)、大语言模型、计算机视觉和自然语言处理等 AI 工作负载,简化深度学习推理的开发和部署,便于实现从边缘到云的跨英特尔® 平台的异构执行。
    的头像 发表于 04-26 09:39 1548次阅读
    简单两步使用OpenVINO™搞定<b class='flag-5'>Qwen2</b>的量化与<b class='flag-5'>部署</b>任务

    AIBOX-1684X:把大语言模型“装”进小盒子

    AIBOX-1684X支持主流大模型私有部署,算力高达32TOPS,同时也支持CNN、RNN、LSTM等传统网络架构,
    的头像 发表于 04-20 08:02 1160次阅读
    <b class='flag-5'>AIBOX</b>-1684X:把大语言模型“装”进小盒子

    源2.0适配FastChat框架,企业快速本地化部署大模型对话平台

    北京2024年2月28日 /美通社/ -- 近日,浪潮信息Yuan2.0大模型与FastChat框架完成全面适配,推出"企业快速本地化部署大模型对话平台"方案。该方案主要面向金融、法律、教育等领域
    的头像 发表于 02-29 09:57 775次阅读
    源2.0适配FastChat框架,企业快速<b class='flag-5'>本地化</b><b class='flag-5'>部署</b>大模型对话平台

    比亚迪匈牙利工厂将落地,未来产品将欧洲本地化

    比亚迪董事长兼总裁王传福则强调,未来公司计划利用本地化资源加快开发具有欧洲特色的品牌产品。他表示将充分发挥比亚迪作为全球顶尖新能源汽车制造商的优势,推动匈牙利实现汽车行业的电动转型。
    的头像 发表于 02-01 14:05 741次阅读