0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Qwen2强势来袭,AIBOX支持本地化部署

Firefly开源团队 2024-06-27 08:02 次阅读

Qwen2 是阿里通义推出的新一代多语言预训练模型,经过更深入的预训练和指令调整,在多个基准评测结果中表现出色,尤其在代码和数学方面有显著提升,同时拓展了上下文长度支持,最高可达128K。目前 AIBOX-1684X 已适配 Qwen2 系列模型,并已集成在 FireflyChat 对话应用中,开机即可体验。

模型基础更新

预训练和指令微调模型

Qwen2系列包含5个尺寸的预训练和指令微调模型,所有尺寸模型都使用了 GQA(分组查询注意力)机制,方便用户体验到推理加速和显存占用降低的优势。

8c14884e-3418-11ef-a655-92fbcf53809c.png

加强27种语言的训练数据

Qwen团队通过扩展多语言预训练和指令微调数据的规模,针对除中英文以外的27种语言进行加强,提升模型的多语言能力。

8c2f0fd4-3418-11ef-a655-92fbcf53809c.png

模型多方面测评

8bfd3bbc-3418-11ef-a655-92fbcf53809c.png

基准测评结果

相比 Qwen1.5,得益于预训练数据及训练方法的优化,Qwen2 在大模型实现大幅度的效果提升。在针对预训练语言模型的评估中,Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均表现卓越。

8c591f18-3418-11ef-a655-92fbcf53809c.jpg

小模型方面,相比近期推出的领先模型,Qwen2-7B-Instruct 依然能在多个评测上取得显著的优势,尤其是代码及中文理解。

8c83bef8-3418-11ef-a655-92fbcf53809c.jpg

代码和数学能力显著提升

代码方面,沿用 Qwen1.5 的代码能力,实现 Qwen2 在多种编程语言上的效果提升;数学方面,投入了大规模且高质量的训练数据提升 Qwen2-72B-Instruct 的数学解题能力。

8c936d3a-3418-11ef-a655-92fbcf53809c.jpg

长文本处理

Qwen2 系列模型中较为关注的功能是它能够理解和处理扩展的上下文序列,对于冗长文档的应用程序,Qwen2 可以提供更准确、全面的响应,实现长文本自然语言高效处理。在Needle in a Haystack的测试集上显示:Qwen2-7B-Instruct 几乎完美地处理长达128k的上下文。

8caacade-3418-11ef-a655-92fbcf53809c.png

Qwen2-7B本地化部署

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1781

    文章

    44963

    浏览量

    232380
  • 模型
    +关注

    关注

    1

    文章

    2823

    浏览量

    48051
  • 语言模型
    +关注

    关注

    0

    文章

    465

    浏览量

    10169
收藏 人收藏

    评论

    相关推荐

    阿里通义千问Qwen2大模型发布并同步开源

    阿里巴巴集团旗下的通义千问团队宣布,全新的Qwen2大模型正式发布,并在全球知名的开源平台Hugging Face和ModelScope上同步开源。这一里程碑式的事件标志着中国在人工智能领域的又一次重要突破。
    的头像 发表于 06-11 15:33 761次阅读

    阿里通义千问Qwen2大模型发布

    阿里巴巴最近发布了其通义千问系列的新成员——Qwen2大模型,并在Hugging Face和ModelScope两大平台上实现了同步开源。这一举措无疑为人工智能领域的研究者和开发者们提供了更多选择和可能。
    的头像 发表于 06-07 15:59 340次阅读

    AIBOX上手指南】快速部署Llama3

    Firefly开源团队推出了Llama3部署包,提供简易且完善的部署教程,过程无需联网,简单快捷完成本地化部署。点击观看Llama3快速部署
    的头像 发表于 06-06 08:02 155次阅读
    【<b class='flag-5'>AIBOX</b>上手指南】快速<b class='flag-5'>部署</b>Llama3

    AI算力核心板:Core-1688JD4

    等大模型私有化部署,提供一站式深度学习开发工具包SOPHONSDK,工具链完备易用度高,可轻松进行AI算法的本地化部署适用于智算服务器、边缘智算盒、工控机、智能网络
    的头像 发表于 05-15 08:02 398次阅读
    AI算力核心板:Core-1688JD4

    AIBOX】装在小盒子的AI足够强吗?

    Firefly推出大语言模型本地部署的产品:AIBOX-1684X,目前已适配主流的大语言模型,包括ChatGLM3-6B,以下是ChatGLM3在AIBOX-1684X上的实机演示
    的头像 发表于 05-15 08:02 202次阅读
    【<b class='flag-5'>AIBOX</b>】装在小盒子的AI足够强吗?

    广汽埃安泰国工厂185协议签署,实现本地化生产重要突破

    作为广汽集团在海外设立的首家保税工厂,此次保税区获批对埃安泰国本地化战略具有重大意义。185(保税区运营许可证)的批准将使所有生产零部件进口关税降至零,同时,在保税区内生产的电动车可享有东盟成员国间的互免关税待遇以及便捷的通关流程
    的头像 发表于 05-08 10:17 216次阅读

    简单两步使用OpenVINO™搞定Qwen2的量化与部署任务

    英特尔 OpenVINO™ 工具套件是一款开源 AI 推理优化部署的工具套件,可帮助开发人员和企业加速生成式人工智能 (AIGC)、大语言模型、计算机视觉和自然语言处理等 AI 工作负载,简化深度学习推理的开发和部署,便于实现从边缘到云的跨英特尔® 平台的异构执行。
    的头像 发表于 04-26 09:39 919次阅读
    简单两步使用OpenVINO™搞定<b class='flag-5'>Qwen2</b>的量化与<b class='flag-5'>部署</b>任务

    AIBOX-1684X:把大语言模型“装”进小盒子

    AIBOX-1684X支持主流大模型私有化部署,算力高达32TOPS,同时也支持CNN、RNN、LSTM等传统网络架构,支持TensorFN
    的头像 发表于 04-20 08:02 457次阅读
    <b class='flag-5'>AIBOX</b>-1684X:把大语言模型“装”进小盒子

    源2.0适配FastChat框架,企业快速本地化部署大模型对话平台

    北京2024年2月28日 /美通社/ -- 近日,浪潮信息Yuan2.0大模型与FastChat框架完成全面适配,推出"企业快速本地化部署大模型对话平台"方案。该方案主要面向金融、法律、教育等领域
    的头像 发表于 02-29 09:57 468次阅读
    源2.0适配FastChat框架,企业快速<b class='flag-5'>本地化</b><b class='flag-5'>部署</b>大模型对话平台

    比亚迪匈牙利工厂将落地,未来产品将欧洲本地化

    比亚迪董事长兼总裁王传福则强调,未来公司计划利用本地化资源加快开发具有欧洲特色的品牌产品。他表示将充分发挥比亚迪作为全球顶尖新能源汽车制造商的优势,推动匈牙利实现汽车行业的电动化转型。
    的头像 发表于 02-01 14:05 429次阅读

    英特尔CPU部署Qwen 1.8B模型的过程

    本文介绍了在英特尔 13 代酷睿 CPU i5 - 13490F 设备上部署 Qwen 1.8B 模型的过程,你需要至少 16GB 内存的机器来完成这项任务,我们将使用英特尔的大模型推理库 [BigDL] 来实现完整过程。
    的头像 发表于 01-12 10:28 1932次阅读

    如何本地部署大模型

    近期,openEuler A-Tune SIG在openEuler 23.09版本引入llama.cpp&chatglm-cpp两款应用,以支持用户在本地部署和使用免费的开源大语言模型,无需联网也能使用!
    的头像 发表于 10-18 11:48 2033次阅读
    如何<b class='flag-5'>本地</b><b class='flag-5'>部署</b>大模型

    【KV260视觉入门套件试用体验】4.机器视觉支持ReID加速应用AIBox测试

    【KV260视觉入门套件试用体验】4.机器视觉支持ReID加速应用AIBox测试大信ALSET(QQ:8125036) 感谢安富利科技和烧友烧网给予的Xilinx KriaKV260视觉AI套件视觉
    发表于 10-09 01:32

    本地化ChatGPT?Firefly推出基于BM1684X的大语言模型本地部署方案

    API的方式来应用,很难本地化部署。随着大模型适用领域的扩展,大模型登陆边缘设备的需求凸显,越来越多的行业需要把大语言模型应用在专业的领域上。在这个背景下,Firef
    的头像 发表于 09-09 08:02 1273次阅读
    <b class='flag-5'>本地化</b>ChatGPT?Firefly推出基于BM1684X的大语言模型<b class='flag-5'>本地</b><b class='flag-5'>部署</b>方案

    阿里云开源视觉语言大模型Qwen-VL ,支持图文双模态输入

    据介绍,Qwen-VL 是支持中英文等多种语言的视觉语言(Vision Language,VL)模型。相较于此前的 VL 模型,Qwen-VL 除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等
    的头像 发表于 08-25 15:12 889次阅读
    阿里云开源视觉语言大模型<b class='flag-5'>Qwen</b>-VL ,<b class='flag-5'>支持</b>图文双模态输入