0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

智谱推出四个全新端侧模型 携英特尔按下AI普及加速键

looger123 来源:looger123 作者:looger123 2024-12-02 17:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

随着AI的发展,端侧AI模型越来越受到广大客户及厂商的关注,业界领先的大模型公司智谱于近日推出了四个全新的端侧模型,加速AI前沿技术路径与创新应用场景探索,推动AI大模型普惠化发展。

四个模型中,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat为端侧大语言模型,GLM-Edge-V-5B、GLM-Edge-V-2B为端侧多模态模型,这四个模型分别具有4.3B/1.5B/4.8B/2B参数量。两个端侧的大语言模型适合意图理解、智能对话、文本创作、知识库问答等,两个端侧的多模态模型适用于视觉理解、创意描述、本地搜索、图片问答等。这四个模型即将在Github、Huggingface、模搭等多个开源社区上发布。

为了确保这些新模型能够在实际应用中发挥卓越性能,英特尔与智谱紧密合作,利用最新的英特尔酷睿Ultra处理器(第二代)硬件平台和OpenVINOTMAI推理加速软件对模型的性能进行优化。通过与英特尔的紧密合作,智谱的新模型在计算效率、推理速度和能效比等方面得到了显著提升。

英特尔酷睿Ultra处理器集成了专门的AI加速器,显著提升AI和机器学习任务的处理能力。OpenVINOTM是由英特尔发起的AI推理优化部署软件框架,旨在优化和加速深度学习模型在各种英特尔硬件上的推理性能,提供高效的模型优化和跨平台部署能力,使得开发者能够在CPUGPU、NPU 等多种硬件上实现卓越的AI推理性能。

在强大的硬件基础上,OpenVINO采用多种优化策略对智谱模型进行优化。INT4低精度模型量化;基于kvcache的stateful模型优化;基于模型图融合优化,包括SDPA GQA,RoPE fusion等等。

通过这些优化,英特尔在基于酷睿Ultra第二代处理器的AIPC上做到了对相关模型的Day 0(第零日)支持并取得了很好的性能(如下图):

wKgZPGdNekqAGlFgAADawgzfCAM457.png

在AI PC领域,英特尔正在引领市场前行。英特尔目前已出货了超过2,000万台AIPC设备,构建了拥有超过100家ISV、300多项AI应用、500多个AI模型的庞大生态系统。

在产品层面,英特尔也在与OEM厂商密切合作,推出以酷睿Ultra处理器为核心的AIPC。酷睿Ultra同时实现了出色的性能和续航能力,基于强大的x86架构,通过CPU、GPU算力,酷睿Ultra能够充分发挥AI技术的优势。

未来英特尔会与智谱进一步加强在端侧模型上的合作,并利用酷睿Ultra处理器上不断提升的AI能力,充分赋能更多AIPC上的应用,让用户在基于英特尔酷睿Ultra的AIPC上有更好的体验。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10326

    浏览量

    181119
  • AI
    AI
    +关注

    关注

    91

    文章

    41295

    浏览量

    302669
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔
    的头像 发表于 04-26 16:27 9462次阅读
    <b class='flag-5'>AI</b>工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    性能再越级!英特尔推出全新酷睿Ultra 200HX Plus系列移动处理器

    英特尔酷睿Ultra 200HX Plus系列登场,全新酷睿 Ultra 9 290HX Plus和酷睿Ultra 7 270HX Plus处理器,为极致性能需求注入更强动力。 今日,英特尔发布
    的头像 发表于 03-19 16:43 360次阅读

    英特尔与华阳通用联手推出全新AI Box解决方案

    英特尔宣布推出基于最新英特尔 酷睿 Ultra 架构的AI Box解决方案,将PC级旗舰算力引入汽车、工业自动化、轨道交通、机器人等多种工业环境,为各行各业接入
    的头像 发表于 03-02 14:15 777次阅读

    创芯赋能智能生态!汇顶科技亮相2025英特尔技术创新与产业生态大会

    11月19–21日,2025英特尔技术创新与产业生态大会在重庆盛大启幕。作为英特尔生态的重要合作伙伴,汇顶科技人机交互、指纹识别等多项PC创新成果,为
    的头像 发表于 11-21 15:00 5701次阅读
    创芯赋能智能生态!汇顶科技亮相2025<b class='flag-5'>英特尔</b>技术创新与产业生态大会

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    具身智能和机器人应用提供强大算力支持。会上,英特尔携手普联技术、海石商用、海信医疗、阿丘科技等众多的生态伙伴,共同分享了丰富的行业应用成果,携手勾勒出AI领域的未来发展新蓝图。
    的头像 发表于 11-19 21:51 7134次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    此芯科技发布“合一”AI加速计划,赋能边缘与AI创新

    此芯科技正式发布“合一”AI加速计划,旨在为边缘计算和AI场景提供高能效的全栈算力解决方案。该计划由此芯科技联合多家行业合作伙伴共同发起
    的头像 发表于 09-15 11:53 2011次阅读
    此芯科技发布“合一”<b class='flag-5'>AI</b><b class='flag-5'>加速</b>计划,赋能边缘与<b class='flag-5'>端</b><b class='flag-5'>侧</b><b class='flag-5'>AI</b>创新

    英特尔Gaudi 2E AI加速器为DeepSeek-V3.1提供加速支持

    英特尔® Gaudi 2EAI加速器现已为DeepSeek-V3.1提供深度优化支持。凭借出色的性能和成本效益,英特尔Gaudi 2E以更低的投入、更高的效率,实现从模型训练的深度突破
    的头像 发表于 08-26 19:18 3350次阅读
    <b class='flag-5'>英特尔</b>Gaudi 2E <b class='flag-5'>AI</b><b class='flag-5'>加速</b>器为DeepSeek-V3.1提供<b class='flag-5'>加速</b>支持

    华为CANN与智GLM模型完成适配

    已于7月28日正式开源其新一代基座模型GLM-4.5,其GLM模型已完成与CANN的适配。这标志着国产大模型与计算架构在
    的头像 发表于 08-11 11:00 2790次阅读

    硬件与应用同频共振,英特尔Day 0适配腾讯开源混元大模型

    于OpenVINO™ 构建的 AI 软件平台的可扩展性,英特尔助力ISV生态伙伴率先实现应用Day 0 模型适配,大幅加速了新
    的头像 发表于 08-07 14:42 1547次阅读
    硬件与应用同频共振,<b class='flag-5'>英特尔</b>Day 0适配腾讯开源混元大<b class='flag-5'>模型</b>

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款677
    的头像 发表于 06-27 11:44 1049次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b>至强6助力<b class='flag-5'>AI</b>系统高效运转

    英特尔发布边缘AI控制器与边缘智算一体机,创造“AI新视界”

    处理器的边缘 AI 控制器 和 基于英特尔锐炫 ™ 显卡的边缘智算一体机 ,为工业AI的规模化落地注入强劲动力。 英特尔与诺达佳联合发布边缘AI
    发表于 06-24 17:50 1578次阅读
    <b class='flag-5'>英特尔</b>发布边缘<b class='flag-5'>AI</b>控制器与边缘智算一体机,创造“<b class='flag-5'>AI</b>新视界”

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户
    的头像 发表于 06-20 17:32 1066次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘<b class='flag-5'>AI</b>的“智能引擎”

    直击Computex 2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    B60和英特尔锐炫Pro B50 GPU,AI加速器产品—英特尔Gaudi 3 AI加速器。
    的头像 发表于 05-21 00:57 7781次阅读
    直击Computex 2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新
    的头像 发表于 05-20 12:27 5690次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和<b class='flag-5'>AI</b>性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI
    发表于 05-20 11:03 1926次阅读