0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔携手Aible打造创新解决方案,助力企业实现低成本智能化升级

looger123 来源:looger123 作者:looger123 2024-07-03 19:17 次阅读

对于需要运行生成式AI工作负载的企业来说,基于英特尔至强处理器的Aible无服务器解决方案可帮助其降低成本、提高智能化,并有效提升RAG及微调效率

近日,英特尔与端到端Serverless(无服务器)生成式AI和增强型分析方案提供商Aible合作,为企业客户提供了创新的解决方案,助力其在不同代际的英特尔®至强®CPU上运行生成式AI与检索增强生成(RAG)用例。此次合作包含了工程优化和基准测试项目,显著增强了Aible以低成本为企业客户提供生成式AI结果的能力,并帮助开发人员在应用中部署AI。在双方的通力合作下,该可扩展、高效的AI解决方案可通过高性能硬件帮助客户迎接AI挑战。

wKgZomaFM1yAEigTAAN8h0PVHGc421.png

英特尔至强处理器

英特尔数据中心人工智能事业部高级首席工程师Mishali Naik表示:“现在,客户正在寻求高效的企业级解决方案以充分释放AI潜力。我们与Aible的合作,也表明了英特尔正与行业紧密协作,推动AI创新,降低客户使用英特尔至强处理器运行最新生成式AI工作负载的门槛。”

至强处理器的生成式AI性能:Aible的解决方案展示了CPU如何显著提升从运行语言模型至RAG的一系列最新AI工作负载性能。基于针对英特尔处理器的优化,Aible技术采用高效、智能的“端到端无服务器”方法,仅在产生用户请求时才会进行资源消耗。例如,基于用户查询,向量数据库仅需几秒即可激活并检索相关信息,而语言模型同样只需简单启动即可处理并响应用户请求,这种按需操作的运行模式有助于企业降低总拥有成本(TCO)。

虽然在多数情况下,RAG功能需通过利用GPU和加速器的并行处理能力来实现,但Aible的无服务器技术与英特尔至强处理器相结合,可使RAG用例完全由CPU来驱动。性能数据显示,多款不同代际的英特尔至强处理器均可高效运行RAG工作负载。

wKgaomaFM1yAWfmOAAOFuDBs-Nk034.png

配置详细信息如图,结果可能会有不同

重要意义:Aible通过无服务器的方式使用CPU,可在多个客户之间更为安全地共享底层计算资源,从而帮助客户有效降低生成式AI项目的运营成本。这种降低成本的方式可以类比为用户仅需在使用时购买电力,而非直接租赁发电机。此外,随着生成式AI需求的增长,性能优化和节能降耗变得愈发重要。Aible所提供的基于CPU的服务,为客户提供了一种经济、高效的解决方案。

根据Aible的基准测试分析,当客户采用基于CPU的无服务器解决方案运行RAG模型时,成本节省可高达55倍1。大幅降低的成本证明了Aible独家方法的有效性,同时这种无服务器的CPU采用方式也减少了通过共享服务或专用服务器构建更为昂贵的、基于GPU的基础设施需求。

此次英特尔及英特尔实验室与Aible的合作,共同优化了至强处理器上的AI工作负载。值得一提的是,通过优化Aible针对AVX-512的代码,Aible在至强处理器上实现了显著的性能及吞吐量提升,这也彰显了战略性的软件优化对于整体效率的影响。

在Aible平台的支持下,RAG模型与英特尔至强处理器的结合可推动以下应用落地:

自然语言处理(NLP)

推荐系统

决策支持系统

内容生成

英特尔与Aible的合作始于第四代至强处理器的发布。此后,双方针对至强处理器的AI工作负载、代码和库进行了一系列优化,并大幅提升了Aible的产品性能。

1英特尔不控制或审计第三方数据。您可咨询其他来源以评估准确性。

配置详情:

1节点,2x英特尔®至强® Platinum 8280L CPU,2.70GHz, 28核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 0 [0],DSA 0 [0],IAA 0 [0],QAT 0 [0],总内存384GB (12x32GB DDR4 2933 MT/s [2934 MT/s]),BIOS SE5C620.86B.02.01.0017.110620230543,微码0x5003604,2x以太网连接X722用于10GBASE-T,1x 894.3G英特尔SSDSC2KB96,1x 1.8T英特尔SSDPE2KX020T8,2x 3.7T英特尔SSDPE2KX040T8,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.04。基于英特尔03/07/24的测试。

1节点,2x英特尔®至强® Platinum 8462Y+,32核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 2 [0],DSA 2 [0],IAA 2 [0],QAT 2 [0],总内存512GB (16x32GB DDR5 4800 MT/s [4800 MT/s]),BIOS 05.12.00,微码0x2b0004d0,2x BCM57416 NetXtreme-E Dual-Media 10G RDMA以太网控制器,2x以太网控制器E810-C for QSFP,2x 3.5T三星MZQL23T8HCLS-00B7C,1x 1.8T三星MZ1L21T9HCLS-00A07,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.05。基于英特尔03/07/24的测试。

1节点,2x英特尔®至强® PLATINUM 8562Y+,32核心,HT开启,Turbo开启,NUMA 2,集成加速器可用[已使用]:DLB 2 [0],DSA 2 [0],IAA 2 [0],QAT 2 [0],总内存512GB (16x32GB DDR5 5600 MT/s [5600 MT/s]),BIOS 3B05.TEL4P1,微码0x21000161,2x以太网控制器X710用于10GBASE-T,2x以太网控制器E810-C for QSFP,1x 894.3G英特尔SSDSC2KG96,1x 3.5T三星MZQL23T8HCLS-00A07,3x 3.5T三星MZQL23T8HCLS-00B7C,Red Hat Enterprise Linux 8.9 (Ootpa),4.18.0-513.18.1.el8_9.x86_64,WORKLOAD=Aible端到端RAG-LLM,模型=Mistral-7B-OpenOrca-GGUF,all-MiniLM-L6-v2,gcc 12.2.0,IntelLLVM 2024.0.2,llama.cpp,ChromaDB,Langchain,oneAPI基础容器2024.0.1-devel-ubuntu22.06。基于英特尔03/07/24的测试。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9608

    浏览量

    169994
  • 智能化
    +关注

    关注

    15

    文章

    4573

    浏览量

    54491
  • 至强处理器
    +关注

    关注

    0

    文章

    19

    浏览量

    9145
收藏 人收藏

    评论

    相关推荐

    英特尔携手震坤行发布智能物联聚合馆

    今天,英特尔与震坤行共同推出英特尔 智能物联聚合馆。这不仅是英特尔在物联网领域深度开拓市场的战略举措,也是其携手生态合作伙伴共同拓宽发展、优
    的头像 发表于 06-21 09:26 303次阅读

    用友携手英特尔发布《用友BIP+英特尔第四代至强私有部署蓝皮书》

    近日,由用友网络主办的“成就数智企业”2024大型企业数智峰会·西北峰会在陕西西安成功召开。在企业数智底座与数据
    的头像 发表于 06-15 11:28 658次阅读

    英特尔OPS 2.0定义智慧教育新标准,助力行业创新升级

    ——OPS 2.0,并展示了基于该标准的多元行业领先解决方案,以进一步加速智慧教育终端与智能应用的创新与落地,开创面向未来的智慧教育新生态。 英特
    的头像 发表于 04-19 09:24 200次阅读
    <b class='flag-5'>英特尔</b>OPS 2.0定义智慧教育新标准,<b class='flag-5'>助力</b>行业<b class='flag-5'>创新</b><b class='flag-5'>升级</b>

    数字转型助力制造业:英特尔与阿普奇共推智能化升级

    AK系列,该系列采用英特尔®酷睿™处理器、英特尔®凌动®处理器与英特尔®锐炫™显卡,能够在工业智造领域助力用户优化资源配置、提升产品质量与生产效率,加速制造业的
    的头像 发表于 04-11 10:22 166次阅读
    数字<b class='flag-5'>化</b>转型<b class='flag-5'>助力</b>制造业:<b class='flag-5'>英特尔</b>与阿普奇共推<b class='flag-5'>智能化</b><b class='flag-5'>升级</b>

    Ansys和英特尔代工合作开发多物理场签核解决方案

    Ansys携手英特尔代工,共同打造2.5D芯片先进封装技术的多物理场签核解决方案。此次合作,将借助Ansys的高精度仿真技术,为英特尔
    的头像 发表于 03-11 11:24 386次阅读

    用AI PC助力创新无限想象,英特尔人工智能创新应用大赛正式启动

    睿™ Ultra等设备及软件工具套件,助力开发者利用基于英特尔的AI PC出色的计算和图形性能进行创意开发,让每一位用户都能真切体验到AI PC带来的智能生产力跃升以及更加强大的娱乐体验。作为本届大赛的独家AI PC合作伙伴,联
    的头像 发表于 12-19 11:23 461次阅读

    英特尔携手联想推动制造业数字转型升级

    为持续推动智能制造发展,英特尔助力联想打造了联想(天津)智慧创新服务产业园。在构建这座5G智慧工厂的过程中,双方充分运用绿能技术和绿色建造技
    的头像 发表于 12-16 15:21 732次阅读

    探索绿色之道:英特尔助力联想打造零碳智造工厂

    为持续推动智能制造发展,英特尔助力联想打造了联想(天津)智慧创新服务产业园。在构建这座5G智慧工厂的过程中,双方充分运用绿能技术和绿色建造技
    的头像 发表于 12-12 16:57 495次阅读

    2023中关村论坛系列活动——英特尔智能医疗健康创新合作论坛在京成功举办

    数字转型的大背景下,英特尔中国研究院携手“医产学研用”合作伙伴,共同探讨如何推动数医融合创新助力“健康中国”建设,并分享技术
    的头像 发表于 11-22 19:12 428次阅读
    2023中关村论坛系列活动——<b class='flag-5'>英特尔</b><b class='flag-5'>智能</b>医疗健康<b class='flag-5'>创新</b>合作论坛在京成功举办

    英特尔助力中兴通讯的通信解决方案

    方案,让业界了解英特尔公司可以为中 国的通信设备制造企业提供极大的支持与 帮助。让业界更加清楚地了解到,采用英 特公司的产品以及解决方
    发表于 11-14 08:32 0次下载
    <b class='flag-5'>英特尔</b><b class='flag-5'>助力</b>中兴通讯的通信<b class='flag-5'>解决方案</b>

    英特尔携手星环科技亮相进博会,以创新解决方案助力企业数字发展

    近日,英特尔与星环科技在2023中国国际进口博览会上,联合发布了AIGC向量数据库解决方案,旨在支持多样机器学习模型生成的海量向量数据,满足企业针对海量向量数据的高实时性查询、检索、
    的头像 发表于 11-11 15:10 369次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>携手</b>星环科技亮相进博会,以<b class='flag-5'>创新解决方案</b><b class='flag-5'>助力</b><b class='flag-5'>企业</b>数字<b class='flag-5'>化</b>发展

    英特尔与腾讯深化从云到端合作,以技术创新助力产业数智发展

    从产学研多维度加速技术创新助力产业智能化发展。 “ 作为数字产业向前发展的重要参与者,英特尔将基于多年来在行业中的探索和积累,持续创新,深
    的头像 发表于 09-09 13:10 332次阅读
    <b class='flag-5'>英特尔</b>与腾讯深化从云到端合作,以技术<b class='flag-5'>创新</b><b class='flag-5'>助力</b>产业数智<b class='flag-5'>化</b>发展

    鸿蒙智联再出发,携手伙伴共赢空间智能化,创造无限可能

    智能2.0亮相,带来升级的空间交互体验以及全新的后装解决方案,强调风格、个性,实现不破墙免布线,当天装当天用;2022年11月,华为全屋智能
    发表于 08-09 17:14

    英特尔携手视源股份、德晟达联手打造新一代 OPS 实施标准,推动智慧教育行业优化解决方案部署

    近日,英特尔宣布联手国内教育及视频会议解决方案领先企业视源股份(CVTE)与嵌入式系统方案 ODM 厂商德晟达共同升级
    的头像 发表于 08-04 20:55 329次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>携手</b>视源股份、德晟达联手<b class='flag-5'>打造</b>新一代 OPS 实施标准,推动智慧教育行业优化<b class='flag-5'>解决方案</b>部署

    英特尔x MAXHUB:以创新解决方案掀起“智能协作”新浪潮

    2023年7月20日,北京——英特尔亮相专业视听和集成体验展会InfoComm,不仅集中展示了多款基于英特尔技术与产品组合的远程协作解决方案,还宣布将携手生态伙伴MAXHUB,
    的头像 发表于 07-21 09:39 346次阅读
    <b class='flag-5'>英特尔</b>x MAXHUB:以<b class='flag-5'>创新解决方案</b>掀起“<b class='flag-5'>智能</b>协作”新浪潮