0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第四代英特尔® 至强® 可扩展处理器助力星环科技分布式向量数据库 Transwarp Hippo 释放大模型价值

英特尔中国 来源:未知 2023-12-01 20:40 次阅读

大语言模型主导的生成式 Al 开始渗透到各行各业,并正在与企业应用结合,重塑企业应用中人与数据的交互方式,帮助企业释放生产力价值。例如,在金融行业,大模型可以帮助银行更好地分析客户情况,提供更加精准的金融服务;在医疗诊断领域,大模型通过分析大量的医学数据,提高诊断的准确性和效率。然而,企业在将大模型与企业应用相融合过程中,还存在着一些挑战:

01存在" Al 幻觉"问题

大模型训练周期长且输入 token 存在限制,无法及时地将实时、快速变化的信息数据和领域知识内置到模型当中,大模型存在“答非所问”现象。

02海量数据处理性能不足

向量维度逐渐增高,数据计算量呈指数级上升,数据处理的实时性要求不断提高,大模型的数据处理能力和性能存在很大挑战。

03总体拥有成本 (TCO)高

日益增长的数据和计算压力,以及模型二次训练的高成本,给企业大模型构建和运营等带来了巨大的 TCO 压力。

大语言模型正迅速地应用于各行各业,改变用户与企业产品和服务之间的交互方式,帮助企业提高效率、降低成本、优化流程。尽管大模型具有巨大的潜力,但其训练、维护和技术难度要求极高,成本也非常昂贵。通用大模型在应用于特定领域时普遍存在回答不精准,“答非所问”的现象,而专属大模型又存在训练时间较长,算力需求较高等问题。通过引入向量数据库,实现大模型+向量数据库的架构为企业解决上述问题提供了有效的解决方案。

星环科技企业级云原生分布式向量数据库TranswarpHippo支持存储、索引以及管理来自深度神经网络或者各类机器学习模型所生成的海量向量数据,提供向量相似度检索、混合检索等能力,能够拓展大模型的时间边界和空间边界,使得大模型拥有“长期记忆”的同时保护数据隐私,帮助企业用户解决大模型应用时实时性不够、二次训练周期长成本高、答非所问等问题。

为了更好地帮助企业应对大模型时代海量、多维向量数据的高并发和实时计算等挑战,星环科技与英特尔合作,推出了基于第四代英特尔至强可扩展处理器TranswarpHippo分布式向量数据库解决方案,通过软硬件深度融合,满足大模型时代海量、高维向量的存储和计算需求,为用户构建高性能向量数据库系统和大模型应用提供了重要依据和选型方向。

同时,星环科技作为一家企业级大数据基础软件公司,为企业提供大模型应用开发全周期的技术和产品,通过TranswarpHippo向量数据库和大模型统一运营管理平台 Sophon LLMOps 、金融大模型Transwarp Infinity“星环无涯” 、大数据分析大模型 Transwarp Solar “星环求索”等产品组合,帮助每个企业更快、更精确地打造真正符合实际需求的专属领域大模型。

软硬件深度融合,激发强劲性能

第四代英特尔至强可扩展处理器是英特尔公司 2023 年发布的数据中心处理器,凝聚了英特尔数十年来在数据中心、网络智能边缘等领域积累的技术经验,采用全新架构,提升了单核性能,每路配备多达 60 个内核支持 8 通道 DDR5 内存,有效提升了内存带宽与速度,并通过 PCle 5.0 (80 个通道)实现了更高的 PCle 带宽提升。第四代英特尔至强可扩展处理器提供了出色性能和安全性。以结果为导向、工作负载至上,为 AI、云、网络、边缘和全球领先的超级计算机带来全新功能。

第四代英特尔 至强 可扩展处理器与星环科技 Transwarp Hippo 分布式向量数据库软硬件融合的深度优化:

使用 AVX512 扩展指令集重写向量距离计算函数,显著降低向量计算需要的 CPU 指令数量与 CPU 时钟周期,充分发挥第四代英特尔 至强 可扩展处理器高内存带宽的优势 NUMA 友好的向量计算负载调度算法,避免 CPU 远程内存访问造成 CPU 阻塞,充分发挥第四代英特尔 至强 可扩展处理器多核性能的优势 基于数据离散度的浮点数矢量化算法,充分利用 VNNI 指令集,进一步提升向量计算性能

通过配置第四代英特尔至强可扩展处理器,星环科技 Transwarp Hippo 在向量索引层面实现了 20%~30%1的性能提升,可全面满足个性化推荐、智能问答、大模型应用等场景对向量数据库系统计算能力的要求。

wKgZomVp1VGAE_IDAAJUj_XzLkg473.png

图1. 基于第四代英特尔至强可扩展处理器 AVX512 的 Hippo向量索引库与开源 Faiss 查询性能1

wKgZomVp1VGAE_IDAAJUj_XzLkg473.png

图2. 基于第四代英特尔至强可扩展处理器 AVX2/AVX512 的Hippo 向量索引库查询性能1

用户收益 专业向量数据库——解决大模型的局限性

通过将最新的信息语料存储在Transwarp Hippo 向量数据库中,能够让大模型保持信息实时性,使大模型拥有“长期记忆”;协助企业解决大模型数据泄露隐私问题,拓展大语言模型的空间边界;通过多模态信息向量化存储以及近似检索、混合检索等能力帮助大模型解决 “Al 幻觉”问题。

高扩展——敏捷地满足大模型发展需求

随着大模型场景的深入化和丰富化,数据多模态加剧,如文本、图像、音频视频等,向量数据维度也逐渐增高,数据量呈现爆炸式增长。星环科技 Transwarp Hippo 可以按需水平扩展,利用容器技术支持服务弹性扩缩容,可以满足企业大模型未来发展对海量向量数据的存储和计算需求。

更高性能——应对大模型应用带来的挑战

海量、高维度向量数据处理,以及低时延和高精确度等要求给向量数据库性能带来了巨大挑战。通过与第四代英特尔 至强 可扩展处理器的深度融合,星环科技Trans warp Hippo 可以更好地帮忙用户应对大模型应用带来的挑战,更高效地挖掘大模型应用价值。

降低 TCO ——提升大模型投资回报率

基于星环科技Transwarp Hippo 向量数据库可以大幅降低大模型二次训练成本,加速大模型业务上线和创新。同时,自带Embedding工具和模型、高扩展、以及与第四代英特尔 至强 可扩展处理器深度融合带来的更高性能等特性可满足企业业务发展需求,提升大模型建设的投资回报率。

展 望

基于第四代英特尔至强可扩展处理器的星环科技 Transwarp Hippo 分布式向量数据库显著提升了数据库系统的整体性能表现,使其成为用户构建大语言模型方案的理想选择。借助该方案,用户可以便捷、高效打造大模型应用,激发更多的 AI 场景业务。

星环科技与英特尔将继续深化软硬件技术融合能力,围绕 Transwarp Hippo 向量数据库,结合星环科技大模型开发工具 Sophon LLMOps、金融大模型 Transwarp Infinity “星环无涯”、大数据分析大模型 Transwarp SoLar “星环求索”等产品,为用户提供大模型应用构建的全栈基础软件和工具,帮助金融、能源、交通等各个行业的企业更高效、更精确地打造专属领域大模型,促进生产力提升,加速业务创新和价值实现。

参考资料

1截止 2023 年10月由星环科技与英特尔共同开展的测试。测试配置:双路第四代英特尔 至强铂金 8480+处理器,56核,启用睿频加速技术,关闭超线程,512 GB总存(16x32 GB DDR4 3200 MHz),BIOS EGSDCRB1.SYS.0090.D03.2210040200, ucode 0x2b0000c0,1x MT27800 Family [ConnectX-5,25Gb/s],2x 480 GB英特尔SSDSCKKB48,Red Hat Enterprise Linux 8.6 (0otpa), 4.18.0-372.9.1.el8.x86_64,Transwarp Hippo 1.2,Faiss 1.7.4.实际性能受使用情况、配置和其他因素的差异影响。更多信息请见 www.intel.com/Performancelndex

2,3,4,5实际性能受使用情况、配置和其他因素的差异影响。更多信息请见www.intel. com/Performancelndex


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    60

    文章

    9608

    浏览量

    169946
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10552

    浏览量

    207759

原文标题:第四代英特尔® 至强® 可扩展处理器助力星环科技分布式向量数据库 Transwarp Hippo 释放大模型价值

文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配

    近日,浪潮信息分布式存储AS13000完成英特尔至强6能效核处理器适配,实现每瓦性能提升2.3倍,以更高的效率、更优的成本满足海量多态数据
    的头像 发表于 06-19 10:05 407次阅读
    浪潮信息<b class='flag-5'>分布式</b>存储AS13000完成<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6能效核<b class='flag-5'>处理器</b>适配

    借助英特尔® QAT从而显著提升网络和存储应用的性能

    全新第四代和第五英特尔® 至强® 扩展处理器内置
    的头像 发表于 03-18 16:25 416次阅读
    借助<b class='flag-5'>英特尔</b>® QAT从而显著提升网络和存储应用的性能

    第五英特尔至强处理器,AI特化的通用服务CPU

    计算性能的同时,也新增了AI相关的新指令集,诸如AXM、AVX等。 第五至强扩展处理器架构剖析 2023年年底发布的第五
    的头像 发表于 03-18 08:14 3189次阅读
    第五<b class='flag-5'>代</b><b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>处理器</b>,AI特化的通用服务<b class='flag-5'>器</b>CPU

    英特尔展示下一至强处理器助力vRAN性能显著提升

    -- 与ATT和爱立信亦宣布计划与英特尔合作部署和扩展Open RAN服务。最近,Telus和三宣布计划部署基于第四代英特尔®
    的头像 发表于 03-01 15:43 210次阅读
    <b class='flag-5'>英特尔</b>展示下一<b class='flag-5'>代</b><b class='flag-5'>至强</b><b class='flag-5'>处理器</b>,<b class='flag-5'>助力</b>vRAN性能显著提升

    英特尔至强处理器优化升级,助力打造未来高能效数据中心

    英特尔最新发布的第五至强扩展处理器,拥有多达64个核心,性能提升高达1.4倍。
    的头像 发表于 02-26 17:39 423次阅读

    高性能存储实现新突破的英特尔至强处理器

    基于第四代英特尔 至强 扩展处理器的 Curve 高性能
    发表于 02-26 14:01 237次阅读
    高性能存储实现新突破的<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>处理器</b>

    第五英特尔至强扩展处理器,为AI加速而生

    与生态伙伴分享了该全新产品在京东云、百度智能云、阿里云、火山引擎的成功实践及其应用价值。 第五英特尔 至强
    的头像 发表于 12-16 16:15 296次阅读
    第五<b class='flag-5'>代</b><b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>可</b><b class='flag-5'>扩展</b><b class='flag-5'>处理器</b>,为AI加速而生

    第五英特尔® 至强® 扩展处理器助力科技分布式向量数据库 Transwarp Hippo 实现大幅性能提升

    与上一产品相比,第五英特尔 至强 扩展处理器
    的头像 发表于 12-16 16:15 336次阅读
    第五<b class='flag-5'>代</b><b class='flag-5'>英特尔</b>® <b class='flag-5'>至强</b>® <b class='flag-5'>可</b><b class='flag-5'>扩展</b><b class='flag-5'>处理器</b><b class='flag-5'>助力</b><b class='flag-5'>星</b><b class='flag-5'>环</b>科技<b class='flag-5'>分布式</b><b class='flag-5'>向量</b><b class='flag-5'>数据库</b> <b class='flag-5'>Transwarp</b> <b class='flag-5'>Hippo</b> 实现大幅性能提升

    第五英特尔至强扩展处理器,为AI加速而生

    今日,在以“AI无处不在 创芯无所不及”为主题的2023英特尔新品发布会暨AI技术创新派对上,英特尔正式推出第五英特尔® 至强®
    发表于 12-16 15:53 236次阅读
    第五<b class='flag-5'>代</b><b class='flag-5'>英特尔</b><b class='flag-5'>至强</b><b class='flag-5'>可</b><b class='flag-5'>扩展</b><b class='flag-5'>处理器</b>,为AI加速而生

    星辰天合发布全新一全闪分布式存储,英特尔® QAT及英特尔® DSA助其提供非凡性能

    统一存储“飞 XINFINI 9000”。英特尔与星辰天合联合创新,将第四代英特尔 至强
    的头像 发表于 11-24 20:00 600次阅读
    星辰天合发布全新一<b class='flag-5'>代</b>全闪<b class='flag-5'>分布式</b>存储,<b class='flag-5'>英特尔</b>® QAT及<b class='flag-5'>英特尔</b>® DSA助其提供非凡性能

    英特尔联合Verizon 展示行业领先 vRAN 解决方案

    近日,英特尔和Verizon基于三vRAN解决方案完成了业界首次数据会话。该解决方案基于集成英特尔 vRAN Boost的第四代
    的头像 发表于 11-17 20:00 357次阅读

    英特尔联合Verizon 展示行业领先vRAN解决方案

    世界最高的技术及通讯提供商verizon是三vran解决方案(基于集成英特尔®vRAN Boost的第四代英特尔®至强®
    的头像 发表于 11-13 11:47 413次阅读

    第四代至强® 扩展处理器助青云 QingCloud 新一e4云服务实现性能突破

    " 第四代英特尔 至强 扩展处理器内置了强大的加速
    的头像 发表于 10-13 21:15 615次阅读
    <b class='flag-5'>第四代</b><b class='flag-5'>至强</b>® <b class='flag-5'>可</b><b class='flag-5'>扩展</b><b class='flag-5'>处理器</b>助青云 QingCloud 新一<b class='flag-5'>代</b>e4云服务<b class='flag-5'>器</b>实现性能突破

    第四代英特尔® 至强® 扩展处理器赋能下一边缘内容分发网络

    ● 面向网络优化的第四代英特尔 至强 处理器具备更多内核、更快 I/O 和面向负载均衡、复制转发数据操作和加解密
    的头像 发表于 08-19 11:15 418次阅读

    第四代英特尔至强扩展处理器,为全新AWS EC2 M7i-flex和M7i实例带来更高性能

    ,该实例具备领先的总体拥有成本(TCO)和众多CPU内置加速,以支持人工智能、数据库、网络和企业应用等关键工作负载。 “ 英特尔与AWS密切合作,让更多客户能够使用我们功能丰富的第四代
    的头像 发表于 08-04 20:55 557次阅读