0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Zilliz携手大模型生态企业玩转GDC 2024,向量数据库和RAG成行业焦点

焦点讯 来源:焦点讯 作者:焦点讯 2024-03-26 11:14 次阅读

3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。Zilliz 作为向量数据库赛道的领军者,受邀参与了此次活动,不仅在不同形式的活动中进行了 3 场主题分享,还与百川智能、Dify.AI、Moonshot AI 等公司一同在「大模型展示及研讨专区」的产品互动展台,与来自各地的开发者进行互动。

wKgaomYCPY6AHc8YAAMZpAKZvbM072.png

据悉,本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市徐汇区人民政府、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会共同主办。

全球开发者先锋大会(GDC)缘起总.理在达沃斯世界经济论坛打 CALL 的世界人工智能大会(WAIC),作为 WAIC 聚焦科技和人才力量的重要板块,GDC 已发展成为全球开发者的盛大节日、顶尖技术趋势的风向标。向量数据库赛道正是 AIGC 时代的重要技术风向标,Zilliz 在现场向全球的开发者展示了其在顶尖向量数据库技术的多重探索。

wKgZomYCPY-AaaWkAAPdw8NrQMQ787.png

Zilliz 资深解决方案架构师沈亮以《百亿级向量数据库架构创新与优化之路》的主题进行了分享。他表示,向量数据库最早诞生于 2019 年,由 Zilliz 公司推出并开源了全球首款向量数据库 Milvus。在那个时期,向量数据库的功能相对比较简单,主要是基于向量检索库 Faiss 的基础上,封装了远程过程调用(RPC)接口,并支持了基于 Write-Ahead Logging(WAL)的持久化能力。相比于传统的向量检索方法,Milvus 1.0 的最大意义在于解耦了业务逻辑、模型和数据存储这三者之间的紧密关联。这意味着应用开发者不再需要关注底层基础设施的维护工作,这些工作包括但不限于集群的部署、数据的持久化和数据的迁移等。因此,Milvus 1.0 为许多用户提供了从传统烟囱式的人工智能开发模式向大模型时代。

随着大模型技术的蓬勃发展,向量数据库开始进入 2.0 时代,更多的个人开发者涌入赛道,对向量数据库的关注也逐渐迁移到开发效率、部署简单以及面向大模型加强场景的功能需求。向量数据库绝不仅仅是用来进行简单的向量检索,要想真正提升开发者的开发效率和使用成本,需要系统开发者深入理解硬件、存储、数据库、AI、高性能计算、分布式系统、编译原理、云原生等,以确保其稳定性、性能和易用性。在此基础上,Zilliz 推出了Zilliz Cloud,可提供全托管的 SaaS 及 BYOC 向量数据库服务,具备深度优化、开箱即用的 Milvus 体验。使用 Zilliz Cloud 可以轻松构建百亿级向量数据库,分钟级部署和扩展向量搜索服务,并由全球最专业的向量数据库团队提供运维、优化、及综合支持。

wKgaomYCPZCAbLk4AAHDzlWM3oY956.png

Zilliz 开发者生态及市场运营负责人 Jerry 首先进行了主题为《走进向量数据库和 RAG ——让 LLMs 停止幻觉》的分享。Jerry 表示,过去一年,RAG 在技术层面发展迅速,为向量数据库赛道添了一把火。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。

具体来看,大模型的局限性包括:其一,缺乏领域特定信息:LLM 仅基于公开数据集训练;缺乏领域特定信息或专有信息等非公开数据。其二,容易产生幻觉:LLM 只能根据其现有数据提供信息和答案;如果超过该范围,LLM 会提供错误或捏造的信息。其三,无法获取最新信息:LLM 训练成本十分高昂,无法及时更新其知识库。其四,不变的预训练数据:LLM 使用的预训练数据可能包含过时或不正确的信息,且这些数据无法更正或删除。

向量数据库可有效针对解决上述问题,例如针对缺乏领域特定信息的问题,可利用向量数据库建立知识库,拓展认知边界;针对无法获取最新信息的问题,可以利用向量数据库为大模型建立记忆、及时更新。

在此基础上,RAG 技术栈应运而生,通过 LLM、向量数据库和提示词的相互配合,让 LLM 停止幻觉。此外,Jerry 还介绍了向量数据库的其他应用场景,包括图片搜索、视频搜索、文本搜索、数据去重、跨模态搜索、推荐系统、问答系统、版权保护、网络安全、AI 制药等。

wKgZomYCPZGAHV1IAACJgAApsvA693.png

在《2024 年,重新再来说说关于向量数据库的那些事儿》主题分享中,Jerry 回顾了向量数据库从小众赛道到爆火的全过程,并提及了外界对于向量数据库和 RAG 的疑问。他表示,大模型技术正在改变世界,但无法改变世界的运行规律。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的完美平衡。当大型企业将生成式人工智能投入生产时,需要在控制成本的同时保持最佳的响应质量。在此情况下,RAG 技术和向量数据库依然是实现这一目标的重要工具。

最后,Jerry 提到,Zilliz 最近面向 AI 初创企业推出了一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。届时将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持,符合要求的团队可获得独家资源与支持。欢迎各位开发者访问 Zilliz 中文官网首页点击 Zilliz AI 初创计划,与 Zilliz 一起共建 AI 生态!

审核编辑 黄宇


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3759

    浏览量

    64266
  • 大模型
    +关注

    关注

    2

    文章

    2314

    浏览量

    2456
收藏 人收藏

    评论

    相关推荐

    科技云报到:大模型时代下,向量数据库的野望

    科技云报到:大模型时代下,向量数据库的野望
    的头像 发表于 10-14 17:18 202次阅读

    使用OpenVINO和LlamaIndex构建Agentic-RAG系统

    解决大语言模型在知识时效性和专业性上的不足。但同时传统的 RAG 系统也有它的缺陷,例如灵活性较差,由于 RAG 会过分依赖于向量数据库的检
    的头像 发表于 10-12 09:59 194次阅读
    使用OpenVINO和LlamaIndex构建Agentic-<b class='flag-5'>RAG</b>系统

    软通动力数据库全栈服务,助力企业数据库体系全面升级

    。在企业节与"数博会"展区,软通动力受邀分享数据库专业服务全栈解决方案,并重点展示以全栈云服务为核心的数智化能力。 软通动力高级数据库服务专家刘江云在开放演讲中,分享了软通动力数据库
    的头像 发表于 09-05 15:30 283次阅读
    软通动力<b class='flag-5'>数据库</b>全栈服务,助力<b class='flag-5'>企业</b><b class='flag-5'>数据库</b>体系全面升级

    自研创新 数智未来 2024中国数据库技术大会盛大召开

    2024年8月22~24日,由IT168联合旗下ITPUB、ChinaUnix两大技术社区主办的第15届中国数据库技术大会(DTCC2024)在朗丽兹西山花园酒店隆重召开。 数字化创新
    的头像 发表于 08-27 18:07 588次阅读
    自研创新 数智未来 <b class='flag-5'>2024</b>中国<b class='flag-5'>数据库</b>技术大会盛大召开

    DTCC2024前瞻:天翼云数据库专家共话TeleDB发展蓝图

    数据库是IT基础设施领域重要的组成部分,天翼云紧跟数据库行业技术方向与创新趋势,强化核心技术的自研实力,助力企业释放数据价值。在8月22日-
    的头像 发表于 08-19 14:53 297次阅读
    DTCC<b class='flag-5'>2024</b>前瞻:天翼云<b class='flag-5'>数据库</b>专家共话TeleDB发展蓝图

    如何手撸一个自有知识RAG系统

    用于自然语言处理任务,如文本生成、问答系统等。 我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统 数据收集 建立知识 向量检索 提示词与
    的头像 发表于 06-17 14:59 522次阅读

    模型卷价格,向量数据库“卷”什么?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 05-23 09:24 1740次阅读
    大<b class='flag-5'>模型</b>卷价格,<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”什么?

    什么是RAGRAG学习和实践经验

    高级的RAG能很大程度优化原始RAG的问题,在索引、检索和生成上都有更多精细的优化,主要的优化点会集中在索引、向量模型优化、检索后处理等模块进行优化
    的头像 发表于 04-24 09:17 739次阅读
    什么是<b class='flag-5'>RAG</b>,<b class='flag-5'>RAG</b>学习和实践经验

    搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

    在美国硅谷圣何塞召开的 NVIDIA GTC 大会上,全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革命性的向量
    的头像 发表于 04-01 14:33 447次阅读
    搭载英伟达GPU,全球领先的<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>公司<b class='flag-5'>Zilliz</b>发布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>

    与NVIDIA深度参与GTC,向量数据库大厂Zilliz与全球顶尖开发者共迎AI变革时刻

    近日,备受关注的 NVIDIA GTC 已拉开序幕。来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来,全球领先的向量数据库公司 Zilliz 也不例外。作为
    的头像 发表于 03-26 11:01 393次阅读

    阿里云推出企业级大模型RAG系统

    在国际AI大数据峰会上,阿里云重磅推出了企业级大模型检索增强生成(RAG)解决方案。这一解决方案旨在为企业提供更强大、更智能的大
    的头像 发表于 02-05 09:54 1108次阅读

    腾讯云把向量数据库“卷”到哪一步了?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 01-15 09:49 1550次阅读
    腾讯云把<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”到哪一步了?

    2024年,国产数据库正酝酿新变局!

    随着互联网、5G、AI技术的飞速发展,海量数据的持续激增,数据资产的核心价值正在凸显,大数据时代数据库行业也迎来了快速增长。 作为
    的头像 发表于 01-05 13:18 415次阅读
    <b class='flag-5'>2024</b>年,国产<b class='flag-5'>数据库</b>正酝酿新变局!

    诚邀报名 | AI 向量、云原生、开源,今年的数据库热点技术都在这里

    训练和推理的精准度对数据和信息的存储、检索、处理提出了更高的要求。为此,存算分离、向量数据库、图数据库、分布式数据库和开源
    的头像 发表于 12-20 20:48 329次阅读
    诚邀报名 | AI <b class='flag-5'>向量</b>、云原生、开源,今年的<b class='flag-5'>数据库</b>热点技术都在这里

    诚邀报名 | AI 向量、云原生、开源,今年的数据库热点技术都在这里

    和推理的精准度对数据和信息的存储、检索、处理提出了更高的要求。为此,存算分离、向量数据库、图数据库、分布式数据库和开源
    的头像 发表于 12-13 16:05 320次阅读