0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

增强AI能力:谷歌云在托管数据库中集成向量搜索

jf_WZTOguxH 来源:AI前线 2023-07-19 15:38 次阅读

谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了对 pgvector 的支持。这个扩展为托管数据库带来了向量搜索操作,允许开发人员存储大型语言模型(LLM)生成的向量嵌入并执行相似性搜索。

Cloud SQL 和 AlloyDB 现在可以与 Vertex AI 上的生成性 AI 服务配对,帮助创建能够感知应用程序和用户状态的 AI 应用程序。谷歌高级产品经理 Sandhya Ghai 和产品经理 Bala Narasimhan 解释说:

向量嵌入是一种数值表示,通常用于将复杂的用户生成内容(如文本、音频视频)转换为易于存储、操作和索引的形式。这些表示由嵌入模型生成,如果两个内容在语义上相似,它们各自的嵌入就会在嵌入向量空间中彼此相邻。然后,向量嵌入会被索引,被用于基于相似性进行有效的数据过滤。

例如,开发人员可以使用 Vertex AI 的预训练模型在文本和图像之间生成嵌入,并将它们存储并索引到数据库中,简化查找相似记录的过程。

用户现在可以使用 CREATE EXTENSION 命令在现有的数据库中安装 pgvector 扩展:

postgres=> CREATE EXTENSION IF NOT EXISTS vector;
CREATE EXTENSION


postgres=> CREATE TABLE embeddings(
 id INTEGER,
 embedding vector(3)
);
CREATE TABLE


postgres=> INSERT INTO embeddings
    VALUES
        (1, '[1, 0, -1]'),
        (2, '[1, 1, 1]'),
        (3, '[1, 1, 50]');
INSERT03

正如 Ghai 和 Narasimhan 所解释的那样,这一新功能还可以帮助开发人员利用预训练的 LLM:

我们需要了解的是,LLM 没有状态的概念……嵌入允许你将大型上下文(如文档或历史聊天记录)存储在数据库中,并过滤它们,以便查找最相关的信息。然后,你可以将最相关的聊天历史记录或文档片段输入模型来模拟长期记忆和业务特定知识。

谷歌云发布了一个 Colab Notebook 和一个视频,用 pgvector、开源框架 LangChain 和 LLM 构建 AI 驱动的应用程序。谷歌高级软件工程师 Saket Saurabh 演示了如何在示例 Python 应用程序中添加生成式 AI 功能,他写道:

pgvector 扩展还引入了用于对向量执行相似性匹配的新运算符,你可以用它查找语义上相似的向量。这样的运算符有两个:
‘<->’:返回两个向量之间的欧几里得距离…… ‘<=>’:返回两个向量之间的余弦距离

在过去的几个月中,谷歌云并不是唯一一个瞄准向量数据库的云供应商,Amazon RDS for PostgreSQL 也支持 pgvector 扩展,微软还展示了如何将 Azure Data Explorer(ADX)作为向量数据库,并讨论了几种连接到向量数据库的连接器


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 连接器
    +关注

    关注

    98

    文章

    14585

    浏览量

    136788
  • AI
    AI
    +关注

    关注

    87

    文章

    31155

    浏览量

    269487
  • 数据库
    +关注

    关注

    7

    文章

    3827

    浏览量

    64515

原文标题:增强AI能力:谷歌云在托管数据库中集成向量搜索

文章出处:【微信号:AI前线,微信公众号:AI前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据库是哪种数据库类型?

    数据库是一种部署虚拟计算环境中的数据库,它融合了计算的弹性和可扩展性,为用户提供高效、灵活的数据库
    的头像 发表于 01-07 10:22 83次阅读

    一般企业购买服务器带数据库吗?

    购买服务器是否带数据库,这主要取决于所选择的服务提供商及其具体的套餐或服务内容。一般来说,服务器本身是一个提供计算能力、存储空间和网络
    的头像 发表于 01-06 10:25 62次阅读

    华为荣登Gartner®数据库挑战者象限

    领域的强劲实力与广阔前景。 Gartner的数据库管理系统魔力象限报告,一直是数据和分析领域决策者的重要参考。该报告通过对全球范围内广受认可的
    的头像 发表于 12-31 13:57 142次阅读

    托管可以操作数据库吗?安全性如何

    托管可以操作数据库托管环境中,开发者可以通
    的头像 发表于 12-11 13:35 96次阅读

    数据库主机哪个好一点?

    、可扩展性和成本效益,但主机更侧重于计算能力数据库则侧重于数据安全性和易管理性。以下UU
    的头像 发表于 12-04 13:50 149次阅读

    数据库服务器哪个便宜一些?

    服务器的价格区间相对更广泛,因为用户可以根据实际需求选择不同配置和性能的服务器。而数据库的价格则更多地依赖于数据库类型和规格。相同配置
    的头像 发表于 11-12 10:55 217次阅读

    数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

    试图恢复数据库,发现有数个ndf文件大小变为0KB。 虽然NDF文件大小变为0KB,但是NDF文件磁盘上还可能存在。可以尝试通过扫描&拼接数据库碎片来恢复NDF文件,然后修复数据库
    的头像 发表于 10-31 13:21 268次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—通过拼接<b class='flag-5'>数据库</b>碎片恢复SQLserver<b class='flag-5'>数据库</b>

    数据库可以租用吗?完整租用流程来了

    数据库是可以租用的,这是一种合法且便捷的数据存储和管理方式。数据库服务提供商提供的各种服
    的头像 发表于 10-28 09:54 188次阅读

    科技报到:大模型时代下,向量数据库的野望

    科技报到:大模型时代下,向量数据库的野望
    的头像 发表于 10-14 17:18 268次阅读

    一文详解企业上数据库是干嘛的

    业上数据库是企业将其数据库系统从传统的本地数据中心迁移到由第三方服务提供商管理的远程服务器上的过程。这样做的目的通常是为了提高
    的头像 发表于 09-13 11:49 349次阅读

    大模型卷价格,向量数据库“卷”什么?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 05-23 09:24 1803次阅读
    大模型卷价格,<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”什么?

    搭载英伟达GPU,全球领先的向量数据库公司Zilliz发布Milvus2.4向量数据库

    美国硅谷圣何塞召开的 NVIDIA GTC 大会上,全球领先的向量数据库公司 Zilliz 发布了 Milvus 2.4 版本。这是一款革命性的向量
    的头像 发表于 04-01 14:33 493次阅读
    搭载英伟达GPU,全球领先的<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>公司Zilliz发布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>

    与NVIDIA深度参与GTC,向量数据库大厂Zilliz与全球顶尖开发者共迎AI变革时刻

    近日,备受关注的 NVIDIA GTC 已拉开序幕。来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来,全球领先的向量数据库公司 Zilliz 也不例外。作为去年被
    的头像 发表于 03-26 11:01 425次阅读

    谷歌Vertex AI搜索医疗保健领域正式推出

    谷歌公司近日宣布,其Vertex AI搜索功能在医疗保健领域正式亮相,并已成功与MedLM以及医疗保健数据引擎(HDE)完成集成。这一创新功
    的头像 发表于 03-22 14:08 641次阅读

    腾讯向量数据库“卷”到哪一步了?

    被大模型“带飞”这一年,向量数据库才刚刚写下序言
    的头像 发表于 01-15 09:49 1599次阅读
    腾讯<b class='flag-5'>云</b>把<b class='flag-5'>向量</b><b class='flag-5'>数据库</b>“卷”到哪一步了?