LinkedIn图数据库 LIquid：为9.3亿会员提供实时数据访问-电子发烧友网

最近，LinkedIn 分享了其图数据库 LIquid 是如何自动索引和实时访问会员、学校、技能、公司、职位、工作、事件等之间的关系数据的。这个知识图谱被称为 LinkedIn 的“Economic Graph”，有 2700 亿条边，并且还在不断增长，目前每秒处理 200 万次查询。

LinkedIn 将其“你可能认识的人（People You May Know，PYMK）”推荐系统从传统的 GAIA 系统迁移到了 LIquid。这一变化显著改善了每秒查询数（QPS）、延迟和 CPU 利用率。QPS 从 120 增加到 18000，延迟从超过 15 秒下降到平均 50 毫秒以下，CPU 利用率下降了 3 倍以上。LIquid 还引入了新的数据库索引技术，支持实时数据查询，实现了即时推荐。

图片来源：https://engineering.linkedin.com/blog/2023/how-liquid-connects-everything-so-our-members-can-do-anything

上图是系统的架构图，使用了 LIquid，可以以较小的延迟和可接受的硬件成本来执行图查询。通过 LIquid 对 Economic Graph 的查询生成数百个候选对象，并应用第二个排名函数。这个排名函数使用 Venice 的机器学习功能和 Apache Pinot 的分析见解来评分并选择最佳候选对象。过滤步骤为呈现和最终评分准备好了这个排名列表。

LIquid 的设计使其能够伸缩到当前十倍的规模，可以支持 LinkedIn 9.3 亿多会员的有机增长和新的语义领域。它提供 99.99% 的可用性，并可以自动根据图的大小和活动量的增加进行自动伸缩。

图数据库使用基于 Datalog 的可组合声明式查询语言，帮助开发人员高效地访问和使用数据。可组合语言能够让开发人员在现有的特性（叫作模块）上进行构建，声明式语言能够让开发人员专注于表达他们想要开发的东西，而 LIquid 自动化了高效的访问过程。开发人员因此可以快速变更数据集，大大减少了调整和更新数据库所需的时间。

LinkedIn 工程总监 Bogdan Artintescu 描述了 LIquid 的发展路线图：

要让会员能够做更多的事情，我们需要在回答会员的问题方面提供更加完善的能力。我们可以沿着两个方向做出改进。首先，复杂的查询和添加到 Economic Graph 的数据源的多样性将会驱动新特性的开发和呈现。其次，丰富数据将提高推理能力。这可以通过创建派生数据（通过确定性算法或概率机器学习方法）或通过知识图谱（KG）模式中更丰富的语义改进推理来实现。我们计划专注于高性能图形计算和分析，并建立一个 KG 生态系统，让我们的开发人员能够进一步增强会员体验。

LIquid 的成功激励了 LinkedIn 的其他团队和微软的姐妹团队将它作为图数据索引。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据库

数据库

+关注

关注
7

文章
3796

浏览量
64367
机器学习

机器学习

+关注

关注
66

文章
8408

浏览量
132580
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24691

原文标题：LinkedIn 图数据库 LIquid：为 9.3 亿会员提供实时数据访问

文章出处：【微信号：AI前线，微信公众号：AI前线】欢迎添加关注！文章转载请注明出处。

数据库加密办法

企业对于数据的重视程度不言而喻，也衍生出了数据=资产的概念。但是数据泄漏的事件频繁发生，为了保护数据资产，企业有必要对数据库做一些针对性的措

发表于 12-24 09:47 •16次阅读

数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

Mysql数据库故障： Mysql数据库表记录丢失。 Mysql数据库故障表现： 1、Mysql数据库表中无任何数据或只有部分

发表于 12-16 11:05 •124次阅读

<b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Mysql<b class='flag-5'>数据库</b>表记录丢失的<b class='flag-5'>数据</b>恢复流程

数据库数据恢复—MYSQL数据库ibdata1文件损坏的数据恢复案例

mysql数据库故障： mysql数据库文件ibdata1、MYI、MYD损坏。故障表现：1、数据库无法进行查询等操作；2、使用mysqlcheck和myisamchk无法修复数据库

发表于 12-09 11:05 •144次阅读

数据库数据恢复—通过拼接数据库碎片恢复SQLserver数据库

一个运行在存储上的SQLServer数据库，有1000多个文件，大小几十TB。数据库每10天生成一个NDF文件，每个NDF几百GB大小。数据库包含两个LDF文件。存储损坏，数据库不

发表于 10-31 13:21 •203次阅读

实时数据与数字孪生的关系

、处理和分析的数据。这种数据的特点是高频率、高速度和高准确性。在工业环境中，实时数据可以来自于各种传感器、设备、机器和系统，它们为企业提供了

发表于 10-25 14:42 •357次阅读

Oracle数据恢复—异常断电后Oracle数据库启库报错的数据恢复案例

Oracle数据库故障：机房异常断电后，Oracle数据库启库报错：“system01.dbf需要更多的恢复来保持一致性，数据库无法打开”。数据

发表于 09-30 13:31 •299次阅读

数据库数据恢复—Oracle数据库文件system01.dbf损坏的数据恢复案例

打开oracle数据库报错“system01.dbf需要更多的恢复来保持一致性，数据库无法打开”。

发表于 09-21 14:25 •323次阅读

数据库数据恢复—SQL Server数据库出现823错误的数据恢复案例

SQL Server数据库故障： SQL Server附加数据库出现错误823，附加数据库失败。数据库没有备份，无法通过备份恢复数据库。

发表于 09-20 11:46 •340次阅读

数据库数据恢复—SqlServer数据库底层File Record被截断为0的数据恢复案例

SQL Server数据库的数据无法被读取。经过数据库数据恢复工程师的初步检测，发现SQL Server数据库文件无法被读取的原因是底层

发表于 07-26 11:27 •379次阅读

数据库数据恢复—SQL Server数据库所在分区空间不足报错的数据恢复案例

SQL Server数据库数据恢复环境：某品牌服务器存储中有两组raid5磁盘阵列。操作系统层面跑着SQL Server数据库，SQL Server数据库存放在D盘分区中。

发表于 07-10 13:54 •485次阅读

数据库数据恢复—raid5阵列上层Sql Server数据库数据恢复案例

数据库数据恢复环境： 5块硬盘组建一组RAID5阵列，划分LUN供windows系统服务器使用。windows系统服务器内运行了Sql Server数据库，存储空间在操作系统层面划分了三个逻辑分区

发表于 05-08 11:43 •505次阅读

态势数据如何存储在数据库里面呢

、稳定的数据，强调维护数据的完整性、一致性 , 其性能目标是高系统吞吐量和低代价 , 但对处理的定时限制没有严格要求。而实时数据库系统需要结合实时数据处理技术和

发表于 04-22 16:46 •362次阅读

【数据库数据恢复】Oracle数据库ASM实例无法挂载的数据恢复案例

oracle数据库ASM磁盘组掉线，ASM实例不能挂载。数据库管理员尝试修复数据库，但是没有成功。

发表于 02-01 17:39 •519次阅读

应用方案：实时数据加密

应用方案：实时数据加密利用CPLD设计加密电路方便可行，能够较好地实现加密功能。AG32系列MCU产品，在芯片内部内置了CPLD逻辑，可以有效地满足各种数据采集需求，降低了客户的BOM成本。以下

发表于 01-15 08:57

2024年，国产数据库正酝酿新变局！

数字经济以及信息技术产业发展至关重要。据 Gartner 统计，2017年我国数据库软件市场规模为 120亿元。据大数据技术标准推进委员会数据

发表于 01-05 13:18 •451次阅读