如何借助TigerGraph机器学习工作台加速企业BI-电子发烧友网

什么是图数据库，为什么要关心图？

做出正确的商业决策需要了解任何一个行动或交易之间的关系，因为它们彼此相关。许多企业、数据分析公司和数据科学家正在寻找新的方法来探索连接和关系，看看我们的数据能给我们带来什么额外的见解。

借助图分析，我们认识到，所有的数据其实都代表了现实世界中的一些东西，而现实世界中的几乎所有东西都以某种方式联系在一起。从关系中找到这些新的模式，可以用来为电子商务网站打造更好的产品推荐，使银行在欺诈发生之前找到潜在欺诈者，或者让制造企业找到提高供应链效率的方法。

TigerGraph Cloud是业界首个也是唯一一个分布式原生图数据库即服务，使用户能够更容易地加速采用图，实时处理分析和事务性工作负载。通过最新的3.8版本，你还可以在TigerGraph Cloud上配置你的ML Workbench Jupyter notebook，为你的图数据库和图机器学习开发环境提供一站式体验。

案例：图增强的ML模型检测欺诈行为

世界各地的公司正在投资于图，将其作为一种竞争优势。图算法和机器学习领域的研究表明，通过将数据构建在一个固有的捕捉上下文和关系的图结构中，可以大大改善预测模型的质量。特别是在欺诈领域，图增强的机器学习模型可以学习欺诈交易和行为人之间的潜在关系模式，而传统的ML方法（如XGBoost模型）则无法捕捉。

在这篇博客中，我们将探讨如何应用图算法和图特征来解决欺诈检测问题。我们将展示如何用TigerGraph构建你的图数据集，然后我们将通过一个Jupyter notebook的例子，用GNN模型构建一个端到端的欺诈检测应用程序，使用Ethereum数据集，其中包含账户（有正面和负面标签）和它们之间的交易。下面是schema的样子：

在TigerGraph Cloud上构建你的图

在任何模型开发之前，我们首先需要构建你的图。在这个例子中，我们将使用TigerGraph Cloud的免费版本，这是业界第一个也是唯一一个原生并行图数据库即服务。

要开始使用TigerGraph数据库集群，你只需要通过选择硬件配置来完成集群配置过程。

在高级设置部分，确保启用机器学习工作台，然后在入门套件中选择图机器学习，这样它就包括在你的配置集群中。(注意：对于这个版本，我们将只支持单服务器配置，即分区因子=1)

TigerGraph云上的机器学习工作台

一旦你的图数据库被配置好了，你将需要添加一个用户和密码，以便用机器学习工作台连接到数据库。只需从左边的 “Clusters “选项卡上点击你刚刚配置的集群的 Access Management”，然后用你的凭证点击 “Add User”。

一旦你添加了一个用户，你现在可以直接利用机器学习工作台，点击左侧面板上的集群，然后点击”Tools” 》 “Machine Learning Workbench”。

一个新的浏览器窗口将被打开，你将登陆到机器学习工作台的Jupyter服务器。

TigerGraph 机器学习工作台有很多很好的教程，包括如何使用pyTigerGraph使用我们的ML功能的例子，运行我们图数据科学库的算法，以及端到端的应用。
你可能已经听说了最近在人工智能/ML方面的图谱神经网络的突破。在这篇博客中，我们将展示利用我们内置的python功能（如图数据分区、数据导出/批处理和图特征工程）建立一个GNN模型是多么容易。该notebook 可以在下面路径找到：GML→ Applications → Fraud_Detection → Fraud_Detection.ipynb.

在运行任何代码之前，你首先需要确保config.json中的用户名和密码（在Jupyter服务器的root文件夹中）被相应地更新为你刚刚从tgcloud.io创建的新用户。

准备你的图数据集

现在，我们已经准备好与TigerGraph云数据库实例建立连接，只需运行以下代码，并将Ethereum 数据集导入到你的实例。

图特征工程

像任何其他监督下的机器学习模型一样，GNN需要训练、验证和测试集来开发模型。ML Workbench通过一个简单的命令使数据分区变得简单。我们将对你的图数据进行分区，同时保留你的数据集的关系。

ML workbench 包括TIgerGraph的图数据科学库中的相当多的图算法来进行特征工程。这个notebook 所强调的关键功能是：

listAlgorithm()：如果你输入算法的类别（如中心性），它将打印指定类别的可用算法；否则它将打印所有可用的算法类别。

installAlgorithm()：获取算法的名称作为输入，如果该算法尚未安装，则安装该算法。

runAlgorithm()：获取算法名称和参数以运行该算法。如果该算法尚未安装，并且存在于TigerGraph的图数据科学库中，该算法将自动安装查询语句，并在图中创建必要的schema属性。

下面的代码显示了如何使用Featurizer来获得PageRank作为一个特征。你也可以通过运行你自己的GSQL查询语句，并通过Featurizer运行它，来定义你自己的自定义特征。

现在我们已经完成了特征工程，下一步是使用我们的Neighbor Loader函数导出你的训练、验证和测试数据集。你可以用我们的Neighbor Loader函数定义你的采样策略，如批次大小、跳数和邻居数。

训练你的GNN模型

现在，我们已经完成了图特征工程，并将所有的数据导出到你的机器学习工作台环境，以训练机器学习模型。

我们拥护开源社区，这就是为什么我们把TigerGraph ML Workbench与一些最流行的深度学习框架兼容，如PyTorch Geometric和Tensorflow。注意在上面的代码中，我们直接将你的关联数据以output_format参数中指定的PyG格式导出，你将能够直接利用PyG来训练一个GNN模型，比如Graph Attention Network（ (GATs）算法。请看下面的例子：

一旦你的模型训练完成，你就可以对你的模型进行推理，看看一个欺诈者是如何通过其网络移动交易的。为了更好地解释预测行为，我们可以将与预测顶点相关的子图可视化。

用子图可视化你的模型预测

在这个例子中，顶点#1891被预测为一个欺诈账户。粉红色的顶点是已知的欺诈账户，用蓝色标识的顶点是未知账户。看起来顶点1891是一个欺诈者网络的幕后策划者，一直在从无辜的用户那里拿钱!

下一步

如果你觉得这篇文章很有趣，并想建立自己的GNN应用程序，请免费试用我们的TigerGraph Cloud和TigerGraph ML Workbench。请从我们的Github（https://github.com/tigergraph/graph-ml-notebooks）上查看我们的教程。你也可以在这篇博文中找到我们所用到的notebook例子的链接。

审核编辑：李倩

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

数据库

数据库

+关注

关注
7

文章
3857

浏览量
64810
机器学习

机器学习

+关注

关注
66

文章
8455

浏览量
133186

原文标题：如何借助TigerGraph机器学习工作台加速企业BI

文章出处：【微信号：TigerGraph，微信公众号：TigerGraph】欢迎添加关注！文章转载请注明出处。

如何选择云原生机器学习平台

当今，云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势，逐渐成为企业构建和部署机器学习应用的首选。然而，市场上的云原生

发表于 12-25 11:54 •184次阅读

适用于MSP430 MCUs的IAR嵌入式工作台IDE版本7+

电子发烧友网站提供《适用于MSP430 MCUs的IAR嵌入式工作台IDE版本7+.pdf》资料免费下载

发表于 12-05 14:31 •0次下载

适用于MSP430 MCUs的IAR嵌入式<b class='flag-5'>工作台</b>IDE版本7+

日本企业借助NVIDIA产品加速AI创新

日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。

发表于 11-19 14:34 •462次阅读

NPU与机器学习算法的关系

紧密。 NPU的起源与特点 NPU的概念最早由谷歌在其TPU（Tensor Processing Unit）项目中提出，旨在为TensorFlow框架提供专用的硬件加速。NPU的设计目标是提高机器学习算法的运行效率，特别是在处理

发表于 11-15 09:19 •668次阅读

FPGA加速深度学习模型的案例

FPGA（现场可编程门阵列）加速深度学习模型是当前硬件加速领域的一个热门研究方向。以下是一些FPGA加速深度学习模型的案例：一、基于FPG

发表于 10-25 09:22 •434次阅读

RISC-V跑AI算法能加速吗？

现在好多ARM单片机都带机器学习加速，RISC-V有这方面的硬件加速吗？

发表于 10-10 22:14

AI引擎机器学习阵列指南

云端动态工作负载以及超高带宽网络，同时还可提供高级安全性功能。AI 和数据科学家以及软硬件开发者均可充分利用高计算密度的优势来加速提升任何应用的性能。AI 引擎机器学习拥有先进的张量计

发表于 09-18 09:16 •498次阅读

AI引擎<b class='flag-5'>机器</b><b class='flag-5'>学习</b>阵列指南

Cloudera推出机器学习项目加速器 (AMP) 的全新套件

/ -- Cloudera是唯一真正意义上的数据、分析和人工智能混合平台，该平台今天宣布推出多款全新机器学习项目加速器 (AMP) ，旨在缩短企业人工智能用例的价值实现时间。新增功能

发表于 09-13 14:51 •345次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

设备的运行状况，生成各种维度的报告。同时，通过大数据分析和机器学习技术，可以对业务进行预测和预警，从而协助社会和企业进行科学决策、降低成本并创造新的价值。当今时代，数据无处不在，而时间序列数据更是

发表于 06-25 15:00

虹软PhotoStudio AI正式入驻阿里巴巴集团旗下的千牛商家工作台

5月8日，虹软PhotoStudio® AI (简称PSAI)正式入驻阿里巴巴集团旗下的千牛商家工作台，为广大淘宝卖家、天猫商家提供更直接、便捷、高效的图像生成与处理解决方案。

发表于 05-09 09:43 •970次阅读

工作台激光焊接机X, Y, Z,三轴功能的区别与作用

编辑：镭拓激光工作台激光焊接机的X、Y、Z三轴功它们共同协作以实现高效、精准的焊接。三轴的功能与作用具体如下：X轴：通常负责左右横向移动，使得焊接头可以在水平面上沿着工件的宽度方向进行定位和移动。Y

发表于 03-28 11:30 •1190次阅读

<b class='flag-5'>工作台</b>激光焊接机X, Y, Z,三轴功能的区别与作用

Domo与Tableau和Power BI？前Tableau工程师建议最大化BI工具潜能

作为一名解决方案工程师，TannerBrockbank曾在两家流行商业智能(BI)公司工作：Tableau和Domo。在他的职业生涯中，使用过许多BI工具。他发现部分组织选择使用两种BI

发表于 03-28 08:04 •520次阅读

三轴工作台激光焊接机：实现高精度、高效率焊接的新选择

三轴工作台激光焊接机是一种先进的焊接设备，结合了激光焊接技术与三轴工作台的运动控制，实现了焊接过程的高效、精准与自动化。这种设备主要利用激光束的高能量密度和高速度特性，使工件在熔化的同时快速冷却凝固

发表于 03-27 19:32 •534次阅读

NVIDIA Isaac机器人平台升级，加速AI机器人技术革新

NVIDIA Isaac机器人平台近期实现重大升级，通过引入最新的生成式AI技术和先进的仿真技术，显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI

发表于 03-27 10:36 •769次阅读

数据中台：如何构建企业核心竞争力

在当今信息化快速发展的商业环境下，“数据中台”已经成为构建企业核心竞争力的关键步骤。数据中台不仅是数据集成与管理的平台，更是企业智能化转型的加速

发表于 03-22 16:28 •470次阅读

搜索历史

如何借助TigerGraph机器学习工作台加速企业BI

评论