用RAPIDS生成用于加速短期价格预测的限价订单簿数据集-电子发烧友网

做市商是卖方的主要参与者，为市场提供流动性。投机者站在买方一边，进行实验和研究，希望从中获利。最终用户是向零售经纪人咨询建议和交易的散户投资者。总体而言，金融公司有兴趣评估金融机器学习（ ML ）算法，以发现哪些算法最有利可图。

研究人员最近发表了许多版本的这种类型的算法。我们试图利用高频数据和随机森林（ RF ）模型的可解释性，并选择了本文中提出的 RF 方法研究短期价格预测的限价订单簿特征：一种机器学习方法.

我们的研究发现，使用 GPU 的硬件加速减少了金融 ML 研究人员获得预测结果所需的时间。由于大部分运行时间都可以用于分类器训练，因此人们当然对更有效的训练方法感兴趣。

本文介绍了我们的研究，包括生成的数据集，使用限价订单簿（ LOB ）数据进行价格预测，以及 ML 训练的推荐步骤。我们解释了所研究的 GPU 配置如何显著加快 ML 训练时间，从而实现更高效和更广泛的模型开发

数据集

本研究使用显示实时股价的时间序列数据集来更好地理解 LOB 结构和方向预测。市场数据公司提供Intrinio，本研究的数据集包含纽约证券交易所和纳斯达克股票代码的实际市场价格样本，以 1 秒为基础，来自道琼斯 30 指数股票。

1 秒的报价被用作 ABIDES （基于代理的交互式离散事件模拟）的输入，以生成看起来像市场 LOB 的 LOB 数据。每条记录上的时间戳都在第二个标记处；例如： 2019 年 1 月 2 日的 2019-01-02T14 : 09 : 18Z ，即 2019 年的第一个交易日

输入到 ABIDES 的 CSV 文件由这一列作为第一列，后面是 30 列 DOW 30 的美元价格（到两位数）。本文将 AAPL 股票行情作为一个测试案例。

使用 ABIDES 生成合成数据

ABIDES 是一种模拟金融市场运作的方法。在最近的论文中进行了解释，ABIDES: Towards High-Fidelity Multi-Agent Market Simulation，由佐治亚理工学院、佐治亚大学和摩根大通银行的研究人员撰写

ABIDES 模拟了许多通过交易所代理买卖资产的个人交易代理。模拟中的每一笔交易和其他事件都会被记录下来，并与执行交易的代理人联系在一起。这使市场研究人员能够详细分析不同的代理人策略和事件如何影响模拟市场。重要的是，给定交换的 LOB 可以在模拟之后重建

ABIDES 模拟中的一些代理基于时间序列来评估资产，该时间序列表示代理在某个频率下观察到的资产的真实价值，并添加一些噪声。这个时间序列被称为基本价值股票的价格。为了在宏观尺度上模拟一个更现实的市场，我们使用真实的历史数据作为基本值。

为了创建合理的 LOB 数据来训练我们的 RF 模型，我们使用 Intrinio 提供的 1 秒报价作为 ABIDES 模拟的历史基本值。图 1 将输出 LOB 数据的中间价与用作 AAPL 历史基本面的 1 秒报价进行了比较。

图 1 。将 Intrinio 的 1 秒输入 AAPL 报价数据（蓝线）与单个交易日输出 ABIDES 模拟的中间价（黑线）进行比较的图表

LOB 作为短期价格变动的预测指标

在贸易交易的投标方，买方希望尽可能少地支付购买给定证券的费用。在要求方，卖方希望以尽可能高的价格出售证券。限价单是在买卖双方设定这些限制的一种方式。

给定证券的 LOB 是一个订单大小列表， x 轴为证券价格， y 轴为该价格下买卖双方的总交易量。例如，买家愿意以每股 580 美元的价格购买 100 股谷歌证券，因此出售者必须有足够的股份来完成这 100 股。请参见图 2 以获取 LOB 示例。

LOB 分为出价部分（图 2 中红线左侧）和要价部分（图 2 红线右侧），前者的价格低于中间市场，后者的价格较高。

图 2 :将 GOOG 安全的订单簿快照限制在相隔 292 微秒的两个时间点。订单量显示在 y 轴上，价格显示在 x 轴上。中间报价由买卖盘之间的红线标记。

简单地说，买方希望在市场上支付更低的价格，而卖方希望获得更高的价格。时间点在小数点后有九位数，这反映了现代证券交易所的纳秒精度

两个框架中的第一个框架（位于图 2 顶部）的一个显著特征是，从高点（高于标记为 5 . 80 的点）可以看出，以 580 美元的价格出售的需求量很大。观察这是如何主导 LOB 的，预示着中间报价向右移动，美元价值更高。

图 3 显示，当向分类器提供更多的 LOB 深度时，预测价格走势即时方向的准确性会提高。这是直观的，因为分类器在训练过程中有更多关于市场两侧的可用信息（出价水平和要价水平）。

图 3 。限制订单簿深度可能会有所不同。 ML 中间价格方向预测的准确性在书中有更多级别时更加稳健
图片来源：费萨尔·库雷希

使用 RAPIDS 加速随机森林训练

我们训练了一个随机森林模型，以 LOB 数据作为输入来预测短期价格走势。我们训练了一个分类器来预测给定的股价是向上、向下还是持平

具体来说，目标是预测未来 20 个中间价格（ m下一个) 将小于或大于之前 20 个中间价格的平均值（ m上一个) 以一定的幅度。我们将这一差额定义为 0 . 5 美分，这是我们数据集中任何两个 LOB 帧之间中间价格的最小非零差异。

标签为 2 表示价格上涨（ m下一个–米上一个> 0 . 5 美分），标签为 1 表示中性价格变动，标签为 0 表示向下价格变动（ m下一个–米上一个< -0 . 5 美分）

以下实验是在一个NVIDIA A100用于 RAPIDS cuDF 和 RAPIDS cuML 的 80 GB SXM ，以及用于 scikit learn 和 pandas 的两个 AMD EPYC 7742 64 核处理器。使用 RAPIDS cuDF 库和 pandas 计算中间价、平均值和标签

图 4 显示了运行时的比较。平均预处理时间是根据每种配置的 10 次运行和 10 次预热计算得出的。这是在 ML 训练运行之前的一个标记步骤，如图 5 所示。

图 4 。 CPU 与 pandas 以及 GPU 与 cuDF 的平均预处理时间的比较

我们使用 scikit learn 和 RAPIDS cuML 训练了一个由 100 棵树组成的随机森林分类器，并比较了两者的训练时间。 RAPIDS cuML 是 scikit learn 的免费替代品，它使许多流行的 ML 算法能够在 GPU 上加速

图 5 显示了一个 NVIDIA A100 80 GB 与 RAPIDS cuML 以及两个 AMD EPYC 7742 64 核处理器与 scikit learn 上训练工作负载的运行时间的比较。 CPU 上的训练是多线程的，有 128 个线程，使用 scikit learnn_jobs参数

五次热身的平均时间是 50 分以上，而 scikit 的学习时间是五次热身平均 10 分以上。使用 GPU 进行训练的速度大约快 10 倍。这些结果与 2022 年 GPU 研究结果一致，详见Accelerating Machine Learning Training Time for Limit Order Book Prediction.

图 5 。 scikit 在 CPU 上学习和在 GPU 上学习的训练运行时间（秒）

GPU 上的培训可为这一工作量提供 10 倍以上的加速。 ML 分类器开发的迭代性质使其时间密集，特别是考虑到金融市场中使用的大量时间序列数据。简而言之， GPU 是 ML 算法研究的游戏规则改变者。

金融数据集日益增长的计算需求

虽然前面的例子使用了一个股票行情器，但这些高频交易和限价订单的用例需要多个 AI 系统运行相当于多个的算法NVIDIA DGX SuperPODs通常，专门研究此类用例的组织需要多个资产类和跟踪器

因此，这种算法的分析和应用可以很容易地并行化，案例可以扩展到需要加速时间和大量计算的多个人工智能系统。例如，定量金融、机器学习（如 RAPIDS cuML ）和深度学习应用（如 LOB 数据集之上的神经网络）。

为了在开发金融 ML 算法时加快培训速度，您可以使用 RAPIDS 库套件来利用 GPU 加速：

RAPIDS cuDF 取代 pandas Python 库

RAPIDS cuML 取代 scikit 学习 Python 库

下载并安装 RAPIDS开始为您的数据科学工作负载启用 GPU 。记得事先安装 NVIDIA 驱动程序和 CUDA 工具包。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
5087

浏览量
103922
人工智能

人工智能

+关注

关注
1797

文章
47867

浏览量
240881
机器学习

机器学习

+关注

关注
66

文章
8453

浏览量
133167

TF之CNN：CNN实现mnist数据集预测

TF之CNN：CNN实现mnist数据集预测 96%采用placeholder用法+2层C及其max_pool法+隐藏层dropout法+输出层softmax法+目标函数cross_entropy法+

发表于 12-19 17:02

高效简洁的用labview读取excel工作簿信息

读取excel工作簿的传统方法是用自动化引用进行数据读取操作。但是自动化引用链路较长，且由于Microsoft offer版本问题导致部分用户找不到Excel._Application。这里给出一种

发表于 04-11 18:24

长期价格高价回收西门子输入输出模块

长期价格高价回收西门子输入输出模块、高价回收西门子 PLC CPU. 工程余货.个人闲置。6ES系列。6SE7系列。6DD系列。6FC系列。6GK系列。6SN系列。6AV触摸屏系列。有意者私聊。诚信

发表于 06-11 17:13

光伏功率预测系统的构成和作用

　　光伏功率预测是什么？光伏功率预测系统就是将天气预报数据和环境检测仪所采集的数据加以分析，最后将生成的

发表于 01-18 16:10

开发和设计实现LSTM模型用于家庭用电的多步时间序列预测相关资料分享

短期记忆递归神经网络能够自动学习序列数据的特征，支持多变量数据，并且可以输出可用于多步预测的可变长度序列。总体概述本教程分为九个部分; 他们

发表于 07-05 06:43

什么是有限集模型预测控制

应用于电压型逆变器馈电的永磁同步电机驱动系统中。有限集模型预测控制在当前控制周期内对每个开关状态所产生的电机输出结果进行预测，将预测结果与所

发表于 08-27 06:05

基于卡尔曼滤波的电力系统短期负荷预测

首先介绍了卡尔曼滤波的算法，并给出了一套递推计算公式，然后将此算法应用于短期负荷预测，并针对负荷预测的本身的特点对算法进行了改进，用两种算法

发表于 07-11 18:44 •1249次阅读

LSSVM短期负荷预测模型

短期负荷预测的精度直接影响电力系统运行的可靠性和供电质量。提出一种基于粒子群优化算法的最小二乘支持向量机短期负荷预测的模型和算法，对最小二乘支持向量机的参数寻优，再以测试

发表于 03-30 14:55 •4次下载

NVIDIA推出RAPIDS开源GPU加速平台

HPE、IBM、Oracle、开源社区、创业公司采用RAPIDS，显著提升端到端预测数据分析能力。

发表于 10-17 14:36 •4367次阅读

华为开发者大会2021 OpenHarmony中短期价值

今天的华为开发者大会2021上，OpenHarmony分论坛上展示了OpenHarmony中短期价值。 HDC分论坛-OpenHarmony 分论坛推荐链接：http://t.elecfans.com/live/1708.html 责任编辑：haq

发表于 10-23 17:19 •1552次阅读

具有RAPIDS cuML的GPU加速分层DBSCAN

　　我们将通过快速示例演示 HDBSCAN 的 RAPIDS cuML 实现中当前支持的功能，并将提供我们在 GPU 上实现的一些实际示例和基准。在阅读了这篇博文之后，我们希望您对 RAPIDS ‘ GPU – 加速 HDBSC

发表于 04-18 16:15 •4397次阅读

如何使用RAPIDS和CuPy时加速Gauss 秩变换

　　高斯秩变换是一种新的标准化技术，用于转换输入数据以训练深层神经网络。最近，我们在预测分子竞争性质中使用了这种技术，它很容易将 m 消息传递神经网络模型的精度提高了一个显著的幅度。这篇博文

发表于 04-20 10:37 •1703次阅读

NVIDIA RAPIDS加速器v21.08的功能应用

　　我们通过处理 GPU 内存溢出的数据集以进行分组和窗口操作，继续改善用户体验。这一改进将节省用户创建分区的时间，以避免 GPU 上出现内存不足错误。类似地， UCX 1.11 的采用改进了 RAPIDS Spark

发表于 04-20 14:58 •1588次阅读

通过RAPIDS加速单细胞DNA和RNA基因组分析

使用 RAPIDS 生成这个 UMAP 可视化需要 1 秒，而在 CPU 上则需要 80 秒。事实上， RAPIDS 可以加速整个单单元分析工作流程，甚至可以在大型

发表于 04-27 16:14 •1288次阅读

使用 RAPIDS 进行更快的单细胞分析

使用 RAPIDS-singlecell 进行 GPU 加速的单细胞 RNA 分析

发表于 07-05 16:30 •777次阅读