0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ArangoDB在机器学习中的作用

工程师邓生 来源:哲想软件 作者:哲想软件 2022-09-05 09:57 次阅读

ArangoDB具有其固有的多模型功能,非常适合您的机器学习工作负载。ArangoMLPipeline现在可以作为云服务使用——ArangoMLPipeline Cloud。

机器学习基础设施的ArangoML

在构建生产级机器学习基础设施时,ArangoML在整个机器学习生命周期中提供对通用元数据存储的支持,并支持机器学习模型的再现性、监控和审计。

多模型动力机器学习

ArangoDB支持分析任务和多模型机器学习。当处理结构化和非结构化数据的混合时,它特别有用,因为ArangoDB可以本地高效地管理不同的数据模型。

机器学习基础设施的ArangoML

众所周知,训练数据是训练机器学习模型的重要前提。但对于构建生产级机器学习平台,我们实际上应该同样关注另一种类型的数据:元数据。生产机器学习平台由许多不同的步骤和组件组成:

b7009a76-2cb2-11ed-ba43-dac502259ad0.jpg


这些组件中的大多数产生某种元数据,包括例如对数据集的引用、具有相关训练和测试精度的训练运行、模型服务统计、将训练模型链接到用于训练的数据集的来源信息等等。数据科学家和数据操作人员需要通用的元数据存储来回答以下问题:哪个模型是用这个数据集训练的,哪个特性可以产生最佳的测试精度。

b73023f4-2cb2-11ed-ba43-dac502259ad0.jpg


在这里,ArangoML提供了一个简单的界面,可以跨您最喜欢的机器学习框架和工具进行访问。

由于ArangoML由ArangoDB的多模型功能支持,因此它可以存储非结构化数据,例如特定训练运行(文档)的训练统计信息,以及与相关数据集和结果模型的连接(图)。所以上面的查询基本上变成了图遍历。

b7569eb2-2cb2-11ed-ba43-dac502259ad0.jpg


ArangoMLPipeline是一个强大而简单的工具,用于促进数据操作和数据科学之间的团队合作,但也允许为审计员提供详细的审计跟踪和整个机器学习环境的高级分析。

多模型动力机器学习

ArangoDB为不同的数据模型(包括图形、文档和键值)提供本机支持,并允许使用单个查询语言跨所有模型进行查询。

b787b81c-2cb2-11ed-ba43-dac502259ad0.jpg


这些多模型功能在用于特征工程的机器学习平台中特别有用,因为它们使用户能够将不同的数据方面组合成特征,而这些特征又可以被机器学习框架(如TensorFlow或PyTorch)用于训练模型。

b7acd50c-2cb2-11ed-ba43-dac502259ad0.jpg


数据量至关重要,尤其是对于现代深度学习而言。作为分布式数据库的ArangoDB还可以处理对于单个节点来说太大的数据集(例如,图形)。

此外,ArangoDB本机支持大量图算法,包括PageRank、顶点中心性、顶点贴近度、连接组件或社区检测

所有这些功能使ArangoDB和本地的多种模型成为许多机器学习用例的一个非常有用的工具。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3794

    浏览量

    64350
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132549

原文标题:ArangoML:用于机器学习的ArangoDB

文章出处:【微信号:哲想软件,微信公众号:哲想软件】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    zeta机器学习的应用 zeta的优缺点分析

    探讨ZETA机器学习的应用以及ZETA的优缺点时,需要明确的是,ZETA一词不同领域可能
    的头像 发表于 12-20 09:11 136次阅读

    cmp机器学习作用 如何使用cmp进行数据对比

    机器学习领域,"cmp"这个术语可能并不是一个常见的术语,它可能是指"比较"(comparison)的缩写。 比较机器
    的头像 发表于 12-17 09:35 119次阅读

    编码器机器人技术的应用 编码器传感器系统作用

    编码器机器人技术扮演着至关重要的角色,特别是传感器系统,其作用不可忽视。以下是对编码器
    的头像 发表于 11-24 10:02 463次阅读

    GPU深度学习的应用 GPUs图形设计作用

    随着人工智能技术的飞速发展,深度学习作为其核心部分,已经成为推动技术进步的重要力量。GPU(图形处理单元)深度学习扮演着至关重要的角色,其强大的并行处理能力使得训练复杂的神经网络模
    的头像 发表于 11-19 10:55 420次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”计算机系统主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智
    的头像 发表于 11-16 01:07 376次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    eda机器学习的应用

    机器学习项目中,数据预处理和理解是成功构建模型的关键。探索性数据分析(EDA)是这一过程不可或缺的一部分。 1. 数据清洗 数据清洗 是机器
    的头像 发表于 11-13 10:42 272次阅读

    鲁棒性机器学习的重要性

    金融风险评估。这些应用场景对模型的鲁棒性提出了极高的要求。 鲁棒性的定义 鲁棒性通常被定义为系统面对不确定性和变化时仍能保持其功能的能力。机器学习
    的头像 发表于 11-11 10:19 324次阅读

    机器学习的数据分割方法

    机器学习,数据分割是一项至关重要的任务,它直接影响到模型的训练效果、泛化能力以及最终的性能评估。本文将从多个方面详细探讨机器
    的头像 发表于 07-10 16:10 1676次阅读

    如何理解机器学习的训练集、验证集和测试集

    理解机器学习的训练集、验证集和测试集,是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型学习
    的头像 发表于 07-10 15:45 3782次阅读

    DCAC电源模块工业科技的重要作用

    满足各种设备和系统的电力需求。本文中,我们将探讨DC/AC电源模块工业科技的重要作用。 DC/AC电源模块工业科技
    的头像 发表于 07-10 09:35 508次阅读
    DCAC电源模块<b class='flag-5'>在</b>工业科技<b class='flag-5'>中</b>的重要<b class='flag-5'>作用</b>

    机器学习的数据预处理与特征工程

    机器学习的整个流程,数据预处理与特征工程是两个至关重要的步骤。它们直接决定了模型的输入质量,进而影响模型的训练效果和泛化能力。本文将从数据预处理和特征工程的基本概念出发,详细探讨这
    的头像 发表于 07-09 15:57 392次阅读

    深度学习工业机器视觉检测的应用

    随着深度学习技术的快速发展,其工业机器视觉检测的应用日益广泛,并展现出巨大的潜力。工业机器视觉检测是工业自动化领域的重要组成部分,通过图
    的头像 发表于 07-08 10:40 1041次阅读

    深度学习视觉检测的应用

    深度学习机器学习领域中的一个重要分支,其核心在于通过构建具有多层次的神经网络模型,使计算机能够从大量数据自动学习并提取特征,进而实现对复
    的头像 发表于 07-08 10:27 697次阅读

    机器学习在数据分析的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入探讨机器
    的头像 发表于 07-02 11:22 608次阅读

    深度学习与传统机器学习的对比

    人工智能的浪潮机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管
    的头像 发表于 07-01 11:40 1315次阅读