0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

开源机器学习管理平台TRAINS

DPVg_AI_era 来源:lq 2019-06-23 08:09 次阅读

本日Reddit热议:开源机器学习管理平台TRAINS。据开发者介绍,该平台能够通过中央服务器集中记录管理ML模型的一切信息,整合方便,与主流框架无缝对接,仅用两行代码即可启用,相关Demo和GitHub资源已开放。

今天Reddit头号热帖看起来像是一条广告:这是一个ML团队自家开发的模型管理平台,名字很别致,叫“TRAINS”,很直观有没有?

帖子作者是开发团队成员之一,上来第一句就很耿直:现在机器学习模型管理平台很多,要不要来试试我们刚开源这个?

简单介绍一下,这个平台名叫TRAINS,我们团队没有营销team,所以我作为开发团队一员,先发到reddit上让你们先试试看了!

你这平台最大特点是啥?使用简便!只需在脚本中添加两行代码,模型、性能指标、超参数就尽在掌握了。

话说回来,只要分享的东西好用,作为“美国贴吧”的Reddit上的网友其实并不拒绝广告,下边网友就开始提问了,比如:

我现在还没进GitHub里详细查看,不如你简单介绍一下这个TRAINS平台和现有其他机器学习模型管理平台,比如和Sacred的区别、或者说是特别之处在哪儿呢?

Sacred平台模型调试面板

楼主表示这个问题问的好。他表示,主要有六点区别:

TRAINS整合整个资源库只需两行代码,如果是Scared的话,需要为每个函数添加修饰器,记录每个量度和超参数,显示整合非常麻烦。

TRAINS还会自动将git repo和commit与实验中的训练过程连接起来。(据我所知,这在Sacred中是办不到的,至少不容易实现)

TRAINS自动记录模型并在集中的位置创建副本,团队可以轻松地对模型和初始权重进行共享。(使用Sacred只能手动执行操作,只能在共享文件夹上共享。)

TRAINS界面美观,连续几小时看着不累眼睛。

TRAINS允许用户从Python式的界面中轻松查询实验数据和指标。

TRAINS还允许用户直接访问mongoDB和elasticsearch数据库,以便更深入地了解系统。

不过,作者Reddit上的回复中对TRAINS的介绍比较简略,我们还可以去GitHub上看看。

GitHub上的介绍就直接多了,介绍说明文档中直接将TRAINS称为一套“神奇的自动化AI实验管理器和版本控制器。”

即使是才华横溢的科学家,工程师或开发人员,在独立工作时都难免被复杂的流程搞得一团乱麻。机器学习的工作流程是可以管理的。随着时间的推移和项目人手的增加,管理的混乱会降低生产力。随着项目向生产方向发展,必须通过可见性和出处(provenance)来扩展深度学习的研究成果。

不论是对于团队还是企业,TRAINS都能将所有内容记录在一个中央服务器中,并实现可视化和出处,这样生产力就不会受到影响。TRAINS可以记录和管理各种深度学习研究的模型负载,并且几乎不需要付出集成成本。

我们专门设计了TRAINS,能够轻松集成模型参数,团队可以保留现有的方法和实践。可以每天使用TRAINS来增强团队协作,提升可视化程度,还可以用来将实验日志、输出和数据收集到一个集中式的中央服务器上。

Demo地址:https://demoapp.trainsai.io (需要注册)

究竟神奇在哪呢?以下是作者团队总结的TRAINS的主要特点。

TRAINS是我们解决机器学习/深度学习领域中与无数其他研究人员和开发人员分享的问题的方法:培训生产级深度学习模型是一个光荣而又混乱的过程。TRAINS通过关联代码版本控制、研究项目、性能指标和模型出处来跟踪和控制流程。

无缝兼容常用框架,一站式记录所有模型数据

现在就能用

TRAINS免费开源,只需要两行代码即可完全集成。

可与其他常用工具一起使用

TRAINS与现有主要框架无缝集成,包括:PyTorch、TensorFlow、Keras和其他即将推出的框架支持Jupyter Notebook和PyCharm远程调试

TRAINS服务器和使用TRAINS python包的GPU训练机器的交互过程

记录一切:让机器学习实验真正可重复

自动关联模型+代码+参数+初始权重的模型日志记录

自动在集中存储上创建模型副本(支持共享文件夹、S3、GS,Azure即将推出!)

共享与合作

多用户过程跟踪与合作

中心服务器能够整合日志、记录和通用统计数据

提高生产力

全面的实验数据比对,代码贡献、初始权重、超参数和量度结果等。

组织与管理

管理并组织项目中的实验

查询能力。通过结果量度对实验进行分类和筛选。

更多特色

通过网页应用,利用远程机器终止实验

提供经过现场测试的功能丰富的SDK,可满足用户的即时定制化需求

有关TRAINS机器学习模型管理平台的更多详情,可参阅GitHub资源:https://github.com/allegroai/trains

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3358

    浏览量

    42523
  • 代码
    +关注

    关注

    30

    文章

    4790

    浏览量

    68654
  • 机器学习
    +关注

    关注

    66

    文章

    8420

    浏览量

    132685

原文标题:Reddit热议:只要2行代码,免费开源ML管理工具TRAINS

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    传统机器学习方法和应用指导

    在上一篇文章中,我们介绍了机器学习的关键概念术语。在本文中,我们会介绍传统机器学习的基础知识和多种算法特征,供各位老师选择。 01 传统机器
    的头像 发表于 12-30 09:16 152次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生
    的头像 发表于 12-25 11:54 111次阅读

    构建云原生机器学习平台流程

    构建云原生机器学习平台是一个复杂而系统的过程,涉及数据收集、处理、特征提取、模型训练、评估、部署和监控等多个环节。
    的头像 发表于 12-14 10:34 139次阅读

    什么是云原生MLOps平台

    云原生MLOps平台,是指利用云计算的基础设施和开发工具,来构建、部署和管理机器学习模型的全生命周期的平台。以下,是对云原生MLOps
    的头像 发表于 12-12 13:13 112次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 418次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 472次阅读

    AI项目管理平台怎么用

    AI项目管理平台是一种集成了项目管理工具、AI开发环境和数据分析能力的综合性平台。接下来,AI部落小编为您梳理AI项目管理
    的头像 发表于 11-13 09:38 217次阅读

    使用机器学习和NVIDIA Jetson边缘AI和机器人平台打造机器人导盲犬

    Selin Alara Ornek 是一名富有远见的高中生。她使用机器学习和 NVIDIA Jetson 边缘 AI 和机器人平台,为视障人士打造了机器人导盲犬。 该项目名为 I
    的头像 发表于 11-08 10:05 405次阅读

    如何通过DM平台管理InRouter/InGateway?

    ://c.inhandcloud.com/注册账号填写在平台注册的账号信息: * InRouterInGateway 必须在已经联网的状态下, LTE4G网络或有线网络3.InRouterInGateway会被添加到平台 4.在平台
    发表于 07-25 07:48

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1406次阅读

    Hugging Face推出开源机器人代码库LeRobot

    AI领域的佼佼者Hugging Face近日宣布重磅推出并全面开源机器人工具包——LeRobot。这一创新工具包基于史上最大规模的众包机器人数据集,为开发者提供了一个前所未有的平台
    的头像 发表于 05-09 10:32 590次阅读

    广和通发布机器人开发平台

    广和通近日隆重发布了其全新研发的具身智能机器人开发平台——Fibot。该平台旨在满足客户在验证Mobile ALOHA协同学习与简单示教操作数据方面的需求,通过深度
    的头像 发表于 03-29 09:34 636次阅读

    NVIDIA Isaac机器人平台升级,加速AI机器人技术革新

    NVIDIA Isaac机器人平台近期实现重大升级,通过引入最新的生成式AI技术和先进的仿真技术,显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI工
    的头像 发表于 03-27 10:36 689次阅读

    人工智能和机器学习的顶级开发板有哪些?

    机器学习(ML)和人工智能(AI)不再局限于高端服务器或云平台。得益于集成电路(IC)和软件技术的新发展,在微型控制器和微型计算机上实现机器学习
    的头像 发表于 02-29 18:59 843次阅读
    人工智能和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>的顶级开发板有哪些?

    机器人基于开源的多模态语言视觉大模型

    ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型,只用单机就可以训练。
    发表于 01-19 11:43 424次阅读
    <b class='flag-5'>机器</b>人基于<b class='flag-5'>开源</b>的多模态语言视觉大模型