0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个基于TF2.0的强化学习训练工具

电子工程师 来源:lq 2019-02-25 09:28 次阅读

近日,Github 一位开发者 danaugrs 开源了一个新项目——Huskarl,一个专注研究和快速原型的深度强化学习框架。

此框架基于 TensorFlow 2.0 构建,使用了 tf.keras API,保证了其简洁性和可读性。Huskarl 可以使多环境的并行计算变得很容易,这将对加速策略学习算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 还可以与 OpenAI Gym 环境无缝结合,并将计划支持多代理环境和 Unity3D 环境。

OpenAI Gym:2016 年 OpenAI 发布的一个可以开发、对比强化学习算法的工具包,提供了各种环境、模拟任务等,任何人都可以在上面训练自己的算法。

Unity3D:一个全面整合的专业游戏引擎,由 Unity Technologies 开发的一款可以让玩家轻松创建三维视频游戏、实时三维动画等类型互动内容的多平台综合型游戏开发工具。

目前,Huskarl 已经支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,还有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在计划中。

最重要的是,TF 2.0 的 nightly 已经发布,这个开源工具也是基于 TF2.0 开发的,所以大家要先安装一下 tf 2.0 nighty 版本。除此之外,还需要安装以下工具和环境:

这个工具还是新鲜出炉烫手的呢,大家赶紧来尝鲜试一下~

地址:

https://github.com/danaugrs/huskarl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11208
  • tensorflow
    +关注

    关注

    13

    文章

    328

    浏览量

    60492
  • 开源工具
    +关注

    关注

    0

    文章

    27

    浏览量

    4444

原文标题:新鲜开源:基于TF2.0的深度强化学习平台

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    领域的研究与发展。令人瞩目的是,边塞科技的创始人吴翼已正式加入该实验室,并担任首席科学家职。 吴翼在其个人社交平台上对这变动进行了回应。他表示,自己最近接受了蚂蚁集团的邀请,负责大模型强化学习领域的研究工
    的头像 发表于 11-22 11:14 133次阅读

    PyTorch GPU 加速训练模型方法

    在深度学习领域,GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作为
    的头像 发表于 11-05 17:43 440次阅读

    如何使用 PyTorch 进行强化学习

    强化学习(Reinforcement Learning, RL)是种机器学习方法,它通过与环境的交互来学习如何做出决策,以最大化累积奖励。PyTorch 是
    的头像 发表于 11-05 17:34 217次阅读

    使用TF卡的常见问题

    随着科技的发展,TF卡(TransFlash卡,也称为MicroSD卡)已经成为我们日常生活中不可或缺的存储工具。它们被广泛应用于智能手机、平板电脑、数码相机等设备中,用于扩展存储空间,存储照片
    的头像 发表于 11-04 09:54 419次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练
    的头像 发表于 10-28 14:05 140次阅读
    Pytorch深度<b class='flag-5'>学习</b><b class='flag-5'>训练</b>的方法

    谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用

    近日,谷歌在芯片设计领域取得了重要突破,详细介绍了其用于芯片设计布局的强化学习方法,并将该模型命名为“AlphaChip”。据悉,AlphaChip有望显著加速芯片布局规划的设计流程,并帮助芯片在性能、功耗和面积方面实现更优表现。
    的头像 发表于 09-30 16:16 381次阅读

    训练和迁移学习的区别和联系

    训练和迁移学习是深度学习和机器学习领域中的两重要概念,它们在提高模型性能、减少训练时间和降低
    的头像 发表于 07-11 10:12 826次阅读

    深度学习模型训练过程详解

    深度学习模型训练复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练
    的头像 发表于 07-01 16:13 1070次阅读

    通过强化学习策略进行特征选择

    更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中,我们将介绍并实现种新的通过强化学习策略的特征选择。我们先讨论强化学习,尤其是马尔可夫决策
    的头像 发表于 06-05 08:27 318次阅读
    通过<b class='flag-5'>强化学习</b>策略进行特征选择

    名单公布!【书籍评测活动NO.30】大规模语言模型:从理论到实践

    文本质量对比模型,用于对有监督微调模型对于同一个提示词给出的多个不同输出结果进行质量排序。这阶段的难点在于如何限定奖励模型的应用范围及如何构建训练数据。
    发表于 03-11 15:16

    文详解Transformer神经网络模型

    Transformer模型在强化学习领域的应用主要是应用于策略学习和值函数近似。强化学习是指让机器在与环境互动的过程中,通过试错来学习最优的行为策略。
    发表于 02-20 09:55 1.2w次阅读
    <b class='flag-5'>一</b>文详解Transformer神经网络模型

    如何使用Python进行图像识别的自动学习自动训练

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握些重要的概念和技术。在本文中
    的头像 发表于 01-12 16:06 535次阅读

    如何基于深度学习模型训练实现工件切割点位置预测

    Hello大家好,今天给大家分享下如何基于深度学习模型训练实现工件切割点位置预测,主要是通过对YOLOv8姿态评估模型在自定义的数据集上训练,生成
    的头像 发表于 12-22 11:07 748次阅读
    如何基于深度<b class='flag-5'>学习</b>模型<b class='flag-5'>训练</b>实现工件切割点位置预测

    如何基于深度学习模型训练实现圆检测与圆心位置预测

    Hello大家好,今天给大家分享下如何基于深度学习模型训练实现圆检测与圆心位置预测,主要是通过对YOLOv8姿态评估模型在自定义的数据集上训练,生成
    的头像 发表于 12-21 10:50 1733次阅读
    如何基于深度<b class='flag-5'>学习</b>模型<b class='flag-5'>训练</b>实现圆检测与圆心位置预测

    深度学习如何训练出好的模型

    算法工程、数据派THU深度学习在近年来得到了广泛的应用,从图像识别、语音识别到自然语言处理等领域都有了卓越的表现。但是,要训练高效准确的深度
    的头像 发表于 12-07 12:38 1052次阅读
    深度<b class='flag-5'>学习</b>如何<b class='flag-5'>训练</b>出好的模型