0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一个基于TF2.0的强化学习训练工具

电子工程师 来源:lq 2019-02-25 09:28 次阅读

近日,Github 一位开发者 danaugrs 开源了一个新项目——Huskarl,一个专注研究和快速原型的深度强化学习框架。

此框架基于 TensorFlow 2.0 构建,使用了 tf.keras API,保证了其简洁性和可读性。Huskarl 可以使多环境的并行计算变得很容易,这将对加速策略学习算法(比如 A2C 和 PPO)非常有用。此外,Huskarl 还可以与 OpenAI Gym 环境无缝结合,并将计划支持多代理环境和 Unity3D 环境。

OpenAI Gym:2016 年 OpenAI 发布的一个可以开发、对比强化学习算法的工具包,提供了各种环境、模拟任务等,任何人都可以在上面训练自己的算法。

Unity3D:一个全面整合的专业游戏引擎,由 Unity Technologies 开发的一款可以让玩家轻松创建三维视频游戏、实时三维动画等类型互动内容的多平台综合型游戏开发工具。

目前,Huskarl 已经支持了 DQN(Deep Q-Learning Network)、Multi-step DQN、Double DQN、A2C(Advantage Actor-Critic)等算法,还有 DDPG(Deep Deterministic Policy Gradient)、PPO(Proximal Policy Optimization)、Curiosity-Driven Exploration 等算法在计划中。

最重要的是,TF 2.0 的 nightly 已经发布,这个开源工具也是基于 TF2.0 开发的,所以大家要先安装一下 tf 2.0 nighty 版本。除此之外,还需要安装以下工具和环境:

这个工具还是新鲜出炉烫手的呢,大家赶紧来尝鲜试一下~

地址:

https://github.com/danaugrs/huskarl

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11253
  • tensorflow
    +关注

    关注

    13

    文章

    329

    浏览量

    60532
  • 开源工具
    +关注

    关注

    0

    文章

    27

    浏览量

    4457

原文标题:新鲜开源:基于TF2.0的深度强化学习平台

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    领域的研究与发展。令人瞩目的是,边塞科技的创始人吴翼已正式加入该实验室,并担任首席科学家职。 吴翼在其个人社交平台上对这变动进行了回应。他表示,自己最近接受了蚂蚁集团的邀请,负责大模型强化学习领域的研究工
    的头像 发表于 11-22 11:14 578次阅读

    PyTorch GPU 加速训练模型方法

    在深度学习领域,GPU加速训练模型已经成为提高训练效率和缩短训练时间的重要手段。PyTorch作为
    的头像 发表于 11-05 17:43 555次阅读

    如何使用 PyTorch 进行强化学习

    强化学习(Reinforcement Learning, RL)是种机器学习方法,它通过与环境的交互来学习如何做出决策,以最大化累积奖励。PyTorch 是
    的头像 发表于 11-05 17:34 293次阅读

    使用TF卡的常见问题

    随着科技的发展,TF卡(TransFlash卡,也称为MicroSD卡)已经成为我们日常生活中不可或缺的存储工具。它们被广泛应用于智能手机、平板电脑、数码相机等设备中,用于扩展存储空间,存储照片
    的头像 发表于 11-04 09:54 923次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速你的 Pytorch 深度学习训练
    的头像 发表于 10-28 14:05 204次阅读
    Pytorch深度<b class='flag-5'>学习</b><b class='flag-5'>训练</b>的方法

    谷歌AlphaChip强化学习工具发布,联发科天玑芯片率先采用

    近日,谷歌在芯片设计领域取得了重要突破,详细介绍了其用于芯片设计布局的强化学习方法,并将该模型命名为“AlphaChip”。据悉,AlphaChip有望显著加速芯片布局规划的设计流程,并帮助芯片在性能、功耗和面积方面实现更优表现。
    的头像 发表于 09-30 16:16 427次阅读

    训练和迁移学习的区别和联系

    训练和迁移学习是深度学习和机器学习领域中的两重要概念,它们在提高模型性能、减少训练时间和降低
    的头像 发表于 07-11 10:12 1043次阅读

    如何使用Tensorflow保存或加载模型

    TensorFlow是广泛使用的开源机器学习库,它提供了丰富的API来构建和训练各种深度学习模型。在模型
    的头像 发表于 07-04 13:07 1504次阅读

    MATLAB如何使用训练好的网络

    引言 在本文中,我们将探讨如何在MATLAB中使用训练好的神经网络。神经网络是种强大的机器学习技术,广泛应用于图像识别、自然语言处理、预测建模等领域。MATLAB提供了丰富的工具箱,
    的头像 发表于 07-03 10:06 1123次阅读

    深度学习模型训练过程详解

    深度学习模型训练复杂且关键的过程,它涉及大量的数据、计算资源和精心设计的算法。训练
    的头像 发表于 07-01 16:13 1263次阅读

    通过强化学习策略进行特征选择

    更快更好地学习。我们的想法是找到最优数量的特征和最有意义的特征。在本文中,我们将介绍并实现种新的通过强化学习策略的特征选择。我们先讨论强化学习,尤其是马尔可夫决策
    的头像 发表于 06-05 08:27 353次阅读
    通过<b class='flag-5'>强化学习</b>策略进行特征选择

    名单公布!【书籍评测活动NO.30】大规模语言模型:从理论到实践

    文本质量对比模型,用于对有监督微调模型对于同一个提示词给出的多个不同输出结果进行质量排序。这阶段的难点在于如何限定奖励模型的应用范围及如何构建训练数据。
    发表于 03-11 15:16

    文详解Transformer神经网络模型

    Transformer模型在强化学习领域的应用主要是应用于策略学习和值函数近似。强化学习是指让机器在与环境互动的过程中,通过试错来学习最优的行为策略。
    发表于 02-20 09:55 1.4w次阅读
    <b class='flag-5'>一</b>文详解Transformer神经网络模型

    如何使用Python进行图像识别的自动学习自动训练

    如何使用Python进行图像识别的自动学习自动训练? 使用Python进行图像识别的自动学习和自动训练需要掌握些重要的概念和技术。在本文中
    的头像 发表于 01-12 16:06 586次阅读

    Kaggle知识点:训练神经网络的7技巧

    科学神经网络模型使用随机梯度下降进行训练,模型权重使用反向传播算法进行更新。通过训练神经网络模型解决的优化问题非常具有挑战性,尽管这些算法在实践中表现出色,但不能保证它们会及时收敛到
    的头像 发表于 12-30 08:27 655次阅读
    Kaggle知识点:<b class='flag-5'>训练</b>神经网络的7<b class='flag-5'>个</b>技巧