0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方

Qp2m_ggservicer 来源:未知 作者:李倩 2018-06-22 16:49 次阅读

据外媒CNET报道,创建一个可以解开魔方的算法相对简单。但是,如果在没有人类帮助的情况下解开魔方可能是一个完全不同的任务。加利福尼亚大学的Stephen McAleer和他的同事们认为他们已经解决了这个问题,并采用了一个称为“自学的渐进迭代”的过程。

McAleer和他的团队称这个过程为“一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方。” 他们声称,这种学习算法可以在30步内解开100%的随机打乱魔方 - 这和人类的表现不相上下或优于人类的表现。

这种类型的算法与在棋类游戏中超越人类表现的算法有区别。这些系统是“强化学习”系统。这个系统在完成解魔方后会查看是否每个提议的步骤都是一种改进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4585

    浏览量

    92443
  • 强化学习
    +关注

    关注

    4

    文章

    264

    浏览量

    11194

原文标题:GGAI 前沿 | 机器学习算法现在可以在没有人类帮助的情况下解开魔方

文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是深度强化学习?深度强化学习算法应用分析

    什么是深度强化学习? 众所周知,人类擅长解决各种挑战性的问题,从低级的运动控制(如:步行、跑步、打网球)到高级的认知任务。
    发表于 07-01 10:29 1378次阅读
    什么是深度<b class='flag-5'>强化学习</b>?深度<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>应用分析

    深度强化学习实战

    内容2:课程: TensoRFlow入门到熟练:课程二:图像分类:课程三:物体检测:课程四:人脸识别:课程五:算法实现:1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成
    发表于 01-10 13:42

    强化学习和监督式学习, 非监督式学习的区别

    而这时,强化学习会在没有任何标签的情况下,通过先尝试做出些行为得到个结果,通过这个结果是对还是错的反馈,调整之前的行为,就这样不断的调整
    的头像 发表于 08-21 09:18 2.1w次阅读
    <b class='flag-5'>强化学习</b>和监督式<b class='flag-5'>学习</b>, 非监督式<b class='flag-5'>学习</b>的区别

    基于强化学习的MADDPG算法原理及实现

    之前接触的强化学习算法都是单个智能体的强化学习算法,但是也有很多重要的应用场景牵涉到多个智能体之间的交互。
    的头像 发表于 11-02 16:18 2.2w次阅读

    量化深度强化学习算法的泛化能力

    OpenAI 近期发布了个新的训练环境 CoinRun,它提供了个度量智能体将其学习经验活学活用到新情况的能力指标,而且还可以解决项长
    的头像 发表于 01-01 09:22 2332次阅读
    量化深度<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>的泛化能力

    懒惰强化学习算法在发电调控REG框架的应用

    惰性是人类的天性,然而惰性能让人类无需过于复杂的练习就能学习某项技能,对于人工智能而言,是否可有基于惰性的快速学习的方法?本文提出一种懒惰
    发表于 01-16 17:40 889次阅读

    基于PPO强化学习算法的AI应用案例

    Viet Nguyen就是其中个。这位来自德国的程序员表示自己只玩到了第9个关卡。因此,他决定利用强化学习AI算法来帮他完成未通关的遗憾。
    发表于 07-29 09:30 2727次阅读

    机器学习中的无模型强化学习算法及研究综述

    强化学习( Reinforcement learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三
    发表于 04-08 11:41 11次下载
    机器<b class='flag-5'>学习</b>中的无模型<b class='flag-5'>强化学习</b><b class='flag-5'>算法</b>及研究综述

    基于强化学习的伪装攻击检测算法

    在移动雾计算中,雾节点与移动终端用户之间的通信容易受到伪装攻击,从而带来通信和数据传输的安全问题。基于移动雾环境的物理层密钥生成策略,提出一种基于强化学习的伪装攻击检测算法。构建移动
    发表于 05-11 11:48 5次下载

    一种新型的多智能体深度强化学习算法

    一种新型的多智能体深度强化学习算法
    发表于 06-23 10:42 36次下载

    强化学习的基础知识和6基本算法解释

    定标记训练数据的情况下获得正确的输出 无监督学习(UL):关注在没有预先存在的标签的情况下发现数据中的模式 强化学习(RL) : 关注智能体
    的头像 发表于 12-20 14:00 1072次阅读

    7个流行的强化学习算法及代码实现

    作者:Siddhartha Pramanik 来源:DeepHub IMBA 目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。这些算法
    的头像 发表于 02-03 20:15 1056次阅读

    强化学习的基础知识和6基本算法解释

    情况下获得正确的输出无监督学习(UL):关注在没有预先存在的标签的情况下发现数据中的模式强化学习(RL):关注智能体在环境中如何采取行动以
    的头像 发表于 01-05 14:54 874次阅读
    <b class='flag-5'>强化学习</b>的基础知识和6<b class='flag-5'>种</b>基本<b class='flag-5'>算法</b>解释

    基于强化学习的目标检测算法案例

    摘要:基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为,其产生的候选区域形状和尺寸变化单,导致目标检测精确度较低。为此,在基于深度强化学习的视觉目标检测
    发表于 07-19 14:35 0次下载

    没有人机界面的情况下,应如何配置设备?

    我们越来越依赖可穿戴和互联技术,但在没有人机界面的情况下,应如何配置设备?
    的头像 发表于 11-03 11:10 481次阅读
    在<b class='flag-5'>没有人</b>机界面的<b class='flag-5'>情况下</b>,应如何配置设备?