据外媒CNET报道,创建一个可以解开魔方的算法相对简单。但是,如果在没有人类帮助的情况下解开魔方可能是一个完全不同的任务。加利福尼亚大学的Stephen McAleer和他的同事们认为他们已经解决了这个问题,并采用了一个称为“自学的渐进迭代”的过程。
McAleer和他的团队称这个过程为“一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方。” 他们声称,这种学习算法可以在30步内解开100%的随机打乱魔方 - 这和人类的表现不相上下或优于人类的表现。
这种类型的算法与在棋类游戏中超越人类表现的算法有区别。这些系统是“强化学习”系统。这个系统在完成解魔方后会查看是否每个提议的步骤都是一种改进。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
算法
+关注
关注
23文章
4585浏览量
92443 -
强化学习
+关注
关注
4文章
264浏览量
11194
原文标题:GGAI 前沿 | 机器学习算法现在可以在没有人类帮助的情况下解开魔方
文章出处:【微信号:ggservicerobot,微信公众号:高工智能未来】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
什么是深度强化学习?深度强化学习算法应用分析
什么是深度强化学习? 众所周知,人类擅长解决各种挑战性的问题,从低级的运动控制(如:步行、跑步、打网球)到高级的认知任务。
发表于 07-01 10:29
•1378次阅读
深度强化学习实战
内容2:课程一: TensoRFlow入门到熟练:课程二:图像分类:课程三:物体检测:课程四:人脸识别:课程五:算法实现:1、卷积神经网络CNN2、循环神经网络RNN3、强化学习DRL4、对抗性生成
发表于 01-10 13:42
懒惰强化学习算法在发电调控REG框架的应用
惰性是人类的天性,然而惰性能让人类无需过于复杂的练习就能学习某项技能,对于人工智能而言,是否可有基于惰性的快速学习的方法?本文提出一种懒惰
发表于 01-16 17:40
•889次阅读
基于PPO强化学习算法的AI应用案例
Viet Nguyen就是其中一个。这位来自德国的程序员表示自己只玩到了第9个关卡。因此,他决定利用强化学习AI算法来帮他完成未通关的遗憾。
发表于 07-29 09:30
•2727次阅读
机器学习中的无模型强化学习算法及研究综述
强化学习( Reinforcement learning,RL)作为机器学习领域中与监督学习、无监督学习并列的第三种
发表于 04-08 11:41
•11次下载
基于强化学习的伪装攻击检测算法
在移动雾计算中,雾节点与移动终端用户之间的通信容易受到伪装攻击,从而带来通信和数据传输的安全问题。基于移动雾环境下的物理层密钥生成策略,提出一种基于强化学习的伪装攻击检测算法。构建移动
发表于 05-11 11:48
•5次下载
强化学习的基础知识和6种基本算法解释
定标记训练数据的情况下获得正确的输出 无监督学习(UL):关注在没有预先存在的标签的情况下发现数据中的模式 强化学习(RL) : 关注智能体
7个流行的强化学习算法及代码实现
作者:Siddhartha Pramanik 来源:DeepHub IMBA 目前流行的强化学习算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。这些算法
基于强化学习的目标检测算法案例
摘要:基于强化学习的目标检测算法在检测过程中通常采用预定义搜索行为,其产生的候选区域形状和尺寸变化单一,导致目标检测精确度较低。为此,在基于深度强化学习的视觉目标检测
发表于 07-19 14:35
•0次下载
评论