0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI自学就可用更少步数复原任意3阶魔方

jmiy_worldofai 来源:未知 作者:胡薇 2018-06-22 10:24 次阅读

魔术方块是非常有趣的益智玩具,但从难度来说,并不比其他棋类游戏困难,如果人工智能AI算法可以在国际象棋或围棋中轻松打败人类,那么复原魔术方块也不是这么困难的事。

但是事实上对于算法来说,要解出魔术方块的谜题和下棋是完全不同种类的任务。

过去在棋类游戏中展现出超人类表现的算法,都是属于传统的「强化学习」(RL)系统,这类型 AI 在确定某些特定的一步是实现整体目标的积极步骤时,便会获得奖励,进而使系统产生追求最大利益的习惯性行为,然而当 AI 无法确定这一步是否有益时,强化学习自然就无法发挥作用。

如果还是无法理解,试着这么想吧:在进行棋类游戏时,系统可以轻易去判定一个动作究竟是属于「好棋」或「坏棋」,但是在转动魔术方块时,你能够说出有任何特定的一步,是改善整体难题的关键吗?

从外观上来看,魔术方块是个很单纯的益智玩具,然而因为 3D 立体的特性,这让一般常见的 3 阶魔术方块就已有着惊人的近 4.33×1019 组合,而在其中,只有六面都是相同颜色的状态才能成为「正确解答」。

过去人们已经研究出许多不同算法和策略来解决这项难题,但 AI 研究人员真正的目标还是希望能像 AlphaGo Zero 那样,让 AI 在没有任何历史知识的情况下,学会自行应对随机的魔术方块难题。

而近期加利福尼亚大学 Stephen McAleer 和团队透过一种被称为「自学叠代」(autodidactic iteration)的 AI 技术打造出「DeepCube」系统,成功让 AI 在面对任何乱序的 3 阶魔术方块时都可以成功找出正确解答。

根据团队解释,自学叠代是一种全新的强化学习算法,与过去棋类游戏算法的处理方式不同,它采取了「反着看」的内部奖励判断机制:当 AI 提出一个动作建议时,算法便会跳至完成的图形开始往前推导,直到到达提出的动作建议,藉以判断每一步动作的强度。

虽然听来相当的繁杂,但这让系统能够更熟悉每一步动作,并得以评估出整体强度,一但获得足够数量的数据,系统便能以传统的树状搜索方式去找出如何移动最好的方法。

团队在研究中发现,DeepCube 系统在训练中自己找出了许多与人类玩家相同的策略,并在经过 44 个小时的自学训练后,已经能够在没有任何人为干预下,在平均 30 步以内复原任何随机乱序魔术方块──这些「最佳解答」不是和人类最佳表现一样好,就是比这些表现更好。

McAleer 和团队打算未来将在更大、更难解决的 16 阶魔术方块上进行测试,这项全新的系统将有助于 AI 应用更全面化,像是生物物理学上重要的蛋白质摺叠(Protein Folding)问题或也有望得以解决。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1791

    文章

    46833

    浏览量

    237483
  • 强化学习
    +关注

    关注

    4

    文章

    266

    浏览量

    11208

原文标题:不需要人类知识,AI 也能以更少步数复原任意 3 阶魔方

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    英飞凌展示637ms复原魔方的机器人

    ”(英飞凌)。肉眼观看时感觉就是一瞬间完成的。该机器人配备英飞凌的车载MCU“AURIX TC275”等产品。据介绍,人工还原3魔方最少需要4.9秒。
    发表于 11-21 16:44 1570次阅读

    魔方复原

    项目说明:单片机控制6路步进电机,分别控制魔方的六个轴,该模块可以手动操作旋转,也可以接受指令进行旋转。数码管显示时间与。自动复原由软件操作,平台为labVIEW,通过摄像头进行颜
    发表于 11-11 22:39

    [每周一练]labVIEW_3D魔方(1202-1208)

    `3D魔方简介:该3D实现方法与以前的练习"labVIEW3D战斗机"实现方法相同,都是加载VRML文件,共27个方块,3
    发表于 12-01 22:29

    【深联华杯】魔方复原

    设计原理2.1原理概述本次项目设计的基本原理主要是:labVIEW进行六面颜色识别,构建出3D魔方,通过魔方解算算法,算出复原步骤,再通过串口发送给单片机,单片机识别指令,进而控制六路
    发表于 01-03 23:41

    魔方机器人

    算法。Kociemba算法是当今世界上复原魔方最少的算法,最长数只有21,并且其解算时间为ms级。2. 颜色识别方面应用机器学习领域
    发表于 02-28 23:18

    LEGO魔方机器人

    把LEGO组件加入到Labview中,通过Labview编程实现魔方复原的LEGO魔方机器人
    发表于 05-09 14:50

    C语言的算法设计之魔方

    今天一起分析C语言的算法之16:设计魔方阵。算法题目:设计魔方阵:魔方阵就是由自然数组成的方阵,方阵的每个元素都不相同,且每行和每列以及主副对角线上的各个元素之和都不相同。编程思路分析编程思路:1
    发表于 05-05 09:17

    这个机器人解开魔方的时间为0.38秒 破世界纪录

    目前复原魔方的世界纪录为0.637秒,是由一名叫Sub1 Reloaded的机器人完成的,而现在麻省理工学院的学生Ben Katz与开发人员Jared Di Carlo共同打造了一个新的
    的头像 发表于 03-12 16:31 3326次阅读

    继围棋、德扑之后,AI现在又在魔方领域碾压人类

    UCI的研究人员创造了一种人工智能系统,可以在没有任何领域知识和人类游戏指导的情况下,在1.2秒复原魔方,远快于目前3.47秒的人类纪录。继围棋、德扑之后,AI又在魔方领域碾压人类。
    的头像 发表于 07-22 09:10 2704次阅读

    OpenAI的AI机器人可用单手就能还原魔方

    人工智能(AI)研究组织OpenAI在制造具有通用性、能够自我学习的机器人方面取得了新的里程碑。该组织的机器人部门表示,其去年首次亮相的机器人手Dactyl已经学会了单手解魔方
    发表于 10-17 09:45 1407次阅读

    诺丁汉大学用深度学习复原魔方

    的方式实现魔方复原。 近日,诺丁汉大学(University of Nottingham)副教授 Colin G. Johnson 带领的研究小组开发出一种深度学习技术,可以从一套样本解决方案中学习 “适应度函数” 并用它来解决魔方
    的头像 发表于 03-03 13:58 1574次阅读

    基于RT-Thread开发电子魔方实现功能

    GUI为纯软件开发,在电脑上运行,可以通过鼠标或键盘操作,实现魔方的转动。为配合电子魔方,设计了界面,8魔方共有24个方向可转动(反向可以通过旋转
    的头像 发表于 07-15 11:31 1399次阅读

    求解瞬态问题时,如何选择和时

    求解瞬态问题时,如何选择和时? 瞬态问题在工程领域中也称为动态问题,是指在时间上持续变化的物理问题。因为涉及到时间因素,因此在求解瞬态问题时需要考虑时间步长和
    的头像 发表于 10-29 11:35 793次阅读

    基于树莓派RP2040单片机设计的三魔方还原机器人

    这是一款基于树莓派RP2040单片机设计的三魔方还原机器人,控制和魔方求解都使用单片机完成。对于随机打乱的三魔方,平均还原步骤
    的头像 发表于 01-12 13:37 1334次阅读
    基于树莓派RP2040单片机设计的三<b class='flag-5'>阶</b><b class='flag-5'>魔方</b>还原机器人

    基于树莓派RP2040的解魔方机器人,7秒还原三魔方

    地望着你,是时候亮出工程师的魔法神器了。今天特别分享@爱跑步的小何大佬的开源佳作——三魔方还原机器人。三魔方还原机器人-开源分享-这是一款基于树莓派RP2040单片机设
    的头像 发表于 01-13 08:04 1740次阅读
    基于树莓派RP2040的解<b class='flag-5'>魔方</b>机器人,7秒还原三<b class='flag-5'>阶</b><b class='flag-5'>魔方</b>