0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI的定位和导航类似于大脑的位置细胞和网格细胞

DPVg_AI_era 来源:未知 作者:李倩 2018-05-13 10:43 次阅读

近日,DeepMind 在 Nature 上发表的一篇论文引起 AI 领域和神经科学领域的极大震撼:AI 展现出与人脑 “网格细胞” 高度一致的空间导航能力。甚至有些学者认为,凭着这篇论文,DeepMind 的作者有可能问鼎诺贝尔奖。本文作者邓侃博士对这篇突破性的论文进行了解读。

Google 麾下的 DeepMind 公司,不仅会下围棋,而且写的论文也顶呱呱。

2018/5/10,今天的微信朋友圈,被DeepMind 一篇论文刷屏了。论文发表在最近一期 Nature 杂志上,题目是Vector-based navigation using grid-like representations in artificial agents [1]。

有些学者认为,凭着这篇论文,DeepMind 的作者有可能问鼎诺贝尔奖[2]。

重要意义:AI的定位和导航类似于大脑的位置细胞和网格细胞

其实这篇论文是DeepMind 人工智能团队,与 University College of London(UCL) 的生物学家,合作的产物。

对空间的定位和导航能力,是生物的本能。早在 1971 年,UCL 的生理学教授 John O'Keefe 在大脑海马体中,发现了位置细胞(Place Cell)。随后 O'Keefe 的学生,Moser 夫妇于 2005 年发现,在大脑内嗅皮层,存在一种更为神奇的神经元,网格细胞(Grid Cell)。在运动过程中,生物的网格细胞,把空间分割为蜂窝那样的六边形,并且把运动轨迹记录在蜂窝状的网格上。

2014 年的诺贝尔生理学/医学奖,颁发给了John O'Keefe 和Moser 夫妇。

人工智能深度学习模型,经常被诟病的一大软肋,是缺乏生理学理论基础。深度学习模型中的隐节点的物理意义,也无法解释。

DeepMind 和 UCL 合著的 Nature 论文,发现深度学习模型中隐节点,与脑内的位置细胞和网格细胞,这两者的激活机制和数值分布,非常相似,几乎呈一一对应的关系。

Extended Data Fig 3.d:第一行,深度学习模型的隐节点的激活机制和数值分布。第二行,Moser 夫妇发现的网格细胞的蜂窝状数值分布。深度学习隐节点与网格细胞的数值分布,极为相似。第三行,数值分布所揭示的空间定位及运动方向。

这篇论文,之所以引起学界轰动,原因在于证明了,把深度学习模型用于空间的定位和导航,其隐节点的物理意义,类似于大脑的位置细胞和网格细胞。进一步猜想,深度学习模型的定位和导航的计算过程,很可能与大脑的定位和导航的生理机制,也极为相似。

为什么DeepMind 热衷于玩游戏?

面向空间定位和导航的深度学习模型,有哪些应用场景呢?DeepMind 把这个技术用于玩电子游戏,类似于 “反恐精英”(Counter Strike)那样的走迷宫射杀***的游戏。

DeepMind 下完围棋以后,玩初级电子游戏,现在升级了,改玩高级游戏了。为什么DeepMind 那么热衷于游戏呢?

游戏是仿真系统,一切尽在掌控之中,想要什么数据,就能获取什么数据。所以,每条数据,都很全面,不会有数据丢失。

同时,只要多雇一些玩家,多花一点时间,要多少训练数据,就有多少训练数据。

用游戏来验证深度学习模型,非常方便。这是 DeepMind 热衷于玩游戏的原因。同时,因为能够快速地获取数据,DeepMind 对于深度学习和强化学习研究,领先世界。

Figure 3. DeepMind 把基于深度学习的空间定位和导航技术,应用于反恐精英(Counter Strike)游戏。

问题是,把适用于游戏的深度学习模型,移用到真实世界,解决实际问题,是否仍然有效?

同是 Google 麾下兄弟,Google Brain 更注重解决实际问题,兄弟俩各有千秋。Google Brain 开发的 Tensorflow成为工程利器,而 DeepMind 的论文,提供新方法,引领研究前沿。

深度学习仿真位置和网格细胞的论文,技术上有什么创新?

短的答案,没有独特的创新。

长的答案,得先讲讲马尔科夫和强化学习。

强化学习(Reinforcement Learning)是机器学习的一个重要分支,它试图解决决策优化的问题。所谓决策优化,是指面对特定状态(State,S),采取什么行动方案(Action,A),才能使收益最大(Reward,R)。很多问题都与决策优化有关,从下棋,到投资,到课程安排,到驾车,到走迷宫等等。

AlphaGo 的核心算法,就是强化学习。AlphaGo不仅稳超胜券地战胜了当今世界所有人类高手,而且甚至不需要学习人类棋手的棋谱,完全靠自己摸索,在短短几天内,发现并超越了一千多年来人类积累的全部围棋战略战术。

最简单的强化学习的数学模型,是马尔科夫决策过程(Markov Decision Process,MDP)。之所以说 MDP 是一个简单的模型,是因为它对问题做了很多限制。

1. 面对的状态 s_{t},数量 t = 1... T,T 是有限的。

2. 采取的行动方案 a_{t},数量t = 1... T,T也是有限的。

3.对应于特定状态 s_{t},当下的收益 r_{t} 是明确的。

4. 在某一个时刻 t,采取了行动方案 a_{t},状态从当前的 s_{t} 转换成下一个状态 s_{t+1}。下一个状态s_{t+1}有多种可能,从当前状态 s_{t}转换到下一个状态中的某一种状态的概率,称为转换概率。但是转换概率,只依赖于当前状态 s_{t},而与先前的状态,s_{t-1}, s_{t-2} ... 无关。

解决马尔科夫决策过程问题的常用的算法,是动态规划(Dynamic Programming)。

对马尔科夫决策过程的各项限制,不断放松,研究相应的算法,是强化学习的目标。

例如对状态 s_{t}放松限制,

1. 假如状态 s_{t} 的数量t = 1... T,T虽然有限,但是数量巨大,或者有数量无限,如何改进算法?

2.假如状态 s_{t} 不能完全确定,只能被部分观察到,剩余部分被遮挡或缺失,如何改进算法?

3. 假如转换概率,不仅依赖于当前状态,而且依赖于先前的运动轨迹,如何改进算法?

4. 假如遇到先前没有遇见过的新状态s_{t},有没有可能在以往遇见过的状态中,找到相似状态,从而估算转换概率,估算收益?

Extended Data Fig 5. 用GridLSTM 来总结以往的运动轨迹,并加上神经网络 g 来判别当前的空间定位和运动方向。然后基于对当前的空间定位和导航的判断,用另一个 LSTM 来估算状态转换概率,从而决定导航策略。

这篇论文用深度学习模型,来仿真位置和网格细胞。具体来说,

1.用 CNN 来处理图像,找到周边环境中的标志物,用于识别当前的空间位置。

2. 把图像处理的结果,与以往的运动轨迹相结合,用GridLSTM 来估算当前的状态。

3. 把GridLSTM 估算出的当前状态,经过一个神经网络 g 的再加工,得到类似于位置细胞和网格细胞的隐节点。

4. 把当前的位置和运动方向,以及目标的位置,作为第二个 LSTM 模型的输入,确定导航决策。

上述所有模块,都是现成技术的集成,并无显著创新。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 导航
    +关注

    关注

    7

    文章

    528

    浏览量

    42405
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238255
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121111

原文标题:专家解读DeepMind最新论文:深度学习模型复现大脑网格细胞

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    人类首创能生成神经细胞的“迷你大脑”,更精确模拟神经网络!

    `近日,凯斯西储大学医学院、纽约干细胞基金会(NYSCF)研究所和乔治华盛顿大学的研究人员联合提出了一种新方法,通过人类胚胎干细胞培育生成3D版的“迷你大脑”。这些“迷你大脑”名为“
    发表于 08-21 09:26

    人工智能可助辨识细胞结构

    美国艾伦细胞科学研究所的科学家使用机器学习技术训练计算机,使其可在不使用荧光标记的情况下较为准确地辨认出细胞结构。传统的荧光显微法使用发光分子标记来确定细胞结构,但价格昂贵且每次只能观察一部分结构
    发表于 10-15 05:21

    细胞的同时AFM荧光成像应用简报

    细胞的同时AFM /荧光成像 - 应用简报
    发表于 10-23 10:39

    Eversipn STT-MRAM的MJT细胞介绍

    Eversipn STT-MRAM的MJT细胞
    发表于 02-24 07:28

    细胞融合与单克隆抗体

    细胞融合(cell fusion),又称体细胞杂交(somatic hybridiazation),是指两个或更多个相同或不同细胞通过膜 融合形成单个细胞的过程。Muller
    发表于 02-17 10:02 0次下载

    总线细胞阵列中空闲细胞冗余数量研究

    总线细胞阵列中空闲细胞冗余数量研究_王涛
    发表于 01-07 21:39 0次下载

    细胞的产生与美国科学家成功制造出具有造血干细胞功能的细胞

    英国《自然》杂志 16 日发表了两项干细胞研究重要进展,美国科学家成功将人体多能干细胞和小鼠内皮细胞转化为具有造血干细胞功能的细胞。最新成果
    发表于 09-22 15:27 8次下载

    首次创造出能生成神经细胞的3D版“迷你大脑

    由胚胎干细胞发育而来的“迷你大脑”,能够模拟与实际大脑相仿的细胞和神经间交互的过程,让研究人员更准确地观察到与脱髓鞘相关疾病的机理和发病过程,并探寻与这些疾病的新疗法,加速对相关疾病的
    的头像 发表于 08-01 09:10 3095次阅读

    T 细胞打入肿瘤细胞要先对好“暗号”

    具有肿瘤清除作用的免疫 T 细胞需要与肿瘤细胞对好“暗号”后,才能打入肿瘤组织内部
    的头像 发表于 06-19 09:20 3765次阅读

    无人机集群类脑导航系统的应用特点及发展现状研究

    随着网格细胞位置细胞及头朝向细胞等类脑认知导航细胞
    发表于 07-31 11:54 2497次阅读

    “解码”单细胞测序的故事

    有别传统的基因芯片,从超过混合数万个细胞中提取的DNA或者RNA进行测序,得出平均值。单细胞测序可以在单个细胞层面解析基因组及其表达调控特征,能更全面掌握
    的头像 发表于 03-17 11:02 2047次阅读

    基于CNN和LSTM的蛋白质亚细胞定位研究对比

    基于CNN和LSTM的蛋白质亚细胞定位研究对比
    发表于 06-11 14:16 15次下载

    基于人类乳腺细胞图谱中各细胞亚型之间的位置关系和空间联系

      人类细胞图谱计划(Human Cell Atlas,HCA)旨在描述人体中每个细胞(约37万亿个)的详细特征,呈现不同类型细胞在人体组织的三维结构,勾勒他们在人体系统内的联系,揭示图谱变化与健康
    的头像 发表于 07-23 15:02 691次阅读
    基于人类乳腺<b class='flag-5'>细胞</b>图谱中各<b class='flag-5'>细胞</b>亚型之间的<b class='flag-5'>位置</b>关系和空间联系

    细胞细胞注释详解之singleR细胞注释

    除了对每个细胞的所属细胞类型进行评分外,singleR还会对seuret聚类结果中每个cluster中各细胞类型比例进行分析,评估每个cluster所属的细胞类型。结果由
    的头像 发表于 09-21 17:34 2282次阅读
    单<b class='flag-5'>细胞</b><b class='flag-5'>细胞</b>注释详解之singleR<b class='flag-5'>细胞</b>注释

    细胞的“聚光灯”——前沿活细胞成像的案例分享

    细胞是一切生命的基本单位,构成了各式各样的生命体。因此研究细胞的结构以及内部生命活动过程可以帮助我们更深入地探究生命的奥秘,了解生命体是如何构建和运作的。传统的细胞显微术只能通过观察固定的细胞
    的头像 发表于 10-24 08:04 297次阅读
    活<b class='flag-5'>细胞</b>的“聚光灯”——前沿活<b class='flag-5'>细胞</b>成像的案例分享