2016年,一台超级计算机在复杂的棋盘游戏Go中击败了世界冠军。怎么样?通过使用强化学习,这是一种人工智能,计算机可以通过简单的指令对其进行编程后进行自我训练。计算机从错误中吸取教训,并逐步变得强大。
强化学习的主要缺点是它不能在某些实际应用中使用。那是因为在自我训练的过程中,计算机最初会尝试几乎所有事物,然后最终跌入正确的道路。对于某些应用程序(例如不允许容忍突然的温度波动的气候控制系统),此初始试错阶段可能会出现问题。
CSEM工程师已经开发出一种解决此问题的方法。他们表明,计算机可以首先在极为简化的理论模型上进行训练,然后再设置为在实际系统上学习。这意味着,当计算机在现实生活中的系统上开始机器学习过程时,它们可以借鉴先前在模型上学到的知识。因此,计算机可以快速走上正确的道路,而无需经历一段时间的剧烈波动。工程师的研究成果刚刚发表在关于神经网络和学习系统的IEEE Transactions中。
CSEM智能能源系统研究负责人,该研究的合著者Pierre-Jean Alet说:“这就像在开车前学习驾驶员手册一样。”“通过这一预培训步骤,计算机可以建立一个可以利用的知识库,从而在寻找正确答案时不会出现盲目情况。”
工程师使用三步过程在复杂的100个房间的建筑物中的加热,通风和空调(HVAC)系统上测试了他们的方法。首先,他们使用简单描述了建筑物行为的简单方程式对“虚拟模型”进行了计算机培训。然后他们将实际的建筑物数据(温度,百叶窗打开的时间,天气状况等)输入计算机,以使培训更加准确。最后,他们让计算机运行其强化学习算法,以找到管理HVAC系统的最佳方法。广泛的应用
这一发现可以通过将机器学习的使用范围扩大到运行参数的巨大波动会带来重大财务或安全成本的应用,从而为机器学习开辟新的视野。
责任编辑:lq
-
神经网络
+关注
关注
42文章
4759浏览量
100456 -
超级计算机
+关注
关注
2文章
459浏览量
41910 -
强化学习
+关注
关注
4文章
265浏览量
11203
发布评论请先 登录
相关推荐
评论