海啸、洪水、火山、地震,各种恶劣灾害在地球上经常上演。过去十年,地震和随之而来的海啸对受灾地造成了巨大的经济损失。地震通常是接连出现的,最先出现的是“主震”,随后是一系列“余震”。虽然这些余震大部分都比主震要小,但在某些情况下,它们可能会让重建工作变的更困难。虽然目前的技术已经能预测余震的时间和大小了,但想知道发生在什么位置却是有挑战性的工作。
为此,哈佛大学和谷歌的机器学习专家一起组建团队,研究能否用深度学习技术预测余震可能发生的位置。今天,这篇论文发表在《Nature》上。为了得到这一结果,研究团队首先搜集了世界上100多次地震的信息,并建立了数据库。
1992年南加利福尼亚州兰德斯地震可视化,中间的彩色区域表示第一次地震,红色方块表示余震位置
根据数据集,研究人员用一个神经网络来分析主震和余震位置之间对应的静态应力变化关系。算法可以辨别有用的形状。最终我们得到了一个可以预测余震位置的模型。
对兰德斯地震余震位置的预测。深红色区域表示预测有余震的范围,黑色的点表示实际发生的余震,黄线表示主震时发生断层的位置
这项研究最后也带来了意外的收获:它可以帮我们确定地震的物理数值,这对研究地震的生成很重要。当我们在数据集上应用神经网络时,我们可以看到内部因素的结合,它们是如何找到重要且有用的因素来帮助预测的。
下面就跟论智看看这篇论文大致讲了什么吧:
具体方法
为了训练和测试该模型,我们用的是SRCMOD在线数据集,其中含有有限断层模型。我们计算了SRCMOD中199个滑动分部的应力变化张量(其中包含118次主震)。以每次主震为中心,周围5km×5km×5km的范围内为一个立方体单位。我们从国际地震中心获得了主震过后一年内的余震记录,将它们表示在每个立方体单位内。
通过这种表示方法,余震预报可以看作是大型二元分类问题,我们的目标就是精准分辨每个立方体单位内是否会有余震发生。
神经网络就是应对这种问题的最好算法。这里使用的神经网络是全连接的,共有六个隐藏层,每个隐藏层中包含50个神经元,并具有双曲正切函数(总共有13451个权重和偏值)。我们用Keras搭建神经网络,用Theano训练它。在训练时,有10%的训练数据样本用于验证。
第一层网络处理的是神经网络的输入,在该案例下,输入的是在中心计算的应力变化张量的六个独立分量的大小及其负值。在解决二元分类问题的神经网络中,最后一层通常是单一sigmoid函数。而在我们的案例中,最后一个神经元的输出可以理解成一个单元内生成一次或多次余震的概率。
模型评估
我们用ROC分析对余震预测模型进行了评估,ROC曲线广泛用于评测医疗诊断检测的有效性。结果如图1所示:
图1,上排为实际地震情况,下排为神经网络预测结果
ROC分析结果表示,神经网络的预测比目前使用的方法效果要好,神经网络模型的AUC分数为0.849,而传统的方法AUC分数仅为0.583。
除此之外,我们运用排列测验法检验神经网络在测试数据集上的数据重要性。对每个测试集中的主震分布,我们会随机生成5000个位置,然后再计算出各自的AUC值。将这些值与实际的AUC比较,生成一个P值。
另外,我们发现,经过学习的余震发生模式是可以用物理解释的:剪应力的最大变化、Von Mises屈服准则以及应力变化张量的独立元素绝对值之和都能解释神经网络预测中98%的方差。这种机器学习做出的决策不仅能提高对余震发生位置预测的精确度而且还能确定它蕴涵的能量。
结语
虽然这一系统还并不精准,但为未来的研究打下了基础。也许有一天,机器学习预报器能够用在灾难应急中,对危险区域的疏散转移计划提供帮助。
-
神经网络
+关注
关注
42文章
4765浏览量
100585 -
数据库
+关注
关注
7文章
3770浏览量
64295 -
深度学习
+关注
关注
73文章
5493浏览量
121014
原文标题:谷歌与哈佛大学合作,用深度学习预测余震位置
文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
评论