任何致力于将机器学习应用于现实世界问题的研究人员都可能会收到这样的答复:“作者提出了针对原始且具有高度动机的问题的解决方案,但这是一种应用,对于机器来说,其意义似乎是有限的,学习社区。”
这些话直接来自对我提交给NeurIPS(神经信息处理系统)会议(机器学习研究的顶级场所)的论文的评论。我在论文的评论中一再看到这种限制,我和我的合著者提出了一种受应用程序启发的方法,而且我也听到过无数其他人的类似故事。
这让我感到奇怪:如果社区认为以机器学习解决高影响力的现实世界问题的意义有限,那么我们要努力实现什么?
人工智能(pdf)的目标是推动机器智能的前沿。在机器学习领域,新颖的开发通常意味着新的算法或过程,或者在深度学习的情况下,意味着新的网络体系结构。正如其他人所指出的那样,这种对新颖方法的过度关注导致论文泛滥成灾,这些论文报告了基准数据集的边际或增量改进,并且随着研究人员争夺排行榜的头衔而出现了奖学金不足(pdf)。
同时,许多描述新应用的论文都提出了新颖的概念和高影响力的结果。但是,即使是“申请”一词的暗示,也似乎使审稿人看不惯论文。结果,这样的研究在主要会议上被边缘化了。他们的作者唯一真正的希望是让他们的论文在研讨会上被接受,而这些研讨会却很少受到社区的关注。
这是一个问题,因为机器学习在促进健康,农业,科学发现等方面具有广阔的前景。黑洞的第一个图像是使用机器学习生成的。蛋白质结构的最准确预测是药物发现的重要步骤,它是使用机器学习进行的。如果该领域的其他人优先考虑现实世界的应用程序,那么到现在我们还会做出哪些突破性的发现?
这不是新的启示。引用美国宇航局计算机科学家Kiri Wagstaf f的经典论文“重要的机器学习”(pdf):“当前的许多机器学习研究都与广泛的科学和社会的引入问题失去联系。” 瓦格斯塔夫(Wagstaff)发表论文的同一年,一个名为AlexNet的卷积神经网络赢得了以流行的ImageNet数据集为中心的备受瞩目的图像识别竞赛,这引起了对深度学习的兴趣激增。不幸的是,自那以后,她描述的脱节似乎变得更加严重。
错误的问题
边缘化应用研究具有真正的意义。基准数据集(例如ImageNet或COCO)是推进机器学习的关键。它们使算法能够在相同数据上进行训练和比较。但是,这些数据集包含可以建立到结果模型中的偏差。
-
人工智能
+关注
关注
1789文章
46636浏览量
236984 -
应用程序
+关注
关注
37文章
3237浏览量
57541 -
机器学习
+关注
关注
66文章
8347浏览量
132292
发布评论请先 登录
相关推荐
评论