0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从奥卡姆剃刀理论到机器学习,机器学习应用任重道远

MqC7_CAAI_1981 来源:未知 作者:李倩 2018-06-20 15:05 次阅读

站在2018年,图像分类准确率在95%以上的模型,已经遍地都是。回想2012年,被称之为“深度学习教父”的Hinton带着学生们以ImageNet16.4%的错误率震惊计算机视觉研究界,似乎已经是远古时期的历史。

通常认为机器学习是过去几十年发展出来的一个新学科,但王立威教授看来,其实机器学习一直伴随着人类文明的发展。从人类真正有文明、有科学那天,就有机器学习。

王立威

北京大学信息科学技术学院教授。主要从事机器学习理论研究。高水平论文100余篇。2011年入选在机器学习国际权威期刊会议发表由人工智能国际期刊IEEE Intelligence Systems评选的AI’s 10 to Watch,是该奖项自设立以来首位获此荣誉的亚洲学者。2012年获得首届国家自然科学基金优秀青年基金。担任国际机器学习旗舰会议NIPS领域主席。

从奥卡姆剃刀理论到机器学习

早在13世纪,威廉姆·奥卡姆就提出“奥卡姆剃刀理论”,这个原理称为“如无必要,勿增实体”,即“简单有效原理”。对这个理论的解释,还有一位更著名的科学家和一段更著名的话——“Everythingshouldbe made as simple as possible but no simpler”,这句话出自爱因斯坦,意思是做理论的时候一定要尽可能的简单,但又不能过于简单。对应物理模型,一定要找到一些模型,允许存在一定的误差,但又不能过于简单,否则和观测的数据误差太大也不行,“奥卡姆剃刀理论”就是机器学习或者整个人类在获取科学知识的历程中,最核心、最本质的思想。

机器学习理论究竟有什么意义?只为了证明界(bound),为了说明算法在实际应用的错误率能小于多少,还是说它在传达更高层的信息?王教授的观点是,机器学习理论是后者,绝对不是为了证明一个算法的边界如何;机器学习理论的目的,在于提供对机器学习问题的洞察和理解。

而“泛化”则是学习理论最重要的概念之一。学习目的是希望学好一个模型,并且让这个模型在未来的场景数据上有非常高的准确度。泛化的错误,就是指一个模型在未来的应用场景下的错误率,即泛化误差。通常训练模型时,可以拿到很多训练数据,学一个分类器,在训练数据上得到一个错误率。而这个训练的错误率和泛化误差实际上是有本质区别的。这个区别正是机器学习理论要研究的内容。

机器学习应用任重道远

2012 年以来,不论是深度网络层数的不断拓展,还是系统在数据集上的优异表现,都让学术界对机器学习有了新的认识。彼时的王立威教授,已经在机器学习领域做了大量的研究,并凭借突出的表现在2011年成为首位入选 AI's 10 to Watch 的亚洲学者。

但王立威教授认为,这一切只是个开始。“机器学习在近年来取得了显著的突破与发展,除了理论的研究外,更重要的是,学者们需要看清技术对生活产生的重大影响。”王立威教授身处人工智能浪潮的前沿,自然也希望能在机器学习的应用领域有所作为。他认为有三个领域会与深度学习进行紧密的结合,并希望能够选择其中一个方面来进行深入研究:一个是无人驾驶;一个是金融领域;再一个则是医疗领域。王立威教授对机器学习在医学影像领域的应用也颇有研究。一方面,医学影像属于静态图像识别,相对于视频的处理技术要更加成熟;另一方面,依托北京大学的一系列附属医院,不论是从数据的获取或是系统的测试落地上,王立威教授所在的北京大学研究团队都有着得天独厚的优势。

王教授表示,如果开发者要执行的任务处于非常封闭的环境,和人的常识没有什么关系,这样的任务非常适合机器来做,但是如果这项任务和常识挂钩,例如对自然语言的理解,对于机器而言难度非常大。“医学影像相对而言是具有一定封闭性的问题。”

当然,不是说医学影像具有一定的封闭性,AI就能够在医学领域畅行无阻。王立威教授列举了两个AI对医学影像产生重大影像的案例——斯坦福团队在皮肤癌检测以及Google的DeepMind的糖网筛查。

王教授的观点是:

第一,医学影像处理病种的数量非常庞大,上述两个团队的例子解决的都是单病种问题。医学影像上一共可以分为两千多个的病种。“解决一个单病种已经不是简单的事情,斯坦福的团队已经和顶级的医学专家研究数年才得到目前的成果,要囊括两千多个病种更是难上加难。此外,病种与病种之间的差异度也很大,所以,AI 医学影像需要顶级医学专家和顶级机器学习学者通力合作才有可能成功。”

第二,成像设备的差异会产生多种类型的图像。CT、MRI、X光、超声、内窥镜、病理切片这些图像缺乏一定的标准。“现在我们只是在一些病种上进行单点突破,整个医学影像仍任重道远。”

毫无疑问,机器学习已经成为人工智能的主流研究方向之一。本次的CCAI2018大会,特别邀请北京大学信息科学技术学院教授王立威给我们呈现一场题为《机器学习简介——方法、应用与展望》的讲座。届时王教授将对机器学习领域的主要技术方法,包括深度学习、概率图模型、boosting、在线学习等进行简要介绍,同时分析这些方法的优势与局限。在本次大会的专题讲座中,王立威教授还将对目前人工智能领域最受关注的应用,包括人工智能医疗、金融、无人驾驶等,从机器学习技术的角度进行分析。王教授还将展望机器学习未来技术的发展方向与趋势,以及对产业应用可能带来的影响。让我们共同期待,共同迎接这场机器学习盛宴的到来吧!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8375

    浏览量

    132397
  • 深度学习
    +关注

    关注

    73

    文章

    5492

    浏览量

    120958

原文标题:CCAI2018 | 如无必要 勿增实体——机器学习方法、应用与展望

文章出处:【微信号:CAAI-1981,微信公众号:中国人工智能学会】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是机器学习?通过机器学习方法能解决哪些问题?

    来源:Master编程树“机器学习”最初的研究动机是让计算机系统具有人的学习能力以便实现人工智能。因为没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的
    的头像 发表于 11-16 01:07 194次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习机器
    的头像 发表于 11-15 09:19 270次阅读

    具身智能与机器学习的关系

    具身智能(Embodied Intelligence)和机器学习(Machine Learning)是人工智能领域的两个重要概念,它们之间存在着密切的关系。 1. 具身智能的定义 具身智能是指智能体
    的头像 发表于 10-27 10:33 267次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——让算法数据中学习
    发表于 10-24 17:22 2443次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    【「时间序列与机器学习」阅读体验】时间序列的信息提取

    个重要环节,目标是给定的时间序列数据中提取出有用的信息和特征,以支持后续的分析和预测任务。 特征工程(Feature Engineering)是将数据转换为更好地表示潜在问题的特征,从而提高机器学习
    发表于 08-17 21:12

    【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

    本人有些机器学习的基础,理解起来一点也不轻松,加油。 作者首先说明了时间序列的信息提取是时间序列分析的一个重要环节,目标是给定的时间序列数据中提取出有用的信息和特征,以支持后续的分析和预测任务,可以
    发表于 08-14 18:00

    【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

    清晰,时间序列分析的基础理论出发,逐步深入到机器学习算法在时间序列预测中的应用,内容全面,循序渐进。每一章都经过精心设计,对理论知识进行了
    发表于 08-12 11:28

    【「时间序列与机器学习」阅读体验】+ 简单建议

    这本书以其系统性的框架和深入浅出的讲解,为读者绘制了一幅时间序列分析与机器学习融合应用的宏伟蓝图。作者不仅扎实地构建了时间序列分析的基础知识,更巧妙地展示了机器学习如何在这一领域发挥巨
    发表于 08-12 11:21

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习》一书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了一个让我学习时间序列及应用的机会! 前言第一段描述了编写背景: 由此可知,这是一本关于时间序列进行大数
    发表于 08-11 17:55

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动数据中学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器
    的头像 发表于 07-02 11:25 743次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型数据中学习规律,为企业和组织提供了更高效、更准确的数据分析能力。本文将深入
    的头像 发表于 07-02 11:22 543次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1178次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集,在统计学习机器
    的头像 发表于 06-27 08:27 1567次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    机器学习8大调参技巧

    今天给大家一篇关于机器学习调参技巧的文章。超参数调优是机器学习例程中的基本步骤之一。该方法也称为超参数优化,需要搜索超参数的最佳配置以实现最佳性能。
    的头像 发表于 03-23 08:26 561次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>8大调参技巧

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建一个简单的机器学习模型。
    的头像 发表于 01-08 09:25 907次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b>模型