0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种新颖的基于模型的机器学习方式——model based machine learning

nlfO_thejiangme 来源:未知 作者:李倩 2018-10-21 10:50 次阅读

近日,著名机器学习教材《Pattern Recognition and Machine Learning》的作者Christopher Bishop教授更新了他的机器学习新书:Model-Based Machine Learning。

Christopher Bishop

微软研究院在英国剑桥的实验室主任,爱丁堡大学教授

在这本书中介绍了一种新颖的基于模型的机器学习方式——model based machine learning,将具体问题所面临的假设精确地用模型的方式表达出来,随后利用这一模型来建立适用于特定情况的算法,从而定制化地解决问题。由于算法可以被解耦成模型和推理使得构建的算法的过程可以部分的自动化。

近年来机器学习逐渐成为技术舞台的主角,在各个广泛的领域得到了应用。然而有效的使用机器学习,特别是对于初学者来说不是一件容易的事情。很多同学在利用机器学习解决真实世界的问题时常常会遇到下面一些疑惑:

“机器学习的方法和技术常常让我感到不知所措、要学的东西实在太多啦!”

“到底该用哪个算法呀?为啥这个的结果会比哪个好呢?”

“我面对的问题不满足任何标准算法的要求啊!”

······

还有很多各式各样的疑问充满了机器学习的历程和工程实践中。但这本书为我们带来了一个对机器视觉的全新视角:model-based 机器学习。基于模型的机器学习将会给你不同的视角解答上面的问题,并将帮助你创造出更加有效的算法,当然算法也更加透明。

那么,什么是基于模型的机器学习呢?

在过去的五年里,研究人员们构建了很多机器学习算法。工程师如果希望利用机器学习解决一个问题,要么选择其中的一个或几个来尝试,要们就创造自己的新算法。而在选择算法的时候,工程师们很大程度上都会选择自己熟悉的算法,同时选择也会收到响应软硬件条件的限制,最后选择的算法并不是最适合解决问题的算法。

然而基于模型的方法则为每一个问题寻求定制化的解决方案。与其将所面对的问题转换为适配于标准算法的形式,基于模型的机器学习则会设计出一种精确匹配问题的算法。

基于模型的机器学习,其核心观点在于与问题相关的所有假设都能通过模型的形式来构成。实际上,一个模型也正是由一系列假设所构成的,并用精确的数学形式表达出来。 这些假设包含了问题中变量的个数与类型以及变量之间的相互关系。例如,在本书中将以离奇的谋杀案为例建立一个模型来寻找凶手。这一模型的假设包含了嫌疑人的名单、可以的凶器以及不同嫌疑人使用不同凶器的可能。

这一模型随后被用于解决这一特定的机器学习问题。基于模型的机器学习几乎可以被用于解决任何种类的问题,这种通用的思路意味着你无须学习种类繁多的机器学习算法和技术。

那么为什么模型中的假设起到了如此重要的作用呢?难道它会证明机器学习不能单纯从数据中得到结果么?我们需要明白的是:任何算法都建立在一系列假设之上,尽管很多时候这些假设看起来不那么明显。不同的算法对应着不同的假设,当假设不是那么清晰的时候评判算法表现的唯一方法就是通过比较来获得经验结果。

做过项目的小伙伴对于这项工作一定深有体会,会耗费大量的时间,同时也不精确。如果尝试的算法都不满足要求的话,创造一个更好的算法更是难上加难。

模型还是算法?

让我们进一步分析模型和算法。可以把标准的机器学习算法看成是一个功能模块,输入数据输出结果。算法一定需要假设来将它从数千种不同算法中区分出来,然而在算法中这种假设很多时候是隐含且朦胧的。

从基于模型的观点来看,它包含了我们对特定问题所作的一系列假设。为了从模型中进行预测,我们需要读入数据并计算我们希望得到的变量。这一计算过程通常称为推理,将模型与推理结合起来就可以定义出一个机器学习算法,如下图所示:

按照基于模型的观点,算法是有一特定的模型和推理方法组成的,而模型则又由一系列假设组成,改变假设就可以——甚至在保持推理方法不变的情况下——得到不同的机器学习算法。

虽然推理的方法很多,但这一教科书为了解耦推理方法的影响,选择使用了相同的推理方法来与不同的模型组合。

基于模型的机器学习可应用与任何标准的机器学习任务,包括分类、聚类等,同时还将帮助更好地理解和掌控算法的表现,这些都将在书的后续章节中呈现。这种方式还可以通过改变模型来拓展任务的适用范围和提高精度

此外模型的假设十分清晰,这也为模型的可解释性做出了贡献,既有利于理解性能增强的原因,有利于沟通与交流,同时还可以帮助我们在出现问题的时候更好地解决,也有利于与适应、拓展和结合他人的解决方案。

一个例子

假设我们有一个任务是预测游戏中玩家技能的变化情况,机器学习参考书会告诉你有一个称为卡尔曼滤波的算法可以用于处理这一类问题。为了使用卡尔曼滤波,首先你需要将技能预测问题转换为标准卡尔曼滤波器可以处理的形式。如果运气好的话,将转换后的结果输入到卡尔曼滤波器中就可以得到较好的结果。

但很多情况是,这种现成算法的精度往往满足不了实际要求。那么你该如何去改造算法和软件来获得更好的结果呢?也许你应该成为卡尔曼滤波器方面的专家才能更好地改进算法,并实现更好的软件来解决问题。

然而如果用基于模型的观点来看,我们会从一系列解决方案必须满足的假设开始来定义模型,随后利用这一模型来创造对应的机器学习算法。如果你的假设恰好和卡尔曼滤波中隐含的假设对应的话,你的算法很可能得到精确的卡尔曼滤波器。不过你的模型可能在假设上有所不同,在这个例子中你得到了可能是一个卡尔曼滤波器的变种来解决问题。无论这个算法是否存在是否是一个新的算法,都没关系。你的目标是为问题找到最好的解决方案。

基于这些你就能得到一个改进结果的框架,可以通过检视和改造假设来得到更好的模型,同时也得到了更好的算法。作为一个领域的专家,理解和改变问题的假设比改进机器学习算法容易多了。即使你的目标是理解卡尔曼滤波器,那么从模型的假设出发也是一条更为清晰和简单的路径来学习算法那并理解它是如何运行的。

工具

这本书和其他教材一样也提供了有力的工具供大家使用学习。由于算法被分解成了模型和相应的推理方法,只需要定义模型和选择相应的推理方法即可定义算法。这样研究人员可以聚焦于创造专业问题的模型,而不是纠结于各种推理方法和算法本身。作者在微软研究院工作期间开发了一套称为Infer.NET的工具,通过将假设表示成简洁的代码随后自动化生成复杂的算法代码。作者提供了一系列模型源码和infer模块。

http://research.microsoft.com/infernet

如何阅读?

这本书面向所有想要使用机器学习算法解决现实问题的技术人员,是一本应用导向的书。(但对于想要理解数学原理的读者,作者提供了Deep-dive章节)。书中的每一章都是对于一个案例的解决过程,对于一个真实世界的案例,作者将带领我们从数据获取、知识分析、可视化、构建模型、推理、验证、发现问题和改进系统等方面来学会如何通过基于模型的方式构建出更好的算法来解决问题。

主要分为以下几个章节的内容:

第一章:通过破解一个离奇谋杀案来介绍基于模型机器学习的基本概念;

第二章:基于测试答案来判断个人能力的例子用于介绍如何使用model-based方法;

第三章:model-based方法的真实应用,匹配在线游戏的玩家;

第四章:构建一个模型帮助人们处理杂乱的收件箱;

第五章:构建一个推荐系统,匹配用户和喜欢的电影;

第六章:通过为过敏建模来理解儿童哮喘病;

第七章:治理拥堵;

第八章:其它模型。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    162

    文章

    4370

    浏览量

    120307
  • 模型
    +关注

    关注

    1

    文章

    3241

    浏览量

    48833
  • 机器学习
    +关注

    关注

    66

    文章

    8416

    浏览量

    132619

原文标题:从Model-based独特视角看机器学习

文章出处:【微信号:thejiangmen,微信公众号:将门创投】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    自然语言处理与机器学习的关系 自然语言处理的基本概念及步骤

    Learning,简称ML)是人工智能的个核心领域,它使计算机能够从数据中学习并做出预测或决策。自然语言处理与机器学习之间有着密切的关系
    的头像 发表于 12-05 15:21 468次阅读

    一种基于深度学习的二维拉曼光谱算法

    近日,天津大学精密仪器与光电子工程学院的光子芯片实验室提出了一种基于深度学习的二维拉曼光谱算法,成果以“Rapid and accurate bacteria identification
    的头像 发表于 11-07 09:08 209次阅读
    <b class='flag-5'>一种</b>基于深度<b class='flag-5'>学习</b>的二维拉曼光谱算法

    麻省理工学院推出新型机器人训练模型

    近日,据TechCrunch报道,麻省理工学院的研究团队展示了一种创新的机器人训练模型,该模型突破了传统模仿学习方法的局限,不再依赖标准数据
    的头像 发表于 11-04 14:56 491次阅读

    具身智能与机器学习的关系

    具身智能(Embodied Intelligence)和机器学习Machine Learning)是人工智能领域的两个重要概念,它们之间存在着密切的关系。 1. 具身智能的定义 具身
    的头像 发表于 10-27 10:33 367次阅读

    AI大模型与深度学习的关系

    AI大模型与深度学习之间存在着密不可分的关系,它们互为促进,相辅相成。以下是对两者关系的介绍: 、深度学习是AI大模型的基础 技术支撑 :
    的头像 发表于 10-23 15:25 724次阅读

    AI大模型与传统机器学习的区别

    AI大模型与传统机器学习在多个方面存在显著的区别。以下是对这些区别的介绍: 模型规模与复杂度 AI大
    的头像 发表于 10-23 15:01 615次阅读

    【《大语言模型应用指南》阅读体验】+ 基础知识学习

    语言的表达方式和生成能力。通过预测文本中缺失的部分或下个词,模型逐渐掌握语言的规律和特征。 常用的模型结构 Transformer架构:大语言
    发表于 08-02 11:03

    构建\"PSOC_Edge_Machine_Learning_Profiler\" 项目,未找到 cy_ml_inference.h文件怎么解决?

    我正试图构建\"PSOC_Edge_Machine_Learning_Profiler\" 项目,但发现个错误。 其中 cy_ml_inference.h 文件未找到。 请提供获取该文件的方法
    发表于 07-23 07:59

    rup是一种什么模型

    RUP(Rational Unified Process,统建模语言)是一种软件开发过程模型,它是一种迭代和增量的软件开发方法。RUP是由Rational Software公司(现为
    的头像 发表于 07-09 10:13 1259次阅读

    llm模型和chatGPT的区别

    LLM(Large Language Model)是指大型语言模型,它们是类使用深度学习技术构建的自然语言处理(NLP)模型。LLM
    的头像 发表于 07-09 09:55 1066次阅读

    keras模型转tensorflow session

    和训练深度学习模型。Keras是基于TensorFlow、Theano或CNTK等底层计算框架构建的。TensorFlow是个开源的机器学习
    的头像 发表于 07-05 09:36 534次阅读

    人工神经网络模型一种什么模型

    人工神经网络(Artificial Neural Networks,简称ANNs)是一种受生物神经网络启发而产生的数学模型,用于模拟人脑处理信息的方式。它由大量的节点(或称为神经元)相互连接而成
    的头像 发表于 07-04 16:57 944次阅读

    人工智能、机器学习和深度学习是什么

    在科技日新月异的今天,人工智能(Artificial Intelligence, AI)、机器学习Machine Learning, ML)和深度
    的头像 发表于 07-03 18:22 1289次阅读

    一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法

    [22]。就像平均池化样,最大池化是另一种用于减小特征图大小的常用方法。它通过仅取每个区域的最大值来获得最重要的特征。在机器学习中,池化方法的选择可以显着影响
    发表于 05-11 20:01

    如何使用TensorFlow构建机器学习模型

    在这篇文章中,我将逐步讲解如何使用 TensorFlow 创建个简单的机器学习模型
    的头像 发表于 01-08 09:25 984次阅读
    如何使用TensorFlow构建<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>模型</b>