0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一本100页的机器学习书籍近日大受好评

DPVg_AI_era 来源:未知 作者:李倩 2018-11-20 09:27 次阅读

这是一本只有100页,任何只要有基础数学知识的人都能看懂的机器学习书籍。本书将涵盖非监督学习和监督学习、包括神经网络,以及计算机科学、数学和统计学中最重要的一些机器学习问题。

一本100页的机器学习书籍近日大受好评。

书名The Hundred-Page Machine Learning Book,作者Andriy Burkov是Gartner的机器学习团队leader,人工智能专业PhD,有近20年各种计算项目的工作经验。

作者表示,他的目标是写一本任何有基础数学知识的人都能看懂的机器学习书籍。

这本书的前5章已经在该书的配套网站上公开。这本书将涵盖非监督学习和监督学习,包括神经网络,以及计算机科学、数学和统计学中最重要的一些ML问题,并通过例子提供直观的解释。代码和数据也将在网站上公开。

作者相信一本书应该“先读后买”,不仅可以免费下载已公开的章节,你也可以在这里订阅即将出版的章节:

http://themlbook.com/wiki/doku.php

已发布章节:

第1章:简介

第一部分:监督学习

第2章:符号和定义

第3章:基本算法

第4章:剖析学习算法

第5章:基本实践

以下是试读:第3章:基本算法

试读:第3章:基本算法

在本章中,我们描述了五种算法,这些算法不仅是最著名的,而且要么自身非常有效,要么被用作最有效的学习算法的构建块。

3.1 线性回归

线性回归是一种常用的回归学习算法,它学习的模型是输入示例特征的线性组合。

问题陈述

我们有一个标记示例的集合,其中N是集合的大小,是示例i = 1的D维特征向量,是一个实值目标(也是一个实数。

我们想要建立一个模型作为示例x的特征的线性组合:

其中w是参数的D维向量,b*是实数,wx是点积。符号表示模型f由两个值参数化:w和b。

图1:一维示例的线性回归。

3.2 逻辑回归

首先要说的是逻辑回归不是回归,而是一个分类学习算法。这个名称来自统计学,因为逻辑回归的数学公式与线性回归的数学公式相似。

我们将在二元分类的情况下解释逻辑回归。但它也可以扩展到多元分类。

问题陈述

在逻辑回归中,我们仍然希望将这样的特征的线性组合是从负无穷大到正无穷大的函数,而只有两个可能的值。

在没有计算机的年代,科学家们不得不手工进行计算,他们非常想找到一个线性分类模型。他们发现如果将负标签定义为0,将正标签定义为1,就只需要找到一个codomain为(0,1)的简单连续函数。在这种情况下,如果模型为输入x返回的值更接近于0,那么我们为x分配负标签,否则,该示例将被标记为正。具有这种属性的一个函数是标准逻辑函数(也称为sigmoid函数):

如图3所示。

图3:标准逻辑函数

3.3 决策树学习

决策树是一个可用于做决策的非循环图。在图的每个分支节点中,检查特征向量的特定特征j。如果特征的值低于特定的阈值,则遵循左分支,否则,遵循右分支。当到达叶节点时,决定该示例所属的类。

问题陈述

我们有一组带标签的示例;标签属于集合{0,1}。我们想要构建一个决策树,允许我们在给定特征向量的情况下预测示例的类。

图4:决策树构建算法的图示。

3.4 支持向量机

关于SVM,有两个重要问题需要回答:

如果数据中存在噪声,并且没有超平面可以将正例和负例完美分开,该怎么办?

如果数据不能使用平面分离,但可以用高阶多项式分离呢?

图5:线性不可分的情况。左:存在噪音。右:固有的非线性。

如图5中描述的两种情况。在左边的示例中,如果没有噪声(异常值或带有错误标签的示例),数据可以用直线分隔。在正确的情况下,决策边界是一个圆,而不是一条直线。

3.5 k-Nearest Neighbors

k-Nearest Neighbors(kNN)是一种非参数学习算法。与其他在构建模型后丢弃训练数据的学习算法相反,kNN将所有训练示例保存在内存中。一旦出现了一个新的、以前没见过的示例,kNN算法会在D维空间中找到k个最接近的例子并返回多数标签(在分类的情况下)或平均标签(在回归的情况下)。

两点的接近程度由距离函数给出。例如,上面看到的Euclidean distance在实践中经常使用。距离函数的另一个常用选择是负余弦相似性。余弦相似度的定义如下:

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4762

    浏览量

    100537
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132407
  • 决策树
    +关注

    关注

    2

    文章

    96

    浏览量

    13539

原文标题:100页的机器学习入门书:只要有基础数学知识就能看懂!(免费下载)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于PYNQ和机器学习探索MPSOC笔记

    新版本中,不仅仅介绍了MPSOC的体系结构和应用场景,更是结合当前应用最广的PYNQ框架和机器学习应用进行分析。作为一本不可多得的免费电子英文书籍,本书既是使用Zynq MPSoC的开
    的头像 发表于 11-16 11:32 184次阅读
    基于PYNQ和<b class='flag-5'>机器</b><b class='flag-5'>学习</b>探索MPSOC笔记

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析学习,这就使得它逐渐成为智能数据分析技术的创新源之
    的头像 发表于 11-16 01:07 224次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下个浪潮!

    复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术结合,探索更加先进的知识表示和记忆模块,利用强化学习步优化决策过程。 具身智能的发展需要更多跨学科
    发表于 11-11 10:20

    书籍评测活动NO.49】大模型启示录:一本AI应用百科全书

    的大模型场景。 本书像一本AI应用百科全书,给予读者落地大模型时的启发。 本书的作者来自大模型应用公司微软Copilot的产品经理、最前沿的大模型研究员、国际对冲基金、云厂商前战略总监,具有丰富的落地
    发表于 10-28 15:34

    电磁兼容工程英文版

    一本关于电磁兼容的书籍,原版(英文)电子版, 供大家学习参考 也可以当个工具书使用。
    发表于 08-16 08:14

    【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

    清晰,从时间序列分析的基础理论出发,逐步深入到机器学习算法在时间序列预测中的应用,内容全面,循序渐进。每章都经过精心设计,对理论知识进行了详细的阐述,对实际案例进行了生动的展示,使读者在理论与实践
    发表于 08-12 11:28

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了个让我学习时间序列及应用的机会! 前言第
    发表于 08-11 17:55

    仓颉语言书籍申请

    楼主, 您好!我是名接触开发语言不久,对语言学习充满热情的开发者小白,近期对华为推出的仓颉语言产生了浓厚的兴趣。为了更深入地了解和学习这种语言,我希望能申请一本关于仓颉语言的
    发表于 08-06 08:37

    名单公布!【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来?

    ,如何将机器学习、深度学习或者大模型技术应用在大规模的数据生产中,是个非常关键的问题。 国内外已出版了许多关于机器
    发表于 06-25 15:00

    Snap将AI和机器学习引入Snapchat

    Snap首席执行官伊万·斯皮格近日宣布,公司将加大投资力度,将人工智能和机器学习技术深度引入其主打社交应用Snapchat,以进步提升用户吸引力。斯皮格直言,公司在
    的头像 发表于 05-21 09:31 474次阅读

    名单公布!【书籍评测活动NO.32】硬核科普书《计算》,豆瓣评分9.8,荣膺图书界至高奖项

    ,它还被中国开发者评选为 2023年年度IT图书 ! 此外,本书在豆瓣上也收获了大家众多好评,获得豆瓣评分9.8的高分! 这到底是怎样的一本书,如此备受专家和读者共同推崇呢? 我们为什么需要《计算
    发表于 05-08 13:59

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第章)

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第章) 申请这本书的时候就看到了书评中有几点吸引我,让我希望拜读下: 本书的作者是RISC-V架构的作者、著名
    发表于 01-24 19:06

    【RISC-V开放架构设计之道|阅读体验】学习处理器体系架构的一本好书

    并不是一本简单罗列指令的书籍,而是一本全面介绍指令设计理念的书籍书籍的内容充分反映了最新的计算机指令设计的理念,这是我推荐该书的最主要理由
    发表于 01-23 20:08

    《Linux常用命令自学手册》+一本手边linux速查字典

    ,即使不能时都记住,本书也可以作为办公桌边随时查阅的工具书。 我手头有一本也是《linux命令速查手册》,16K的很厚一本,和本书对比了下,有以下不同。 1、《Linux常用命令自
    发表于 12-26 08:46

    名单公布!【书籍评测活动NO.26】图灵奖得主亲自撰写!RISC-V开放架构设计之道

    和示例 此外,本书还介绍x86、ARM 和MIPS 的设计,通过对比分析,突显RISC-V 的优势。 《RISC-V开放架构设计之道》由中科院计算所包云岗老师团队担纲翻译,是一本著译双馨的上乘佳作
    发表于 12-13 17:25