0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍七本在注重打好数据科学的数学基础上的技术读物

DPVg_AI_era 来源:lp 2019-04-19 08:56 次阅读

机器学习和数据科学离不开数学,本文从数学基础的角度入手,推荐了数据科学和机器学习方面的七本参考书以及两本补充读物。相信对打好数学基础的相关人士会有所帮助。

大多数人学习数据科学的人都会把重点放在编程上,实际上编程能力确实是机器学习和数据科学领域的重要技能。但是,要真正精通数据科学和机器学习,必然不能忽视的数据科学背后的数学基础。

出于这个目的,本文介绍了七本在注重打好数据科学的数学基础上的技术读物。当然,涉及到数学,往往阅读体验可能不会很舒服,但要搞好机器学习,数学基础是必须要打牢的,所以努力读书吧!

先说一说为什么在数据科学学习时打好数学基础。

以下是我总结的几个原因:

AI领域无时无刻不在迅速变化。Hinton认为,我们也许应该重新思考反向传播。掌握牢固的数学知识有助于更好地理解AI的演变。一个数学基础深厚的人,对AI的理解和认识与其他仅从表面认识AI的人有很大的区别。此外,掌握数学知识还能更好地了解AI技术带来知识产权的潜力。最后,了解数据科学背后的数学知识,也可以让人更容易获得AI和数据科学的高端职位。

此外,作者推荐这几本书,还有两点个人原因:

1.作者在牛津大学教授物联网数据科学的课程,也包括一些AI技术应用方面的教学事务,在教学过程中涉及到数学基础知识和课程。

2.其次,作者在写一本书来简述人工智能,从数学的角度入手,目标读者是14到18岁的少年。要深入了解数学科学和人工智能数学的数学基础,你需要了解四个方面知识:线性代数,概率论,多元微积分和优化。目前在高中阶段至少会教授这些课程的一部分内容。因此,我试图将高中数学与人工智能和数据科学联系起来,重点是数学建模。

下面进入正题:

(1) The Nature Of Statistical Learning Theory《统计学习理论的本质》

作者:VladimirVapnik

PDF资源:

https://statisticalsupportandresearch.files.wordpress.com/2017/05/vladimir-vapnik-the-nature-of-statistical-learning-springer-2010.pdf

如果说要列一份关于数学的书单,这本书是绕不过去的。本书单中排名第一的就是俄罗斯著名数学家VladimirVapnik的《统计学习理论的本质》。在这份清单中的所有书籍中,Vapnik这本是最不好找的。VladimirVapnik是支持向量机(SVM)的创始人。他的维基百科页面中提供了更多关于他研究成果的介绍。

(2)Pattern Classification(2007-12-24)《模式分类》

作者:RichardODuda

PDF资源:

https://cds.cern.ch/record/683166/files/0471056693_TOC.pdf

就像Vapnik的著作一样,Duda的著作时另一个时代的另一部经典。本书初版于1973年,在二十多年后的2000年才推出第二版,此后一直未再版。时隔近二十年,本书仍然是一个重要资源。本书采用模式识别方法,并涵盖了广泛的算法

(3)

MachineLearning:AnAlgorithmicPerspective,SecondEdition(Chapman&Hall/CrcMachineLearning&PatternRecognition)

《机器学习:算法视角》

PDF资源:

https://doc.lagout.org/science/Artificial%20Intelligence/Machine%20learning/Machine%20Learning_%20An%20Algorithmic%20Perspective%20%282nd%20ed.%29%20%5BMarsland%202014-10-08%5D.pdf

这本书现在已经出版了第二版。此书第一版是我读过的最早的书关于机器学习和算法的著作之一,第二版增加了更多Python代码。与前两本书一样,本书也非常强调算法。

(4)

TheElementsofStatisticalLearning:DataMining,Inference,andPrediction,SecondEdition

《统计学习基础:数据挖掘、推理和预测》(第二版)

作者:TrevorHastie,RobertTibshirani,JeromeFriedman

PDF资源:https://web.stanford.edu/~hastie/Papers/ESLII.pdf

另一本经典之作,可以作为参考书。

(5)Pattern Recognition and Machine Learning (Information Science and Statistics)

《模式识别与机器学习(信息科学与统计)》

作者:ChristopherM.Bishop

PDF资源:http://users.isr.ist.utl.pt/~wurmd/Livros/school/Bishop%20-%20Pattern%20Recognition%20And%20Machine%20Learning%20-%20Springer%20%202006.pdf

ChristopherM.Bishop的模式识别和机器学习(信息科学和统计学)也是一本深入而精心设计的参考书。

(6)

MachineLearning:TheArtandScienceofAlgorithmsthatMakeSenseofData

作者:PeterFlach

PDF资源:http://www.cs.put.poznan.pl/tpawlak/files/ZMIO/W02.pdf

我喜欢PeterFlach的书,尽管亚马逊网站上的一些评论说这书写得太罗嗦,而且代码量显得不足。我特别喜欢这本书中的算法分组(逻辑模型,线性模型,概率模型)章节以及这些主题的整体讲述方式。

最后,是我最推荐的一本书:

(7)Deep Learning《深度学习

作者:Goodfellow、Bengio、Corville

相关资源:https://www.deeplearningbook.org/

如果你在找一本值得逐页读完的书,就是它了!这本书既详细,又有现代感,书中内容几乎涵盖了你能想到的关于深度学习的一切知识。

补充两本书:

A First Course in Machine Learning, Second Edition (Machine Learning & Pattern Recognition) by Simon Rogers, Mark Girolami

作者:SimonRogers,MarkGirolami

我觉得这本书并不太适合初学者,但它仍然是一本好书(特别是第二版)

MachineLearning:AProbabilisticPerspective

作者:KevinMurphy

这本书中评价也很高,但我个人没有读过(因此没有收集)。

写在最后:

除了最后一本《深度学习》之外,我建议其他书不必逐页阅读,而是将其作为参考书,根据需要按相应主题阅读相应的书籍。这些书教会了我时刻保持谦逊。无论我们现在知道了多少,掌握了多少知识,都总能在阅读过程中发现,这个领域原来是如此的庞大和复杂。

这些书已经超越了时间。VladimirVapnik现年已经81岁。Duda的著作初版于1973年。我预计50年以后,这个行业里的人们仍然会阅读这些著作。就像与那些经历了时间考验的老朋友们重逢一样。多年之后,也许你会发现,在眼花缭乱的技术、模型和框架背后,数学是永恒的。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29868

    浏览量

    268167
  • 机器学习
    +关注

    关注

    66

    文章

    8357

    浏览量

    132334
  • 数据科学
    +关注

    关注

    0

    文章

    164

    浏览量

    10040

原文标题:【荐书】提升机器学习数学基础,这7本书一定要读(附pdf资源)

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    科大讯飞发布讯飞星火4.0 Turbo:大能力超GPT-4 Turbo

    10月24日,科大讯飞全球1024开发者节,科大讯飞董事长刘庆峰正式发布了讯飞星火大模型的最新版本——讯飞星火4.0 Turbo。   据刘庆峰介绍,讯飞星火4.0 Turbo
    的头像 发表于 10-24 11:39 353次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    探讨了人工智能如何通过技术创新推动能源科学的进步,为未来的可持续发展提供了强大的支持。 首先,书中通过深入浅出的语言,介绍了人工智能在能源领域的基本概念和技术原理。这使得我对人工智能在
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    高效地筛选出具有潜力的药物候选分子,加速新药上市的进程。基因测序与编辑领域,AI技术将提高基因数据的处理速度和准确性,为个性化医疗和精准医疗提供有力支持。此外,AI技术还将推动生命
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    的物理可信度,还为科学研究提供了新的视角和方法。 5. 挑战与未来展望 第二章也提到了AI for Science面临的挑战和未来展望。尽管AI技术科学研究中取得了显著进展,但仍存在
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    ,无疑为读者铺设了一条探索人工智能(AI)如何深刻影响并推动科学创新的道路。阅读这一章后,我深刻感受到了人工智能技术科学领域的广泛应用潜
    发表于 10-14 09:12

    笔记电脑电感的应用

    今天带大家了解一下笔记电脑电感的应用 贴片功率电感 电压从5V转换成0.8V, 储能与释能:笔记电脑主板的供电电路中,当电路中的开关元件导通时,电感储存能量,确保笔记
    的头像 发表于 09-10 10:45 395次阅读
    笔记<b class='flag-5'>本</b>电脑<b class='flag-5'>上</b>电感的应用

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    大力发展AI for Science的原因。 第2章从科学研究底层的理论模式与主要困境,以及人工智能三要素(数据、算法、算力)出发,对AI for Science的技术支撑进行解读。 第3章
    发表于 09-09 13:54

    如意香山笔记软件适配工作稳步推进,成功运行多款Linux发行版及国产办公套件

    在上周刚结束的第四届 RISC-V 中国峰会(RISC-V Summit China 2024),中国科学院软件研究所主导研发的如意香山笔记——全球首台采用香山开源RISC-V高性能处理器核
    发表于 09-02 11:33

    固态SSD存储扩展新方案:突破容量限制,提升数据存储效能

    扩展SSD之前,务必做好数据迁移和备份工作。这包括将现有数据从旧硬盘转移到新SSD
    的头像 发表于 08-02 18:03 834次阅读
    固态SSD存储扩展新方案:突破容量限制,提升<b class='flag-5'>数据</b>存储效能

    ElfBoard技术贴|NXP源码基础上适配ELF 1开发板的按键功能

    本次源码适配工作是NXPi.MX6ULLEVK评估板的Linux内核源码(特定版本:Linux-imx_4.1.15)基础上进行的。主要目标是调整功能接口引脚配置,以适应ELF1开发板。接下来
    的头像 发表于 07-10 09:54 519次阅读
    ElfBoard<b class='flag-5'>技术</b>贴|<b class='flag-5'>在</b>NXP源码<b class='flag-5'>基础上</b>适配ELF 1开发板的按键功能

    如何在AIROC GUI获取良好数据包和总数据包?

    BT_1DH5_00001111_Fs80M.iqvsg 波形后 AIROC 工具中观察到的结果,总数据包和良好数据包均为零。 请您帮助我,如何在 AIROC GUI 获取良
    发表于 05-22 06:39

    名单公布!【书籍评测活动NO.32】硬核科普书《计算》,豆瓣评分9.8,荣膺图书界至高奖项

    ,它还被中国开发者评选为 2023年年度IT图书 ! 此外,本书豆瓣也收获了大家众多好评,获得豆瓣评分9.8的高分! 这到底是怎样的一书,如此备受专家和读者共同推崇呢? 我们为什么需要《计算
    发表于 05-08 13:59

    层协议有哪些?TCP/ IP的层协议介绍

    层协议,也称为OSI参考模型,是指开放式系统互联通信参考模型,由国际标准化组织设置。该模型分为以下层: 1.物理层:主要负责数据传输的物理介质传输,如电信号。 物理层是层协议的最
    的头像 发表于 04-22 14:17 2000次阅读

    STM32F103官方USB的MSC程序基础上修改为CDC+MSC的组合设备,出现设备描述符请求失败的原因?

    STM32F103官方USB的MSC程序基础上修改为CDC+MSC的组合设备,出现设备描述符请求失败问题;抓包发现PC主机配置描述符数据和设置的数据不一致
    发表于 04-07 06:34

    为什么电动汽车的双向充电需要特别注重设计?(

    为什么电动汽车的双向充电需要特别注重设计?(
    的头像 发表于 11-24 14:36 324次阅读
    为什么电动汽车的双向充电需要特别<b class='flag-5'>注重</b>设计?(<b class='flag-5'>上</b>)