0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据与机器学习主管Kireet Reddy分享入门机器学习的经验

zhKF_jqr_AI 来源:未知 作者:李倩 2018-10-27 09:32 次阅读

编者按:Feedly联合创始人、大数据与机器学习主管Kireet Reddy分享了自己入门机器学习的经验。

上大学前,我原以为自己将来会去计算机硬件行业工作,比如Intel之类。不过,到了CMU后,我发现计算机科学课程要有趣得多,看起来这些课程我也学得更好,这恐怕不是一个巧合。我真的很享受几乎每一门参加的CS课程。实际上,只有一门例外:机器学习入门!我对这门课程很感兴趣,不幸的是,看起来这门课的教授对教授这门课程的不感兴趣程度和我的感兴趣程度差不多,教得也不好。所以长期以来机器学习不在我的关注范围之内。

不过,几年前,我注意到机器学习真的吸引了很多注意力,这再次激起了我的好奇心。这次我从吴恩达的MOOC开始,吴是一个很棒的教授。和以前的区别是,我原来白天上课,现在网上上课。我一下子就着迷了,开始在网上搜索更多可以参加的课程。下面是我在学习过程中收获的一些经验和窍门。

追赶ML潮流是不是好主意?

毫无疑问,机器学习将经久不衰。这一领域的活跃已经有一段时间了,发展也很快,我可以说,夸大宣传背后确实有实质性的进展。解决有些问题,机器就是比人类更擅长。

但这并不意味着机器学习适合每个人。机器学习方面的工作和其他软件工程领域很不一样。它更带研究性和猜测性。如果你喜欢事先一段一段地计划好工作,在x周之后一切就绪,那也许机器学习不怎么适合你。如果你喜欢处理数据,持续学习新技术,(真心)喜欢数学,那么机器学习也许是一个很棒的转职方向。

多久能赶上进度?

这个问题有太多答案。我首先想到的回答是“永远不能”。机器学习的范围相当广泛,同时正以惊人的速度发展。如果你碰巧和我一样需要睡眠,那么你大概无法跟上这一领域的每项进展。但另一个更乐观的答案也许是4个月(每周10小时)。例如,这些时间足够你完成fast.ai的课程了(很棒的课程)。

这并不是微不足道的投入,因为你大概有许多时间要花在工作和生活上。不过,以我的个人经历为证,这是有可能做到的,如果你愿意投入的话,其实并不难。

好课程有哪些?

这真取决于你打算如何学习。就我个人而言,之所以喜欢机器学习,是因为它优雅地组合了数学和计算机科学的许多领域:概率论、线性代数、微积分、优化,等等。所以我很自然地偏向学术性课程。

斯坦福的CS231n是一个极好的学术性课程。我看了Andrej Karpathy的授课视频,讲得非常好。课程作业的设置也很好,可以远程完成。尽管课程主要内容为图像问题和卷积网络,课程其实是“从头开始”的,同样覆盖了前馈网络和循环网络。

如果你更喜欢偏实践的课程,那fast.ai的课程很不错。Jeremy Howard从非常基础、系统的角度讲授所有内容,课程的设计让任何具有一定技术背景的人可以参与。另外他们的论坛也是一个很不错的社区。

之前提到的吴恩达后来又在Coursera开了新的课程系列。我没有亲自尝试这些课程,但我确信其中一定包含很多好东西。我感觉这门课程也是以偏向实践的方法教授的,不过也涉及一些背后的数学。

我建议你尝试多门课程,然后挑选一门最能吸引你的注意力的课程。不过我鼓励你至少逐渐完成一门实践性课程和一门理论性课程,这是一个很好的互补。为了理解论文(警告:你需要阅读学术论文),学术性课程将帮助你适应长篇的技术内容。实践性课程则将提供一些直觉,帮助你做出ML项目中的各种决策。

如果你需要温习一下数学,或者想学得更深入一点,MIT有几门很棒的课程。任何ML工作都绝对需要对概率学良好的理解,John Tsitsiklis教授的6.041/6.431讲得超棒。John将复杂问题逐步分解,直到答案显而易见的地步,这种授课方法完全是艺术。

MIT的线性代数课程(18.06)也很有意思。这门课的教授同样很出色,风格独特。不过这门课程并不是真的很有必要,因为大多数ML任务只需要理解矩阵乘法。

如果我不懂编程该怎么办?

去学。

大多数ML工作基于Python完成,幸运的是,Python相当容易上手。大多数ML工作也真不需要你是一个世界级的程序员。但我还是建议你在进行任何ML方面的工作前参加一门关于编程的速成线上课程。一下子学习编程和机器学习的概念(更别说还需要重新学习你大概已经忘掉了的一堆数学)是灾祸之因。给自己一个循序渐进的机会。

我有一定基础,现在该怎么做?

好,现在到了开始建模的时候了!一般来说有两条路可走:1) 在工作中找一个项目,或者进行一个个人项目;2) 找一个Kaggle竞赛。这取决于你的具体情况,不过我建议选Kaggle,主要原因如下:

问题是明确定义的。恰当地结构化真实生活中的ML问题可能需要一定的技巧。Kaggle就不存在这个问题。

类似地,有时候自己创建的数据集可能包含一些难以诊断的缺陷。而Kaggle竞赛会给你提供数据。

Kaggle提供了一个处理同样问题的社区。如果你陷入困境或者需要一点指引,有地方可去。

另一方面,如果你在工作中能碰到为ML方案量身定做的问题(比如图像分类),那么也许工作项目是给你的同事留下深刻印象并说服老板让你在机器学习上投入更多时间的快捷方式。

所以,如果你正考虑钻研机器学习,请勇往直前!机器学习最棒的一点是人们在时间和知识方面真的很慷慨。一旦开始,你能在网上找到很棒的支持系统,帮助你前行。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机科学
    +关注

    关注

    1

    文章

    144

    浏览量

    11386
  • 机器学习
    +关注

    关注

    66

    文章

    8438

    浏览量

    132956

原文标题:Feedly创始人是如何入门机器学习的

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    传统机器学习方法和应用指导

    用于开发生物学数据机器学习方法。尽管深度学习(一般指神经网络算法)是一个强大的工具,目前也非常流行,但它的应用领域仍然有限。与深度学习相比
    的头像 发表于 12-30 09:16 357次阅读
    传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

    如何选择云原生机器学习平台

    当今,云原生机器学习平台因其弹性扩展、高效部署、低成本运营等优势,逐渐成为企业构建和部署机器学习应用的首选。然而,市场上的云原生机器
    的头像 发表于 12-25 11:54 148次阅读

    什么是机器学习?通过机器学习方法能解决哪些问题?

    计算机系统自身的性能”。事实上,由于“经验”在计算机系统中主要以数据的形式存在,因此机器学习需要设法对数据进行分析
    的头像 发表于 11-16 01:07 491次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?通过<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法能解决哪些问题?

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度学习
    的头像 发表于 11-15 09:19 573次阅读

    人工智能、机器学习和深度学习存在什么区别

    人工智能指的是在某种程度上显示出类似人类智能的设备。AI有很多技术,但其中一个很大的子集是机器学习——让算法从数据学习
    发表于 10-24 17:22 2521次阅读
    人工智能、<b class='flag-5'>机器</b><b class='flag-5'>学习</b>和深度<b class='flag-5'>学习</b>存在什么区别

    【《时间序列与机器学习》阅读体验】+ 时间序列的信息提取

    本人有些机器学习的基础,理解起来一点也不轻松,加油。 作者首先说明了时间序列的信息提取是时间序列分析的一个重要环节,目标是从给定的时间序列数据中提取出有用的信息和特征,以支持后续的分析和预测任务,可以
    发表于 08-14 18:00

    【「时间序列与机器学习」阅读体验】+ 鸟瞰这本书

    的交织中不断成长。 读者对这本书的评价普遍很高。他们称赞作者用通俗易懂的语言将复杂的概念解释得透彻清晰,即使是初学者也能轻松入门。同时,书中丰富的案例和详细的步骤指导也让读者快速积累经验,提高实战技能。甚至有读者表示,这本书已经成为时间序列分析、
    发表于 08-12 11:28

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习》一书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了一个让我学习时间序列及应用的机会! 前言第一段描述了编写背景: 由此可知,这是一本关于时间序列进行
    发表于 08-11 17:55

    机器学习中的数据分割方法

    机器学习中,数据分割是一项至关重要的任务,它直接影响到模型的训练效果、泛化能力以及最终的性能评估。本文将从多个方面详细探讨机器学习
    的头像 发表于 07-10 16:10 2107次阅读

    机器学习中的数据预处理与特征工程

    机器学习的整个流程中,数据预处理与特征工程是两个至关重要的步骤。它们直接决定了模型的输入质量,进而影响模型的训练效果和泛化能力。本文将从数据预处理和特征工程的基本概念出发,详细探讨这
    的头像 发表于 07-09 15:57 568次阅读

    机器学习算法原理详解

    机器学习作为人工智能的一个重要分支,其目标是通过让计算机自动从数据学习并改进其性能,而无需进行明确的编程。本文将深入解读几种常见的机器
    的头像 发表于 07-02 11:25 1298次阅读

    机器学习数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从
    的头像 发表于 07-02 11:22 764次阅读

    深度学习与传统机器学习的对比

    在人工智能的浪潮中,机器学习和深度学习无疑是两大核心驱动力。它们各自以其独特的方式推动着技术的进步,为众多领域带来了革命性的变化。然而,尽管它们都属于机器
    的头像 发表于 07-01 11:40 1512次阅读

    机器学习的经典算法与应用

    关于数据机器学习就是喂入算法和数据,让算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据
    的头像 发表于 06-27 08:27 1711次阅读
    <b class='flag-5'>机器</b><b class='flag-5'>学习</b>的经典算法与应用

    机器学习入门:基本概念介绍

    机器学习(GraphMachineLearning,简称GraphML)是机器学习的一个分支,专注于利用图形结构的数据。在图形结构中,
    的头像 发表于 05-16 08:27 539次阅读
    图<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>入门</b>:基本概念介绍