0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

机器学习不需要数学,调包就行?

jmiy_worldofai 来源:未知 作者:胡薇 2018-09-30 10:38 次阅读

不抖机灵,想从接触过机器学习学术圈但已投身工业界的角度来回答。

我认为:大部分机器学习从业者不需要过度的把时间精力放在数学上,而该用于熟悉不同算法的应用场景和掌握一些调参技巧。好的数学基础可以使你的模型简洁高效,但绝非必要的先决条件。

原因如下:

1. 即使你有了一定的数学功底,还是不知道怎么调参或者进行优化。

这话说的虽然有点自暴自弃,但扪心自问在座的各位,当你发现 accuracy 不好、loss 很高、模型已经 overfitting 了,你唰唰唰列列公式玩玩矩阵就知道问题出在哪里了吗?不一定。诚然,懂得更多的统计原理可以帮助推测问题出在了哪里,你可能换了一个 loss function 或者加了新的 regularizer,但结果不一定会更好 :(数学基础之于机器学习从业者很像 debugger 之于码农,它给了你方向,但不能保证你一定可以解决问题。那怎么能解决问题?只有经验经验经验,别无他法,有时候甚至靠的是直觉。数学基础是好的内功基础,但你调包调多了,其实也慢慢能抓到一些感觉,不必看不起 “调包侠”。

2. 工业界可以应用的模型是很有限的,可调的参数也是有限的。

工业界选择模型非常看重可解释性,效率,以及和整个系统的整合能力。举例,在我的工作中,大部分时间都在使用 Regression 和 Decision Tree 相关的算法(如 Random Forests)。是因为这两个算法最好么?不,恰恰是因为这两个算法稳定及高效,而且容易解释。对于这样的模型,你即使数学能力很强,能调整的参数也是有限的。根据网上的例子和经验,大量的工程师可以在数学基础稍弱的情况下做到很好的效果。

3. 数学 / 统计知识已经成了既得利益者刻意为外来者建立的一道壁垒。

不知道大家有多少人是从事过 ML 研究的。我个人的观察是做出成绩的 ML 研究人员是有限的,科班出身的 researcher 更是远远无法工业界的空缺。所以大家没有必要担心会被转行者抢了饭碗,也没有必要刻意鼓吹一定要懂矩阵,凸优化,等数学知识才配做机器学习。大家都是出来卖的,不必互相为难。说来惭愧,在工作中我常常跟老板说这个人不能用,你要用我这种科班出身的人,但我内心是不赞同的。

每当我看到知乎上有人问机器学习怎么入门,结果大家立马推荐第一本就看 PRML 和 Statitical Learning 以及一大堆公开课和数学课的时候,我的内心是崩溃的。各位答主的目标是把所有人都吓回去还是秀一下优越感?

4. 理论模型和实际应用分的是两块不同的蛋糕。

承接第 2,3 点,做理论研究的发力于突破,提出新的模型或者优化方法,做应用的致力于把模型应用于数据上,攫取商业价值。这两者不存在利益冲突,做理论的人有自带正统光环的优势,所以更该显得大度一些。只有 “调包” 的人越来越多,这个行业才会繁荣,因为证明技术落了地,可以带来实际价值。

5. 行业的发展趋势是降低工具的使用难度,这让我们不必反复造轮子。

亚马、逊谷歌、微软等各大平台都开放了他们的机器学习工具。以前人们还需要自己写各种模型,好一些的调一下 sklearn,但现在 Azure ML Studio 已经方便到零代码了。年初的时候,我试了一下 ML studio,简直方便的可怕,完全是图形拖动连接就可以建立模型,那一刻我仿似看到了自己即将失业。

6. 文艺一点说,我们需要更包容的心态,切勿文人相轻。

想要接触了解一门学科,应该先有兴趣,才有探索的积极性。就像我们第一次看到 Hello word 出现的样子,很多刚入行的人第一次看到机器学习能解决实际问题时,会产生浓厚的兴趣。

我怕的就是所谓的圈内人都说你必须要会矩阵分解,必须要会用 trace 算导数,必须会优化,才能开始学习机器学习。这个周期太长,很多人连开始的勇气都没有~ 我觉得不管怎么样,要先动手做起来,发现自己的不足,再去补充需要的东西。

既然学术是自由的,我们就打开大门,欢迎大家都进来坐坐。如果他 / 她不喜欢,欢迎到隔壁串门。但我们不要给自己家门垒了高高的台阶,说闲人勿进。久而久之,难免门可罗雀。

综上,我觉得应用机器学习模型和技巧既不能完全不懂数学,两眼一抹黑,也不该要求每个从业者都要精通各种数学理论。模型应用者要长存对理论的敬畏之心,不要总想搞个大新闻说 “机器学习也不过如此”,但做理论的也不必觉得高人一等,别人都是二等公民。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8337

    浏览量

    132255

原文标题:如何看待「机器学习不需要数学,很多算法封装好了,调个包就行」这种说法?

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电气行业工厂数据采集现状及 “不需要点表的网关” 的作用

    电气行业工厂在数据采集方面目前存在诸多问题,而 “不需要点表的工业网关” 在简化配置、增强兼容性、提升实时性、降低维护成本以及提高数据质量等方面具有显著的优势,能够为电气行业工厂的数据采集工作带来极大的改善和调整,助力工厂实现更加高效、智能的生产运营。
    的头像 发表于 10-30 10:06 60次阅读
    电气行业工厂数据采集现状及 “<b class='flag-5'>不需要</b>点表的网关” 的作用

    C语言为什么不需要包含stdio.h

    我们在写单片机程序的时候,第一行都会包含 reg51.h,于是就有同学提出了疑问,为什么不需要包含 stdio.h?
    的头像 发表于 10-29 15:48 93次阅读

    基于 “不需要点表的工业网关” 的工业自动化设备远程监控解决方案

    基于 “不需要点表的工业网关” 的工业自动化设备远程监控解决方案具有显著的优势,能够为工业企业提供高效、便捷、安全的设备远程监控服务,助力企业提升生产效率和竞争力。
    的头像 发表于 10-28 15:20 83次阅读
    基于 “<b class='flag-5'>不需要</b>点表的工业网关” 的工业自动化设备远程监控解决方案

    深控技术 “不需要点表的 Plc 网关”:功能、应用与优势

    深控技术研发的 “不需要点表的 Plc 网关” 凭借其支持多品牌、灵活组网、强大总表读取功能等优势,在食品行业等众多领域展现出了卓越的应用价值,为工业自动化的发展提供了有力的推动。
    的头像 发表于 10-28 14:18 98次阅读
    深控技术 “<b class='flag-5'>不需要</b>点表的 Plc 网关”:功能、应用与优势

    深控技术不需要点表的注塑机网关:制药行业的智能变革

    深控技术研发的 “不需要点表的注塑机网关” 在制药行业的成功应用,为企业带来了显著的经济效益和社会效益。它不仅提高了生产效率和产品质量,还降低了设备维护成本,为制药企业的智能化转型提供了有力支持。相信在未来,深控技术不需要点表的注塑机网关将在更多行业发挥重要作用,推动产业
    的头像 发表于 10-23 09:44 86次阅读
    深控技术<b class='flag-5'>不需要</b>点表的注塑机网关:制药行业的智能变革

    SMT 产线数据采集方案 —— 不需要点表的工业网关

    深控技术研发的 “不需要点表的工业网关” 为 SMT 产线的数据采集提供了一种高效、准确、便捷的解决方案。
    的头像 发表于 10-21 10:31 140次阅读
    SMT 产线数据采集方案 —— <b class='flag-5'>不需要</b>点表的工业网关

    深控技术研发的 “不需要点表的工业网关” 在工厂产线设备的应用

    工厂产线设备的高效运行与数据交互至关重要。深控技术研发的 “不需要点表的工业网关” 为工厂产线带来了创新性的解决方案,极大地提升了设备的互联互通性、数据处理效率以及整体运营的智能化水平。
    的头像 发表于 10-14 10:52 152次阅读
    深控技术研发的 “<b class='flag-5'>不需要</b>点表的工业网关” 在工厂产线设备的应用

    不需要点表的工业网关” 深控技术物联网解决方案

    不需要点表的工业网关” 物联网解决方案
    的头像 发表于 09-29 15:43 272次阅读
    “<b class='flag-5'>不需要</b>点表的工业网关” 深控技术物联网解决方案

    OPA2171需不需要外部补偿?

    如OPA2171这个运放,不知道需不需要外部补偿?
    发表于 09-26 06:23

    选择ths4631后需不需要用jfet呀?

    如图所示的电荷灵敏前方电路,如果用ths4631作为运放A1,还需不需要用前端的Q1(Q1为jfet,型号为2sk152),如果需要时什么原因,如果不需要时什么原因。还有用Q1的作用是什么?
    发表于 09-23 07:20

    网线那几根线不需要

    在网线中,哪几根线不需要接主要取决于网络的需求和类型。一般来说,在百兆网络中,通常只需要用到其中的四根线,即第1、第2、第3、第6根线,它们分别承担着数据的发送和接收功能。这四根线在网线中的颜色
    的头像 发表于 09-04 09:40 802次阅读

    ESP32双核系列基于FreeRTOS编程,需不需要关注双核特性呢?

    如题,我需不需要关注两个cpu都有在工作,运行线程?
    发表于 06-19 07:32

    L6235Q VREF引脚要是不需要tacho测速功能需要怎么接?

    这个L6235Q VREF引脚要是不需要tacho测速功能需要怎么接,看数据手册好像是说PWM电流控制器参考电压,最小值为-0.1V,最大值为5V,设计时应该怎
    发表于 03-28 08:17

    不需要License不需要烧录器,板卡集成下载器和调试功能,盘古PGX-Lite 7K开发板

    不需要License不需要烧录器,板卡集成下载器和调试功能,盘古PGX-Lite 7K开发板,紫光同创Compa系类低功耗CPLD,基于PGC7KD-6IMBG256,轻松掌握国产FPGA操作
    发表于 03-08 13:51

    六类屏蔽网线和六类非屏蔽网线都不需要接地吗

    是的,一般情况下六类屏蔽网线和六类非屏蔽网线都不需要接地。在综合布线工程中,通常采用免接地方式,即网线不需要直接接地。这是因为网线传输的信号电压较低,一般在12V左右,因此不需要通过接地来消除静电等
    的头像 发表于 03-08 10:01 2871次阅读