0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌大脑高级研究科学家:机器学习六年读博经历中的经验与教训

深度学习自然语言处理 来源:深度学习自然语言处理 作者:深度学习自然语言 2021-01-18 17:31 次阅读

机器学习读博是什么体验?期间遇到的挫折与挑战又要如何应对? 在ML领域小有名气的青年科学家Maithra Raghu总结了自己在六年读博经历中所汲取的经验与教训,希望能够对正在/将要攻读机器学习博士学位的学生有所帮助。 Maithra Raghu于2020年从康奈尔大学毕业,获得CS博士学位。在Maithra读博的六年里,机器学习领域的研究参与人员越来越多(2014年NeurIPS的投稿者大约是两千人,2020年已达到两万人),而Maithra本人也在机器学习领域取得了重大进步。 Maithra曾在2019年当选“福布斯30位30岁以下科学精英排行榜”,2018年被评为“MIT EECS Rising Stars”,主要研究领域为深度学习与医疗的结合。目前,Maithra Raghu在谷歌大脑担任高级研究科学家。 个人主页:https://maithraraghu.com/

1

读博前的期望

对于许多选择读博(尤其是本科毕业后直接读博)的人来说,博士生涯并不能被称得上愉快,但Maithra认为,博士学习就像一段“旅行”。一般来说,完成ML博士学习需要5到6年,在这个学习过程中,你不仅可以学习到ML领域的研究技巧与知识,还可以根据自己的兴趣决定你所想要研究的问题,探索ML不同子领域的魅力,更能接收到学术界/产业界/政策/非营利组织的不同研究成果等。

不断变化的个人喜好将影响你在读博期间决定从事的研究工作,甚至影响你之后所选择的博士后职业道路。不过,尤其是在博士学习刚开始时,个人研究兴趣如何演变是很难预测的。就Maithra个人而言,在刚开始读博时,她认为自己是要进入工业界的,读博期间又考虑从事学术研究,读博后期却又坚决地拒绝了学术界的offer,决定留在工业界做研究。因此,她认为,读博可以一步一步来,最重要的是充分利用读博期间的学习/研究/社交经验,而不是实现某项预期目标。目标也许会变,但没必要纠结,免得给自己带来不必要的压力。


2

读博期间的普遍挑战

攻读博士学位(尤其是ML博士)能够为个人带来巨大的收获,使你有机会为基础科学理解与重大的技术应用做出贡献。但是,读博所需的时长,以及读博期间的各种不确定性,使读博充满挑战。Maithra的读博生涯也是坎坷不断,常常感到孤独、受挫,或因为急于求成而把自己压垮。这些现象在读博群体中十分常见。作为过来人,Maithra分享了自己的一些经验与策略:

研究陷入僵局时读博时的一个普遍挑战是:某个项目或研究过程受阻,陷入僵局,无法继续进行下去。 如果你很努力地推进某个项目,但没有取得任何进展,那么你可以尝试:

资料整理:搜集所有实验结果、数学方法、随手记录研究动机的笔记等等,并花点时间将这些信息汇集起来,尝试写一篇文章。这个过程可以帮助你了解目前研究所处的位置,以及当下研究状态与研究目标的差距在哪里。

中心点:如果是项目的某个部分无法正常运作,那么是否可以重新确定研究问题(也许是从相关工作中汲取灵感),以使研究更容易进行呢?

建立联系:当前项目所关注的领域与其他研究领域之间是否存在联系?可以在这个研究项目中探索这种联系吗?这既可以帮助推进研究,也可以使项目与其他领域产生更广泛的联系。

获得论文反馈:从研究同行、合作者和朋友那里获得关于项目论文的反馈也可能会有所帮助。他们也许能够提供新的观点或改进建议。

参加Workshop:把论文提交到Workshop也有用。这个方法也能帮助整合所有研究结果,并获得有用的反馈。(Maithra提到,她从机器学习会议上的workshop中获得了许多收益,因为她可以讨论/获取有关当前方向的反馈,并见到同一领域的其他研究人员。)

及时止损:有时候,一个项目在刚开始时前景很好,但很难正常运行,项目本身对重新建立框架,或与其他领域建立联系都具有挑战性。在这张情况下,最好的方法也许是迅速中止项目,转到其他研究。如果之前的项目已经取得部分成果,可以针对这些成果撰文并进行分享,取得合作者的同意与最终反馈,将论文发表为arXiv预引文或Workshop论文。

如果你不是被某个特定的项目困扰,而是对研究过程感到不知所措,那么可能是因为你觉得研究成熟度,尤其是自己的研究水平,很难衡量。在读博中途,Maithra开始从事医疗应用的研究,但在了解这个领域与撰写论文上的进展都很慢。为此,她感到很迷茫、沮丧。后来,她重新读了一遍她在博士初始阶段所完成的文章,发现她对论文结果的深度与背景的了解与之前的情况截然不同。

衡量研究成熟度的几个关键指标,如了解研究结果背后更广泛的背景,在不同领域之间建立联系,迅速定位你所研究的子领域的重要成果等等,并无法迅速转化为有形的产出(如形成更多论文)。但是,这些指标对成为具有丰富研究视野的独立研究人员至关重要,这也是博士生涯的主要研究目标。而且,如果你一直阅读论文,了解你的研究领域并亲自决定你的研究方向,包括教学/指导学生等,那么你是很有可能在这些方面取得重要进步的。

与时俱进感到费力时

机器学习是一个充满活力、节奏快的领域,很容易被大量新论文、新预印论文、新博客文章、新实现、新框架等等淹没。 如何掌握机器学习领域的最新动态呢?Maithra的策略如下:

1、掌握能够快速查找相关论文的参考链接:比如订阅arXiv上的stat.ML cs.LG邮件列表,arXiv-sanity,推特,或者是reddit / MachineLearning,paperswithcode和 Semantic Scholar/ Google Scholar等。

2、做一个论文阅读清单:列出你所发现的有趣的、但暂时没有时间阅读的论文,等有时间再回去阅读。

3、制定一个论文阅读策略:如果一篇论文与你正在积极研究的方向非常接近,那就详细阅读;如果相关度不大,那就读一下摘要,截取几张重要的照片。

4、偶尔读一下其他领域的论文(可能一年一次),看看其他领域正在研究的内容。 还有两个比较有帮助的点是记住:(1)每个人都会对论文发表的概率感到着急;(2)许多论文也许都是基于一个相同的基本思想,只要掌握这一个思想,就能跟上整个领域的发展。

感到孤独时读博期间的另一个共同挑战是与孤独作斗争。Maithra谈到,在攻读博士学位的前几年,有些项目要求她将精力集中在非常狭窄的某些问题上,这些问题也非常耗费精力,并且看起来似乎永远也完成不了。在这些时期,你会感到与其他研究人员和领域完全割裂。 广泛而言,这种情况在博士早期比较常见,因为那时你正开始学习如何从头到尾进行一个研究项目,但与此同时,你与其他研究人员/领域的联系却很少。与研究领域/社交群体保持联系,可以确保你不会感到被孤立。

你可以:(1)与高年级的学生/博士后建立合作;(2)从导师/实验室/其他同僚等方面获得你所取得的工作进步的反馈;(3)积极参与其他社交圈,无论是参会,指导学生还是组织workshop等。

3

3个有用技能

在讨论了读博期间面临的一些常见挑战以及解决这些挑战的方法后,下文将介绍一些有利于取得研究进展的注意事项。 Maithra发现,在读博期间,个人身上的三个技能非常有用:主动性、专注力和毅力。 与本科学习相比,Maithra发现,读博期间的一个明显不同点是博士生需要采取主动行动。所谓主动,可以是阅读重要的相关论文,对不同方法的可行性进行快速的初步研究,与进行相关研究的同行交谈 ,还可以是参加会议,并成为会议的积极活跃分子。由于博士学位的完成时间不确定,所以论文的生产力在很大程度上是取决于你学习和进行研究的主动性。

此外,Maithra认为,在开始新的研究方向时,专注力非常重要,能够帮助你精读相关工作,提取关键信息,从最初的有限探索中快速学习,并确定项目的主要研究方向。 另一方面,毅力也很重要:一篇论文在提交前、提交后,或者回复同行评审、论文被拒时,通常都需要进行大量的编辑/资料添加。大量的论文编辑工作,尤其是在为二次提交做准备、同时又进行新的研究项目时,你很难有修改与编辑的动力。但同行评审过程的灵活性,又往往意味着论文值得你坚持修改与写作。

4

记录文献阅读和研究思路

Maithra在整个读博期间,一直更新着两个文档。一个是第一年开始更新,另一个是第三年开始更新。 第一个记录了她阅读过的论文,每次Maithra阅读了新论文后,都会将其添加到文档中,并简要写下自己的收获,该文档篇幅已经超过50页。另一个文档则跟踪研究思路,每当她有一个新想法时,都会记下来。Maithra认为,这有助于了解研究方向并突出关键主题。

5

社区的重要性

Maithra花了不少时间才意识到社区的重要性,从根本上说,研究是一项社区活动。做学术研究通常要解决异常困难的问题,研究的进步取决于你和他人的互相学习,这是探索研究方向时要牢记的关键因素。

Maithra认为,我们应该注意以下几个问题:社区关注的研究主题是什么,为什么?存在哪些盲区?有能自然提出的研究课题吗?花时间与社区中的同行讨论这些问题,对于提出符合趋势的研究问题至关重要。 而且,如果确定了该领域的新研究方向,则围绕该方向建立社区通常会很有用。要实现这一点,可以发起协作,发布关键的开放性问题,并组织研讨会。 Maithra分享道,博士生涯刚开始,她就对了解现代深度学习系统所展现的关键经验现象感兴趣。但是,在这个主题上开展工作非常困难。 这个领域正在迅速发展,使任何类型的研究分析都充满了不确定性,并且极大地增加了围绕该主题建立新社区的挑战。 因此,Maithra的第一篇深度学习分析论文十分难产,极大考验了她的毅力。但是在这之后,她感受到的是更加强烈的研究兴趣。 6

发展研究视野

前面提到,在刚开始攻读博士学位时,最好步步为营,专注于经验,而不是特定的目标。但从研究成熟度的角度来看,攻读博士学位其实需要一个特定的目标:成为具有丰富的(清晰的)研究视野的独立研究人员。 在当前的机器学习研究社区中,随着大量论文的涌现,人们很容易感到需要不断发表新论文的压力。 但是,尽管论文写作是一项重要技能,Maithra认为研究成熟度的关键标准,是能够对所在领域有渊博的知识和基于知识之上的深刻观点,这些观点有助于通过研究视野(与主题相关的总体观点)来确定关键的研究问题。拥有广阔、完整的研究视野会极大地激发人们的研究积极性。

那么如何发展研究视野呢?Maithra认为,首先,如果没有几年的研究经验就很难形成完整的研究视野。 在博士的头几年里,Maithra埋头阅读论文和听大牛的演讲,并为无法提出有趣的研究问题而感到沮丧。之后的几年里,她阅读过的论文、从事过的项目、参加过的研讨会大大提高了这方面的能力。当然,这是永无止境的过程。 更具体来说,它始于探索,Maithra的前几个项目为她提供了不同的曝光机会,并帮助她理解了自己感兴趣的主题。

之后,她研究一些自然提出的后续项目,并引发了有关应用程序/部署的一些相关问题。在研究具体项目的过程中,会不断提出新的问题,并持续加深自己对研究主题的理解,同时有可能引出新的研究课题。当然,不要忘记请教导师,导师在你的研究主题上已经有了很广阔的研究视野。 最后,Maithra强调,多年的经验确实产生了复合效应。之后从事研究项目时,提炼论文中的主要观点会更加容易,并能启发下一个研究课题,这些研究方向最终合并形成一个更广阔的视野。

总结

总而言之,攻读博士学位也许是一段非常有意义的经历。不妨将读博视为一段旅程,有起有落,个人研究发现和研究观点在不断演变。希望这篇文章对旅途中跋涉的其他人有所帮助!

原文链接:https://maithraraghu.com/blog/2020/Reflections_on_my_Machine_Learning_PhD_Journey/

责任编辑:xj

原文标题:谷歌大脑高级研究科学家:我的六年机器学习博士生涯总结

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6161

    浏览量

    105304
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132567
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121113

原文标题:谷歌大脑高级研究科学家:我的六年机器学习博士生涯总结

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    2024诺贝尔物理学奖为何要颁给机器学习

    (Geoffrey Hinton),表彰他们在使用人工神经网络的机器学习方面的基础性发现和发明。   作为在科学界具有举足轻重的地位和深远影响的诺贝尔奖,它不仅是对科学家个人成就的最高
    的头像 发表于 10-10 00:11 3723次阅读

    西湖大学:科学家+AI,科研新范式的样本

    ,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,
    的头像 发表于 12-12 15:59 153次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    领域的研究与发展。令人瞩目的是,边塞科技的创始人吴翼已正式加入该实验室,并担任首席科学家一职。 吴翼在其个人社交平台上对这一变动进行了回应。他表示,自己最近接受了蚂蚁集团的邀请,负责大模型强化学习领域的
    的头像 发表于 11-22 11:14 561次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息,从而推动
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    的效率,还为科学研究提供了前所未有的洞察力和精确度。例如,在生物学领域,AI能够帮助科学家快速识别基因序列的关键变异,加速新药研发进程。 2. 跨学科融合的新范式 书中强调,人工智能的应用促进了多个
    发表于 10-14 09:12

    英伟达预测机器人领域或迎“GPT-3时刻”

    英伟达,作为全球图形处理器与人工智能领域的佼佼者,正引领着科技界对机器人未来的无限遐想。近日,英伟达高级科学家Jim Fan在科技媒体The Decoder的文中,以及红杉资本的采访
    的头像 发表于 09-20 17:05 789次阅读

    天津大学科学家突破人类大脑器官成功驱动机器

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧
    的头像 发表于 07-08 16:00 603次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 485次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 520次阅读

    名单公布!【书籍评测活动NO.33】做了50软件开发,总结出60条经验教训,每一条都太扎心!

    柯达公司工作了 18 ,曾担任过摄影研究科学家、软件开发人员、软件经理及软件过程和质量改进领导。Karl 拥有伊利诺伊大学的有机化学博士学位。 Karl 共著 有
    发表于 05-17 14:36

    斯坦福、伯克利大神教授创业给机器人造大脑,OpenAI红杉抢着投5亿

    还记得曾火遍全网的ALOHA家务机器人吗?最近该项目导师,斯坦福计算机科学与电气工程系教授ChelseaFinn在X宣布,正式与其他几位伯克利大牛学者、谷歌DeepMind科学家共同创
    的头像 发表于 04-14 08:04 135次阅读
    斯坦福、伯克利大神教授创业给<b class='flag-5'>机器</b>人造<b class='flag-5'>大脑</b>,OpenAI红杉抢着投5亿

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于20091月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和
    的头像 发表于 02-25 16:16 1134次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度<b class='flag-5'>学习</b>硬件趋势

    TikTok引入前谷歌VideoPoet负责人蒋路,发力AI视频生成

    独家获悉,谷歌高级科学家、卡内基梅隆大学(CMU)计算机学院兼职教授蒋路,已经加入TikTok。
    的头像 发表于 02-22 13:36 601次阅读
    TikTok引入前<b class='flag-5'>谷歌</b>VideoPoet负责人蒋路,发力AI视频生成

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 486次阅读