0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ML从业者如何阅读研究论文

星星科技指导员 来源:NVIDIA 作者:Richmond Alake 2022-04-08 14:22 次阅读

数据科学家或机器学习专家有必要阅读研究论文吗?

简而言之,答案是肯定的。如果你没有正式的学术背景,或者只获得了机器学习领域的本科学位,也不要担心。

对于没有广泛教育背景的个人来说,阅读学术研究论文可能会有威胁。然而,缺乏学术阅读经验不应妨碍数据科学家利用 machine learning 和 AI development 的宝贵信息和知识来源。

这篇文章为任何技能水平的数据科学家提供了一个实践教程,他们可以阅读 NeurIPS 、 JMLR 、 ICML ,以及 等学术期刊上发表的研究论文。

在全神贯注于如何阅读研究论文之前,学习如何阅读研究论文的第一阶段包括选择相关主题和研究论文。

步骤 1 :确定一个主题

机器学习和数据科学领域拥有大量可以研究的学科领域。但这并不一定意味着在机器学习中处理每个主题是最好的选择。

虽然建议入门级实践者进行泛化,但我猜当涉及到长期机器学习时,职业前景、实践者和行业兴趣通常会转向专业化。

确定一个适合的主题可能很难,但很好。不过,经验法则是选择一个 ML 领域,你要么对获得专业职位感兴趣,要么已经有经验。

深度学习 是我的兴趣之一,我是一名计算机视觉工程师,在应用程序中使用深度学习模型专业地解决 computer vision 问题。因此,我对姿势估计、动作分类和手势识别等主题感兴趣。

基于角色,以下是 ML / DS 职业和相关主题要考虑的例子。

poYBAGJP1LuAEILsAAZw-fjMYSg294.png

图 1 :机器学习和数据科学角色及相关主题。作者创造的形象 。

对于本文,我将选择姿势估计这一主题进行探索,并选择相关的研究论文进行研究。

第二步:寻找研究论文

在阅读与机器学习相关的研究论文、数据集、代码和其他相关材料时,最优秀的工具之一是 PapersWithCode 。

我们使用 PapersWithCode 网站上的搜索引擎来获取所选主题“姿势估计”的相关研究论文和内容下图显示了它是如何完成的。

搜索结果页面包含对搜索主题的简短说明,然后是相关数据集、模型、论文和代码的表格。在不深入太多细节的情况下,本用例感兴趣的领域是“最伟大的代码论文”。本节包含与任务或主题相关的论文。出于本文的目的,我将选择 DensePose :野外密集的人类姿势估计 。

第 3 步:第一步(获得背景和理解)

在这一点上,我们选择了一篇研究论文进行研究,并准备从其内容中提取任何有价值的经验教训和发现。

很自然,你的第一个冲动就是开始写笔记,从头到尾地阅读文档,也许在其间休息一下。然而,为研究论文的内容提供一个上下文是阅读它的一种更实际的方式。标题、摘要和结论是理解任何研究论文的三个关键部分。

您所选论文的第一关的目标是实现以下目标:

确保论文是相关的。

通过学习论文的内容、方法和发现,了解论文的背景。

认识作者的目标、方法和成就。

标题

标题是作者和读者之间信息共享的第一点。因此,研究论文的标题是直接的,并且以一种不会留下歧义的方式组成。

研究论文的标题是最能说明问题的方面,因为它表明了研究与你的工作的相关性。标题的重要性在于对论文的内容有一个简要的了解。

在这种情况下,标题是“ DensePose :野外密集的人类姿势估计”这提供了一个工作的广泛概述,并意味着它将研究如何在高活动水平和真实情况下提供姿势估计。

摘要

摘要部分给出了论文的摘要。这是一个简短的部分,包含 300-500 字,简单地告诉你这篇论文是关于什么的。摘要是一篇简短的文章,概述了文章的内容、研究人员的目标、方法和技巧。

在阅读机器学习研究论文摘要时,您通常会遇到提到的数据集、方法、算法和其他术语。与文章内容相关的关键字提供上下文。在这一点上记笔记和跟踪所有关键字可能会有所帮助。

对于论文“ DensePose :野外密集的人类姿势估计 ”,我在摘要中确定了以下关键词:姿势估计、 COCO 数据集、 CNN 、基于区域的模型、实时。

总结

在你第一次通过考试时,从上到下阅读论文时会感到疲劳是很常见的,尤其是对于没有高级学术经验的数据科学家和从业者来说。虽然在长时间的研究之后,从论文的后面部分提取信息可能看起来很乏味,但结论部分通常很短。因此,建议阅读第一遍的结论部分。

结论部分简要概述了该作品的作者和/或贡献、成就以及对未来发展和局限性的承诺。

在阅读研究论文的主要内容之前,先阅读结论部分,看看研究者的贡献、问题领域和结果是否符合你的需要。

遵循这一简单的第一步可以充分理解和概述研究论文的范围和目标,以及内容的背景。你可以用激光注意力再次浏览,从内容中获得更详细的信息。

第 4 步:第二关(内容熟悉)

内容熟悉是一个与初始步骤相关的过程。阅读本文研究论文的系统方法。熟悉过程是一个步骤,包括研究论文的引言部分和图表。

如前所述,不需要直接深入研究论文的核心,因为知识适应可以在以后的过程中更轻松、更全面地检查研究。

介绍

研究论文的导论部分旨在概述研究工作的目标。该目标提及并解释了问题领域、研究范围、先前的研究工作和方法。

使用相似或不同的方法,在这一领域找到与过去研究工作相似的地方是很正常的。其他论文的引用提供了问题领域的范围和广度,为读者拓宽了探索领域。在这一点上,合并步骤 3 中概述的程序就足够了。

导言部分提供的另一个好处是提供了接触和理解研究论文内容所需的必要知识。

图表

研究论文中的说明性材料确保读者能够理解支持问题定义或所提出方法解释的因素。通常,研究论文中使用表格来提供与类似方法相比的新技术定量性能的信息。

pYYBAGJP1MeAGCEpAAKUy7hAX5Y138.png

poYBAGJP1M-Ae-0PAAKUWSdFUtc043.png

图 4 : 显示 DensePose 与其他单人姿势估计解决方案比较的图像。

一般来说,数据和性能的可视化表示可以帮助您直观地理解论文的上下文。在前面提到的密集姿势论文中,使用插图描述了作者姿势估计和创建方法的性能。全面了解生成和注释数据样本所涉及的步骤。

在深度学习领域,经常会发现描述人工神经网络结构的拓扑图。这再次为任何读者创造了直观的理解。通过插图和数字,读者可以自己解释信息,并获得更全面的观点,而不必对结果有任何先入为主的概念。

pYYBAGJP1NqAeY9SAAXEvreEEII334.png

图 5 : 显示 DensePose 交叉级联架构的图像。

第五步:第三遍(深度阅读)

论文的第三遍与第二遍相似,尽管它涵盖了正文的大部分。关于这个过程最重要的一点是,你要避免任何复杂的算术或技术公式,这对你来说可能是困难的。在此过程中,您还可以跳过任何您不理解或不熟悉的单词和定义。应注意这些不熟悉的术语、算法或技术,以便稍后返回。

在本课程中,你的主要目标是对论文内容有一个广泛的了解。接近论文,从摘要到结论再开始,但一定要在各部分之间进行中间休息。此外,建议有一个记事本,在记事本中记录所有重要的见解和收获,以及不熟悉的术语和概念。

Pomodoro 技术是管理深度阅读或学习时间的有效方法。简单地说, Pomodoro 技术将一天分成几部分工作,然后是短暂的休息。

对我有效的是 50 / 15 分割,也就是说, 50 分钟的学习和 15 分钟的休息时间。我倾向于在延长 30 分钟的休息时间之前,连续执行两次分割。如果您不熟悉这种时间管理技巧,请采用相对简单的划分,如 25 / 5 ,并根据您的注意力和时间容量调整时间划分。

第六步:第四关(最后一关)

最后一关通常涉及到发挥你的智力和学习能力,因为它涉及到在前一关中提到的不熟悉的术语、术语、概念和算法。这一关的重点是使用外部材料来理解论文中记录的不熟悉的方面。

对不熟悉的主题进行深入研究没有规定的时间长度,有时甚至需要几天或几周的时间。最终成功通过的关键因素是为进一步勘探找到合适的油源。

不幸的是,互联网上没有一个来源能提供你所需要的丰富信息。尽管如此,有多个来源,如果协调使用并适当使用,可以填补知识空白。下面是其中的一些资源。

机器学习子系统

深度学习子系统

PapersWithCode

顶级会议搜索为 NIPS 、 ICML 、 ICLR

Research Gate

机器学习苹果

研究论文的参考部分提到了技术和算法。因此,当前的论文要么从中汲取灵感,要么以之为基础,这就是为什么参考部分是一个有用的来源,可用于您的深度阅读课程。

步骤 7 :摘要(可选)

在近十年的与技术相关的学科和角色的学术和专业研究中,通过重述所探索的主题,确保所学到的任何新信息保留在我的长期记忆中的最有效方法。通过用我自己的语言重写新信息,无论是书面的还是打字的,我都能够以一种可理解和令人难忘的方式强化提出的观点。

更进一步,可以通过博客平台和社交媒体宣传学习成果和笔记。试图向广大读者解释新探索的概念,假设读者不习惯该主题或主题,则需要理解主题的内在细节。

结论

毫无疑问,为新手数据科学家和 ML 实践者阅读研究论文是令人畏惧和具有挑战性的;即使是经验丰富的实践者也发现很难一次成功地消化研究论文的内容。

数据科学专业的性质是非常实用和涉及的。这意味着,数据科学领域与人工智能密切相关,人工智能仍然是一个发展中的领域,因此,它的从业者必须具备学术思维。

总而言之,以下是阅读研究论文应遵循的所有步骤:

确定一个主题。

寻找相关研究论文

阅读标题、摘要和结论,对研究工作目标和成果有一个模糊的理解。

通过深入介绍,熟悉内容;包括对文中给出的图形和图表的探索。

在自上而下阅读论文的过程中,利用深度阅读课程来消化论文的主要内容。

使用外部资源探索不熟悉的术语、术语、概念和方法。

用你自己的话总结基本的要点、定义和算法。

关于作者

Richmond Alake 是一名机器学习和计算机视觉工程师,他与多家初创公司和公司合作,整合深度学习模型,以解决商业应用中的计算机视觉任务。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132563
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121111
收藏 人收藏

    评论

    相关推荐

    【「大话芯片制造」阅读体验】+内容概述,适读人群

    书后,对芯片制造的复杂性和精妙性有了全新的认识。 第一章,展示了半导体工厂的布局,选址与组织部门。我们可以知道半导体从业者自身的一个定位与分工。对半导体行业的特殊性,半导体从业者的生活环境,工作内容有一定
    发表于 12-21 16:32

    学嵌入式好找工作吗?

    ,也就意味着嵌入式相关岗位的需求量是持续且庞大的,不用担心短期内出现行业性的就业寒冬,能为从业者提供较为稳定的就业机会。 2.技术的不可替代性 嵌入式开发涉及到硬件和软件的深度融合,开发人员需要
    发表于 12-16 15:43

    贝思科尔ReviewHub在线评审工具开放限时免费试用名额,快速领取!

    限时免费试用,旨在为广大电子设计从业者带来前所未有的设计体验与变革。贝思科尔希望能够推动整个行业的技术进步与创新发展,为广大电子设计从业者提供更有力的支持和帮助,
    的头像 发表于 12-03 03:00 59次阅读
    贝思科尔ReviewHub在线评审工具开放限时免费试用名额,快速领取!

    贝思科尔DX-BST原理图智能工具,限时免费试用开启,不容错过!

    限时免费试用,旨在为广大电子设计从业者带来前所未有的设计体验与变革。贝思科尔希望能够推动整个行业的技术进步与创新发展,为广大电子设计从业者提供更有力的支持和帮助,
    的头像 发表于 12-03 01:07 49次阅读
    贝思科尔DX-BST原理图智能工具,限时免费试用开启,不容错过!

    名单公布!【书籍评测活动NO.50】亲历芯片产线,轻松图解芯片制造,揭秘芯片工厂的秘密

    作为其他行业的人员在制造方面的参考。 本书适合集成电路行业的从业者研究者、相关专业师生和感兴趣的大众读者阅读。 作者简介 菊地正典: 1944年出生,1968年毕业于东京大学工学部物理工学系。自加入
    发表于 11-04 15:38

    特征工程实施步骤

    数据中提取数值表示以供无监督模型使用的方法(例如,试图从之前非结构化的数据集中提取结构)。特征工程包括这两种情况,以及更多内容。数据从业者通常依赖ML和深度学习算法
    的头像 发表于 10-23 08:07 252次阅读
    特征工程实施步骤

    大数据从业者必知必会的Hive SQL调优技巧

    大数据从业者必知必会的Hive SQL调优技巧 摘要 :在大数据领域中,Hive SQL被广泛应用于数据仓库的数据查询和分析。然而,由于数据量庞大和复杂的查询需求,Hive SQL查询的性能往往
    的头像 发表于 09-24 13:30 238次阅读

    半导体封装材料全解析:分类、应用与发展趋势!

    连接。本文将深入探讨半导体封装材料的分类、特性及其在各个领域的应用,以期为半导体行业的从业者研究者提供参考。
    的头像 发表于 09-10 10:13 2294次阅读
    半导体封装材料全解析:分类、应用与发展趋势!

    【《大语言模型应用指南》阅读体验】+ 俯瞰全书

    的大语言模型设计技术人员阅读,主要包括大语言模型的优化方法、Agent系统调优以及模型的安全技术。 展望篇分析了大语言模型的发展前景,介绍了多模态应用知识、尺度定律、编码压缩以及与图灵机的关系。 从目录结构和内容可看出此书适合不同知识基础的大语言模型从业人员
    发表于 07-21 13:35

    苹果拟在台湾设立数据中心,携手当地厂商共谋发展

    近日,业界传出苹果公司将在中国台湾设立数据中心的消息,这一举动无疑为当地的高科技产业注入了新的活力。据悉,苹果已经与当地从业者开始合作设计这一数据中心,预示着双方将携手共进,共同开拓这一领域的未来。
    的头像 发表于 06-25 11:24 997次阅读

    苹果Vision Pro头显在医企领域受热捧

    近日,Apple Vision Pro头戴式显示器自发布以来,引起了公众的高度关注。尽管其在二手交易平台eBay上的热度有所下降,但对于医疗从业者及商业机构而言,仍然具有极高的吸引力。
    的头像 发表于 05-10 15:58 326次阅读

    为什么说每个CAN从业者都该有台USBCAN呢?

    首先,USBCAN是CAN总线调试的常用工具。它作为CAN总线分析仪或CAN接口卡,能够帮助工程师在测试CAN总线通讯时有效地分析总线上的数据。
    的头像 发表于 04-15 11:07 371次阅读

    赛恩领动携手恩智浦凭借创新4D成像雷达荣获欧洲科技大奖!

    日前,赛恩领动携手恩智浦凭借行业领先的4D成像雷达荣获备受全球自动驾驶从业者瞩目的2024 Tech.AD Europe成像雷达与感知大奖。
    的头像 发表于 03-15 09:16 557次阅读

    【换道赛车:新能源汽车的中国道路 | 阅读体验】新能源汽车值得买吗?未来又会如何发展

    的未来将走向何方等宏观性问题。而这些不仅关系消费者的切身利益,也为许多身处其中而又不能窥见全貌的从业者指明方向,虽然新能源汽车未来的发展道路仍然是机遇与挑战并存,但只要我们坚守本心,立足于自身,那么创建出一条属于我们自己的新能源汽车赛道,并非天方夜谭。
    发表于 03-08 17:33

    【RISC-V开放架构设计之道|阅读体验】一本别出心裁的RISC-V架构之书(第一章)

    的计算机体系架构专 别出心裁地按照RISC-V模块化的指令来组织内容 对比x86、ARM 和MIPS 的设计,通过对比分析,突显RISC-V 的优势 可以作为从业者随时翻阅的案头参考书 开头的蒙娜丽莎像让
    发表于 01-24 19:06