0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据科学家和机器学习实践者的重要技能

星星科技指导员 来源:NVIDIA 作者:Richmond Alake 2022-04-08 14:35 次阅读

数据科学作为一门学科和专业,要求从业者具备各种技能,从沟通、领导等软技能到演绎推理、算法思维、编程等硬技能。但是有一个关键的技能应该由数据科学家掌握,不管他们的经验如何,那就是写。

即使是从事量子计算或医疗研究等技术领域的数据科学家也需要写作。培养强大的写作能力需要时间,而数据科学家面临的挑战是 MIG ht 阻止他们轻松表达自己的想法。这就是为什么本文包含了各种写作策略,并解释了它们如何有益于数据科学和 Machine Learning 专业人士。

1 。短文

让我们从我们遇到的最典型的易理解的写作风格开始。以简短的形式写作通常不费吹灰之力,也不会占用太多时间。 Twitter 、 LinkedIn 、 Facebook 、 Quora 和 StackOverflow 上的机器学习和数据科学内容都属于这一类。

长格式内容,如书籍、文章和散文,通常是 ML 领域最有价值的材料。所有这些都需要时间来写、读和分析。另一方面,社交媒体平台上的短格式内容可以提供信息,同时比长格式内容花费更少的精力和时间。

目前,我们有幸见证人工智能先驱和著名机器学习实践者之间的对话和想法,而无需等待他们撰写和发表研究论文或论文。在社交媒体平台上撰写简短的帖子可以深入了解不易口头表达的观点和观点,您的声音可以参与其中并分享观点。

对于那些想尝试通过社交媒体帖子与其他 ML 专家联系的人,我建议跟随一些发布关于机器学习和数据科学的真实和相关信息的人。花些时间阅读讨论的基调和帖子上的文章,如果你有什么有价值的东西要贡献,就大声说出来。

首先,这里列出了发布 AI 相关内容的个人列表(以及其他有趣的内容): Andrew Ng 、 Geoffrey Hinton 、 Allie, K Miller 、 Andrej Karpathy 、 Jeremy Howard 、 Francois Chollet 、 Aurélien Geron 、 Lex Fridman 。还有很多人需要关注,但这些人的内容应该会让你忙碌一段时间。

问答平台

提问/回答作为一种写作形式,具有最低的进入门槛,并且不会占用太多时间,这取决于你回答建议问题的能力。

考虑到你的职业,我相信你一定听说过 StackOverflow ,这是互联网上最受工程师欢迎的资源。当涉及到关于 StackOverflow 的问题时,事情并没有那么简单;需要明确和透明。正确地编写查询是 StackOverflow 的一个重要组成部分,因此他们已经发布了一份关于该主题的全面指南。

这一部分的要点是:询问和回答有关 StackOverflow 的问题有助于您在提出问题时变得简洁明了,在回答问题时也能变得彻底。

2 。电子邮件和信息

编写电子邮件和消息并不是机器学习的特例,但从事编写有效消息艺术的数据科学家和机器学习实践者往往会在公司和团队中蓬勃发展,原因显而易见,其中一些原因是能够贡献、建立网络和完成任务。

撰写好的信息和电子邮件可以让你获得一个新的角色,获得项目资助或进入学术机构。 Purvanshi Mehta 写了一篇文章,探讨了在 LinkedIn 上发送冷消息的个人建立网络的有效方法。 Purvanshi 的文章是关于可采用的冷消息传递礼仪的逐步说明。

3 。博客和文章

许多专家认为,博客和文章在机器学习社区中具有独特的作用。文章是专业人士如何掌握软件发布的最新信息、学习新方法和交流想法。

技术性和非技术性 ML 文章是您将遇到的两种最常见的文章。技术文章由描述性文本和描述特定功能实现的代码片段或 GIST 组成。非技术性文章包括更多的描述性语言和图片,以说明想法和概念。

4 。时事通讯

启动和维护通讯 或许不适合数据科学家,但这种写作方式已证明为那些愿意投入工作的人提供了专业和社会优势。

时事通讯是DS/ML专业人士提高 AI 行业知名度和影响力的关键战略举措。时事通讯的写作风格没有定义,所以你可以随意选择。你需要开始一份正式的、冗长的、严肃的时事通讯,或者一份简短的、内容丰富的、有趣的时事通讯。

从中吸取的教训是,制作一份时事通讯可以帮助你在你的领域、业务或组织中发展个人品牌。那些喜欢你的人将继续消费和推广你的材料。

有一千个理由让你今天不应该开始一份时事通讯,但是为了给 Spark 一些灵感,下面是一些你可以根据时事通讯的想法,我还包括了一些你应该订阅的 AI 时事通讯。

与人工智能相关的时事通讯想法:

要观看的 AI / ML 视频集合,每个视频上都有您的输入。

要阅读的 AI / ML 文章的集合。

求职者 MIG 不感兴趣的您所在地区的职位公告。

对人工智能的更实际应用感兴趣的 ML 从业者的最新相关人工智能新闻。

记住,时事通讯的频率、长度和内容都是由您定义的。如果你觉得没有太多的时间,你可以开始每月一次的时事通讯,或者每天一次的时事通讯来像机器一样大量地制作内容。

机器学习和数据科学通讯订阅:

The Batch by Andrew Ng

Data Dribble by Ken Jee

O’Reilly AI Newsletter

Daniel Bourke’ s Newsletter

Data Science Weekly

Data Elixir

5 。文档

技术和非技术文档是软件工程职业中的一项常见活动。数据科学家也不例外,解释软件代码或单个功能的文档是推荐的,并被认为是最佳实践。

项目何时成功?一些或许认为,当您的模型在测试数据集上达到可接受的精度时?

经验丰富的数据科学家理解,项目成功受许多变量的影响,包括软件可维护性、寿命和知识转移。软件文档是一项可以改善项目前景的任务,它超出了单个团队成员的能力,更不用说,它提供了一个额外的软件质量和可维护性层。

数据科学家应该意识到文档的一个主要优点是,它可以减少新项目成员或新手数据分析师对源代码的查询。关于源代码的大多数问题都与文件位置、编码标准和最佳实践有关。这些数据都可以记录一次并被许多人引用。

以下是一些您可以记录项目的想法

代码文档:为了保证应用程序之间的一致性,标准化实现样式和格式至关重要。这种一致性使得新开发人员更容易过渡到代码库,因为编码标准是通过代码文档给出的。

研究和分析:鉴于软件产品特性的重要性,成功的开发总是依赖于彻底的研究和分析。任何一位在项目开始时就参与过项目的 ML 专家都会处理涉众提出的过多的特性请求。记录有关特性请求的信息可以使项目中涉及的其他各方更直接地了解所提议特性的需求和有用性。它还强制特征请求者进行更好的研究和分析。

数据库配置/应用程序信息:记录特定于应用程序的信息,例如配置参数和环境变量,对于任何软件团队来说都是至关重要的,尤其是当您转到新的工作或公司时。

How-tos :安装软件库和软件包可能很困难,但事实是,对于不同的操作系统甚至版本,可能有不同的安装过程。在官方图书馆文档中发现缺少的依赖项和安装程序时必须经历的怪癖并不少见。

API 文档:当团队开发内部和外部 API (应用程序编程接口)时,他们应该记录这些 API 所需的方法、函数和数据资源的组件。没有什么比使用非文档化的 API 更烦人的了;整个过程变成了一个猜测游戏,您将花时间研究未记录 API 的参数、内部工作和输出。在使用您提供的技术资源时,通过创建流畅的体验,为您的团队和客户节省时间。

毫无疑问,广泛的资源允许组织进行多种类型的文档编制,有些组织甚至雇佣技术作者。尽管这些都是可行的选择,但对于那些希望认真对待软件完整性的机器学习专家来说,练习记录程序和开发的软件是至关重要的,这样可以促进他们能够提供全面解释的想法。

谷歌在“ ho怎么编写好的软件文档w to write good software documentation ”上的快速搜索提供了 良好资源 ,它们在文档中共享相同的消息和最佳实践。

6 。研究论文

2020 年,我在 how to read research papers 上发表了一篇文章,这篇文章大受欢迎。在使用 ML 算法和模型时,我们必须优化阅读这些论文的方式,就像经验丰富的机器学习专家所做的那样。

写机器学习研究论文是硬币的另一面。我从未写过研究论文,也不打算现在就开始。然而,一些机器学习专业非常关注写作和出版研究。作为职业成功的衡量标准,研究机构和公司使用个人或团体发表的论文数量。

写研究论文是一门艺术;研究人员和科学家必须考虑数据的结构和内容,以确保信息、突破或想法得到有效传递。我们中的大多数人可能不会很快写研究论文,但采用写好研究论文的做法是有价值的。例如,有一个摘要,介绍和结论是一个写作结构转移到其他作品。

继续读一些研究论文;注意作者使用的视觉图像的语言、结构和用途。尝试并采纳你在下一篇文章中确定的任何良好实践。

7 。书籍和电子书

毫无疑问, ML / DS 书籍是关于机器学习理论和实践专业知识的最权威的文本。我并不是建议所有的数据科学家和 ML 工程师都应该写一本书。但请容忍我。

我翻阅了书架上几位用 AI / ML 写书的作者,他们在各自领域都有丰富的经验。

写关于机器学习的非小说、技术书籍是非常困难的。它需要高水平的理论和实践行业知识,只有完全沉浸在学习、研究和实施中才能实现。要培养数百名 ML 工程师和数据科学家,您的声誉必须建立在坚实的学术、商业或研究证书基础上。更不用说,作家在创作好的作品时需要创造力。更具体地说,他们必须掌握在书中传达复杂主题的艺术。

我的观点是,要创造一本永恒的机器学习书籍,你必须走专业化的道路。这听起来并不诱人,但我想让你考虑一个事实,即设定一个长期的写作目标将推动你深入研究机器智能或选择领域,这将增强你对 AI 的一般理解。

面向数据科学家和机器学习实践者的书籍:

SuperIntelligence by Nick Bostrom

AI 2041 by Chen Qiufan and Kai-Fu Lee

Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow By Aurélien Géron

Artificial Intelligence: A Modern Approach by Peter Norvig

你会发现,前面列出的大多数作者在文章中列出的大多数不是所有形式的文章,不管他们的专业领域为何,所以我认为写机器学习实践者和数据科学家需要掌握的一项重要技能。

结论

每当我被问到什么样的生活决定给我带来了最大的好处,无论是社会上的、学术上的还是职业上的,我通常会用我的写作决定来回答。

在这篇文章中,您已经看到了数据科学家和机器学习专家如果定期编写人工智能相关材料可能获得的一些优势。本节集中介绍了本文中列出的所有好处,以确保这些好处都能发挥作用。

ML 专业人员使用写作以简单的方式交流复杂的主题。通过阅读 Andrej Karpathy 写得很好的 blog pos t ,我对卷积神经网络的实际应用有了更大的了解。

不同类型的写作可以帮助你提高创造力和批判性思维。我最近阅读了 AI 2041 by Kai-Fu Lee and Chen Qiufan ,其中作者通过写得很好的虚构故事和对人工智能技术的透彻解释来研究人工智能技术及其对人类生活的影响。两位作家都写了很多年,还写过其他的书。可以合理地得出结论,他们的写作能力使作者能够表达涉及 AI 技术的未来情况,并通过基于当前 AI 发展的批判性和逻辑性预测,探索 AI 集成的未知社会影响。

以讲故事的形式写作给了项目生命。讲好故事,写好故事。向客户、投资者或项目经理等利益相关者复述机器学习项目,与讲故事的艺术相结合,会带来积极和令人兴奋的转变。一位数据科学家向利益相关者解释了为什么联邦医院应利用最新的癌症检测深度学习模型,当与患者早期诊断的故事结合时,该模型变得更具影响力和相关性。

在机器学习社区中,写作是一种成功的知识转移方法。在 DS / ML 世界中,您将获得的大多数信息都是通过书面内容获得的。文章、论文和研究论文都是多年知识的宝库,组织成简洁的章节,有清晰的解释和易于理解的格式。写作是浓缩多年知识和经验的有效途径。

你知道吗,我们敬仰和学习的人工智能先驱和专家也会定期发表文章?在此 article 中,我编制了一份人工智能领域的个人短名单,并提供了他们的工作样本,强调了他们工作的价值和后果。

关于作者

Richmond Alake 是一名机器学习和计算机视觉工程师,他与多家初创公司和公司合作,整合深度学习模型,以解决商业应用中的计算机视觉任务。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1792

    文章

    47442

    浏览量

    238999
  • 机器学习
    +关注

    关注

    66

    文章

    8425

    浏览量

    132773
收藏 人收藏

    评论

    相关推荐

    2024年诺贝尔物理学奖为何要颁给机器学习

    (Geoffrey Hinton),表彰他们在使用人工神经网络的机器学习方面的基础性发现和发明。   作为在科学界具有举足轻重的地位和深远影响的诺贝尔奖,它不仅是对科学家个人成就的最高
    的头像 发表于 10-10 00:11 3789次阅读

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018年的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息等企业助力下打造
    的头像 发表于 12-12 15:59 193次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    蚂蚁集团收购边塞科技,吴翼出任强化学习实验室首席科学家

    领域的研究与发展。令人瞩目的是,边塞科技的创始人吴翼已正式加入该实验室,并担任首席科学家一职。 吴翼在其个人社交平台上对这一变动进行了回应。他表示,自己最近接受了蚂蚁集团的邀请,负责大模型强化学习领域的研究工
    的头像 发表于 11-22 11:14 636次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    和数量直接影响到模型的准确性和可靠性。因此,数据获取、处理、分析和质量控制在AI for Science中至关重要。此外,数据驱动的研究范式也促使科学家从传统的假设驱动转向更加灵活和开
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量
    发表于 10-14 09:12

    AI引擎机器学习阵列指南

    云端动态工作负载以及超高带宽网络,同时还可提供高级安全性功能。AI 和数据科学家以及软硬件开发均可充分利用高计算密度的优势来加速提升任何应用的性能。AI 引擎机器
    的头像 发表于 09-18 09:16 424次阅读
    AI引擎<b class='flag-5'>机器</b><b class='flag-5'>学习</b>阵列指南

    受人眼启发!科学家开发出新型改良相机

    新型事件相机系统与标准事件相机系统对比图。 马里兰大学计算机科学家领导的一个研究小组发明了一种照相机装置,可以改善机器人观察周围世界并做出反应的方式。受人眼工作原理的启发,他们的创新型照相机系统模仿
    的头像 发表于 07-22 06:24 321次阅读
    受人眼启发!<b class='flag-5'>科学家</b>开发出新型改良相机

    天津大学科学家突破人类大脑器官成功驱动机器

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与
    的头像 发表于 07-08 16:00 624次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 520次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 533次阅读

    助力科学发展,NVIDIA AI加速HPC研究

    科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。
    的头像 发表于 05-14 09:17 427次阅读
    助力<b class='flag-5'>科学</b>发展,NVIDIA AI加速HPC研究

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 1197次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度<b class='flag-5'>学习</b>硬件趋势

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 514次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1787次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号