0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

申请数据科学家职位的经验分享

zhKF_jqr_AI 来源:未知 作者:李倩 2018-11-10 09:24 次阅读

编者按:SharpestMinds联合创始人Jeremie Harris分享了申请数据科学家职位的经验。

我仍然记得我兄弟决定卖出他的比特币的时刻。那是2017年,当时我们在星巴克。我们碰到了一个发传单的中年妇女。传单开头用黑体印着“比特币:通向提前退休的道路”。

当时我挺好奇的,就问了她对加密货币市场的看法,结果发现她对比特币以外的其他加密货币几乎一无所知。以太坊?“从来没听说过。”莱特币?“那是廉价版的比特币,是吧?”

从经验上说,如果毫无头绪的中年妇女都在当地的星巴克向你宣传最新的技术趋势,你大概正接近不实宣传的高峰,或者“泡沫”。

当然这算不上什么新发现。每个人都同意,投资的时候如果你做的和其他所有人都一样,那你不太可能得到多少回报。很奇怪的一点是,人们没能在投资自身上应用同一推理。

假设你想要应聘数据科学家职位。如果你做的全是标准的“我想要成为一位数据科学家”事情,那么这就意味着你不应该期望得到梦想的工作。目前市场已经充斥了初级水平的人员,因此,处于中位数水平的新手数据科学家不太可能得到太多认同。所以,你如果想要避免中位数的结果,为什么要做中位数的事?

问题在于,大多数人开始他们的数据科学之旅时不是这么想的。我在SharpestMinds工作的时候和数百名新手数据科学家聊过,其中大约80%的人告诉我的都差不多:

首先,他们学一些基础(Python + sklearn + Pandas,也许还学点别的,比如SQL)

接着,他们参加了千篇一律的MOOC课程

他们读了一些工作描述,担心不符合条件

也许去参加另一门MOOC,也许开始申请工作

没有收到任何回音(或者,最好的情况下,参加了一些面试,全搞砸了)

变得很沮丧,考虑是不是去读个硕士,或者再申请一些工作

到了抉择的时刻了:该不该重复第2-7步直到发生了不同的事情?

如果这符合你的情况,那么很可能你也处在一个自我提升的泡沫中:你正在做所有其他人都在做的事,但期望得到不同的结果。你需要做一件事:停下来。

如果你期望超出平均水平的结果,那么你不能做平均水平的事情。但是,想要避免平均水平的事,你需要知道什么是平均水平的事。

这里是一些例子:如果你需要参加一个MOOC课程学习一些基础,那很好。但不要陷入MOOC螺旋:MOOC,从定义上来说,基本上都是为平均水平的人设计的。所以你并不会因为上了多门MOOC就成为一个突出的人。类似地,如果你的GitHub上有4到5个Jupyter notebook,内容都是乏味的sklearn/Pandas/seaborn/Keras技术栈,不要再做一个新的了。

总的规则是:如果有一件事看起来是明显的下一步,因为所有其他人都这么做,这是一件很好的不去做的事。相反,你需要找到其他人不做的事,并且尽快去做。

那是些什么样的事情?根据我的经历,我想到5件:

复现论文。如果你是深度学习爱好者,这一点尤其重要。人们不做这事,因为这比获取一个数据集,然后使用简单的人工神经网络或XGBoost进行千篇一律的分类要难。在arXiv上找一篇和你的领域相关的最有趣的论文(最近的论文最理想),阅读它,理解它。接着,复现它,可能是在一个新的数据集上复现。写篇博客总结这次复现。

不要呆在舒适区。如果你开始一个新项目,最好学习一些新框架/库/工具。如果你正创建第6个Jupyter notebook,开头是df = pd.read_csv(filename),结尾是f1 = f1_score(y_true, y_pred),是时候改变你的策略了。

学习枯燥的东西。其他人不做这事,因为没人喜欢枯燥的东西。但是,学习正确的Git流程,如何使用Docker,如何使用Flask搭建一个应用,如何部署模型至AWS或Google Cloud,这些都是公司很盼望申请人具备的技能,但大多数申请人低估了这些技能的重要性。

做头疼的事情。1) 争取在当地的数据科学聚会上讲篇论文。或者,最起码,参加当地的数据科学聚会。2) 给LinkedIn上的人发冷消息。试着首先提供一些价值(“我刚发现了你网站上的一个笔误”)。不要直接向他们请求一份工作。你的请求越具体越好(“我希望你能给我的博客文章一点反馈”)。你正试图建立关系,拓展你的网络,那需要耐心。3) 参加会议和组织。4) 创办一个学习小组。

做看起来疯狂的事情。每个人都用UCI仓库,或者使用某个股票数据集(没劲)来创建他们的项目。别这么做。学习如何使用一个网页抓取库,或者某个被低估的API创建自己的定制数据集。数据很难获取,公司常常需要依靠工程师收集数据。你的目标是成为那种痴迷数据科学的疯子,如果工作需要,会自己创建该死的数据集。

这些策略都是一种在雇主每天面对的噪声中突出自己的方法。它们都不是银弹,但它们是在数据科学工作市场上得到更多认同,成为更能干的数据科学家的万无一失的方法。

最后,记住,培养自己的技能是对自身的投资。那意味着适用于投资的经济学原则同样适用于此:如果你想要突出的结果,那么你需要做突出的事情。

如果你对如何优化自己的机器学习或数据科学轨迹存有疑问,我很乐意和你聊聊。在Twitter上给我(jeremiecharris)发DM :)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 深度学习
    +关注

    关注

    73

    文章

    5495

    浏览量

    121050
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10048

原文标题:想当数据科学家,可别随大流!

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    如何激发科学家的创新思维。AI不仅仅是工具,更是一种思维方式,它鼓励我们跳出传统框架,以数据为驱动,探索未知。这种思维方式的转变,不仅促进了科学方法的革新,也为解决全球性挑战提供了新的视角和途径
    发表于 10-14 09:12

    受人眼启发!科学家开发出新型改良相机

    新型事件相机系统与标准事件相机系统对比图。 马里兰大学计算机科学家领导的一个研究小组发明了一种照相机装置,可以改善机器人观察周围世界并做出反应的方式。受人眼工作原理的启发,他们的创新型照相机系统模仿
    的头像 发表于 07-22 06:24 288次阅读
    受人眼启发!<b class='flag-5'>科学家</b>开发出新型改良相机

    中国科学家发现新型高温超导体

    据新华社报道,我国科学家再立新功,又一新型高温超导体被发现。 复旦大学物理学系赵俊团队利用高压光学浮区技术成功生长了三层镍氧化物,成功证实在镍氧化物中具有压力诱导的体超导电性,而且超导体积分数达到
    的头像 发表于 07-19 15:14 654次阅读

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与机器深度融合的新纪元。
    的头像 发表于 07-08 16:00 580次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 442次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 506次阅读

    科学家研制出一款新型柔性X射线探测器

    英国科学家开发出一种有机半导体材料,并利用其研制出一款新型柔性X射线探测器。这种探测器不仅“身段”更柔软,可贴合需要扫描物体的形状,从而提高患者筛查的准确性,降低肿瘤成像和放射性治疗的风险,而且成本
    的头像 发表于 06-13 06:29 269次阅读

    科学家开发电驱动有机半导体激光器

    圣安德鲁斯大学的科学家们经过长达数十年的努力,在紧凑型激光器研究方面取得了重大突破。 激光在世界各地广泛应用于通信、医学、测量、制造和测量等领域。它们用于在互联网上传输信息,用于医疗,甚至在
    的头像 发表于 06-04 06:30 239次阅读
    <b class='flag-5'>科学家</b>开发电驱动有机半导体激光器

    本源量子参与的国家重点研发计划青年科学家项目启动会顺利召开

    2024年4月23日,国家重点研发计划“先进计算与新兴软件”重点专项“面向复杂物理系统求解的量子科学计算算法、软件、应用与验证”青年科学家项目启动会暨实施方案论证会在合肥顺利召开。该项目由合肥综合性国家科学中心人工智能研究院(安
    的头像 发表于 05-11 08:22 604次阅读
    本源量子参与的国家重点研发计划青年<b class='flag-5'>科学家</b>项目启动会顺利召开

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于2009年1月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12年,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和同步技术,在今天的大多数大型并行计算机中都可以找到。
    的头像 发表于 02-25 16:16 1087次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    AI for Science,开启智能科学时代

    当人工智能遇上科研,让历史上的科学家都闻之落泪……
    的头像 发表于 02-02 09:36 2513次阅读
    AI for Science,开启智能<b class='flag-5'>科学</b>时代

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 652次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 472次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1680次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号