0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2019年,你还想做数据科学家吗?

DPVg_AI_era 来源:lq 2019-02-24 10:40 次阅读

人工智能的火爆带动了对数据科学家的大量需求。看到急缺的岗位和高薪,谁能不动心呢?可是你确定想好要成为一名数据科学家了吗?你知道成为一名DS,需要具备什么技能吗?那就请准备好,下面我们要开车了!

你可能已经从媒体铺天盖地的报道中,了解到数据科学家这个抬头非常火。

根据UiPath数据显示,2018年12113个岗位争夺AI人才,数据科学家需求量排名第二。

于是很多人萌生了入行、或者转行做数据科学家的念头。那么接着就带来一个问题:如何成为一名数据科学家呢?

接下来,由《Getting Started with SQL》(O’Reilly)和《Learning RxJava》(Packt) 二书的作者、美国西南航空的企业顾问Thomas Nield,献上这份《2019年数据科学家成长指南》。

废话不多说,马上进入战斗。

Round 1:不考证完全没问题。当然考了也可以

不要把工作后宝贵的时间,浪费在考证上。「数据科学」不过是「商业分析」的一个分支,而且通常学校的知识总是和当前的科技前沿脱节。如果真的想学建议去Coursera或者可汗学院自学。

当然,证书多了终归是好事嘛。如果你非要去学校考证,建议考物理或者运筹学的研究生。我了解到很多一流的数据科学家,基本都是这俩专业毕业的。

花个几年时间研究生毕业后,明天就会更好?反正有个数据科学初创公司的创始人说:

博士学历不重要;硕士学历无可无不可;学士毕业必须有,因为用人单位最低要求就是大学毕业。

https://towardsdatascience.com/do-you-need-a-graduate-degree-for-data-science-8e3d0ef39253

Round 2:成为一个数据科学家真的需要了解这么多领域吗?

这是一张6年前的图,里面甚至连TensorFlow都没有。

而且我觉得,数据科学发展到现在,已经非常碎片化和细分化了。根本没必要搞的这么复杂。

Round 3:我应该学哪门语言呢?需要从Linux入手吗?

数据科学家是一个跨平台物种,操作系统不重要。

语言的话,Scala早就过气了,R解决数学问题非常爽,Python才是万能的。一条Python在手,数据科学跟我走。

不过需要了解一些库,类似Pandas用来处理数据帧,matplotlib用来创建图表。

Round 4:学会Python很关键!学不会也没关系

Python学起来超简单。不过,你可能也不用非得学会Python。

作为人类,要善用工具。数据科学不止眼前的脚本和机器学习,还有远方的数据可视化。这个时候显然Tableau更好用,也更美观。

Tableau

不过涉及到数据清洗、管理、转换、加载等,就需要用到Alteryx了,鼠标拖拽就能搞定。

新智元点评:所以买个Tableau就可以称为数据科学家了?

从淘宝买个激活码岂不是要变成二手科学家?

Round 5:明明靠Excel和PPT就能搞定,为什么非要学Python呢?

首先,能为你的简历增加光环。

其次,之前也说过,Python简直万能。通过Jupyter notebook逐步完成每个数据分析阶段,让每一步都可视化,就像你正在创建一个可以与他人分享的故事。

划重点:毕竟,沟通和讲故事才是数据科学的重要组成部分。

数据科学和软件工程很大程度可以划等号。不同之处在于,数据科学必须有数据,软件工程就不一定了。

Wiki网页是一个非常好的数据来源,抓取网页并使用Beautiful Soup解析他们,就得到了大量非结构化文本数据。

Round 6:懂NoSQL行,不懂也没事

非机构化数据才能激发我们的想象力,结构化数据只能固化我们的逻辑能力。

如今像谷歌Facebook这样的大厂,拥有大量的非机构化数据,他们就像裁判一样,「数据科学」的定义权掌握在他们手里。剩下我们这些运动员,只好用无聊的SQL咯。

利用非结构化数据,大厂可以通过挖掘用户内容、邮件、故事,用于广告或者其他途径。

而我们也可以利用非结构化数据,对社交媒体上的帖子进行,做一些NLP应用比如聊天机器人

NoSQL更擅长存储这类数据。但是对于数据科学家来说,NoSQL也不是必须要掌握的,除非做数据工程师。而且现在Apache Kafka比NoSQL更火,所以你也知道该学什么了。

有的人可能不知道,数据科学家分为两种角色。数据工程师使用生产系统并帮助使数据和模型可用;而数据科学家则负责机器学习以及数学建模。

这个时候,利用朴素贝叶斯算法,就可以去预测文本的分类。我打算建议从具有均值和标准差的正态分布开始。也许用z分数和线性回归计算一些概率或两个。

Round 7:学会线性代数很重要。不会的话……也行吧

传统智慧认为线性代数是许多数据科学的基石,因此掌握线性代数很重要。将矩阵相乘和相加(称为点积),将一直伴随着你。

听起来很无聊对吧,但这就是机器学习在做的事情。当你进行线性回归或构建自己的神经网络时,你将使用随机权重值进行大量矩阵乘法和缩放。

不过实际上,你可能也不需要学习线性代数,因为有像TensorFlow和 scikit-learn这样的框架和库,帮你解决掉最枯燥乏味的线代部分。

呃,实际上,也别用TensorFlow,用Keras。

Round 8:棒。总之都能用Excel实现,所以会用Excel就可以被称为数据科学家了?

机器学习通常在做两个任务:回归,或者分类。但技术上来说,分类就是回归。

决策树、神经网络、支持向量机、逻辑回归、线性回归都执行某种形式的曲线拟合。

所以,我们也可以不负责任的说:机器学习只是回归。神经网络实际上只是具有一些非线性函数的多层回归。图像识别也是回归。

Round 9:为什么大家现在不怎么谈论算法了?

因为这些优化问题已经在很长一段时间内得到了令人满意的解决,而且这些方法在很早以前也没太多人讨论。

运筹学已经提供了许多机器学习使用的优化算法。同时也为常见“AI”问题提供了许多解决方案。

AI炒作重新点燃了机器学习及其解决的问题类型:图像识别,自然语言处理,图像生成等。

机器学习,深度学习…今天被炒作的任何东西,通常都不能解决离散优化问题,人们尝试过,但效果非常不理想。

所以有人说深度学习是否已经达到了极限,AI寒冬又双来了。

Round 10:AI玩游戏已经超神,接下来会取代人类工作吗?

首先我们要明确一点。人们已经找到了一些巧妙的回归应用,例如计算围棋和象棋最优移动(离散优化也可以做),或自动驾驶的汽车计算转向的方向。

但是,回归只能将这么多的应用组合起来,完成单一任务。

现在我们好好思考一下,你会担心职业星际争霸选手威胁到你的工作吗?你觉得打星际,和你打Excel之间,有多少重叠的交集呢?

如果你连人类星际选手都不怕,你为什么还怕一个回归呢?AI玩星际再强,它也只会玩星际。

Round 11:一句话解释什么是数据科学家,让你爷爷也能听懂

数据科学的界限正在模糊。它可以是任何东西,也可以什么都不是。成为数据科学家你需要掌握很多东西,但就算没掌握也不会致命。

天哪❗️

不过幸好,这个世界上还是有人能说明白到底什么是数据科学和数据科学家的。一句话解释数据科学家:

数据科学家是比软件工程师更懂统计、比统计学家更懂软件工程的一个人。

Round 12:已疯

所以,2019年,你还想做数据科学家吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    11304

    浏览量

    209499
  • 人工智能
    +关注

    关注

    1791

    文章

    47279

    浏览量

    238493
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10059

原文标题:数据科学家成长指南:从入门到被逼疯

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI 推动未来科学 晶泰科技共襄未来科学大奖周

    科学家,探讨学科交叉与学术创新,倾力打造兼具权威性、专业性和国际影响力的科学盛会。 未来科学大奖由未来论坛于 2016 创设,被誉为"中国诺贝尔奖"。未来论坛是当前中国极具声望的民
    的头像 发表于 12-18 09:58 117次阅读
    AI 推动未来<b class='flag-5'>科学</b> 晶泰科技共襄未来<b class='flag-5'>科学</b>大奖周

    西湖大学:科学家+AI,科研新范式的样本

    研究,创新科研新范式。这一点在西湖大学的科研项目中已得到体现。 成立于2018的西湖大学是由施一公院士领衔创办的、聚焦前沿科学研究的研究型大学,该校鼓励科学家们探索AI与各学科交叉融合,为科研创新提速。为此,西湖大学在浪潮信息
    的头像 发表于 12-12 15:59 164次阅读
    西湖大学:<b class='flag-5'>科学家</b>+AI,科研新范式的样本

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    如何激发科学家的创新思维。AI不仅仅是工具,更是一种思维方式,它鼓励我们跳出传统框架,以数据为驱动,探索未知。这种思维方式的转变,不仅促进了科学方法的革新,也为解决全球性挑战提供了新的视角和途径
    发表于 10-14 09:12

    受人眼启发!科学家开发出新型改良相机

    新型事件相机系统与标准事件相机系统对比图。 马里兰大学计算机科学家领导的一个研究小组发明了一种照相机装置,可以改善机器人观察周围世界并做出反应的方式。受人眼工作原理的启发,他们的创新型照相机系统模仿
    的头像 发表于 07-22 06:24 305次阅读
    受人眼启发!<b class='flag-5'>科学家</b>开发出新型改良相机

    中国科学家发现新型高温超导体

    据新华社报道,我国科学家再立新功,又一新型高温超导体被发现。 复旦大学物理学系赵俊团队利用高压光学浮区技术成功生长了三层镍氧化物,成功证实在镍氧化物中具有压力诱导的体超导电性,而且超导体积分数达到
    的头像 发表于 07-19 15:14 694次阅读

    天津大学科学家突破人类大脑器官成功驱动机器人

    在科技探索的征途上,天津大学的科研团队再次迈出了令人瞩目的步伐。7月5日,该校宣布了一项革命性的成果——科学家们利用前沿的干细胞技术,成功培育出了高度模拟人类大脑的类脑器官,并创新性地将其与机器人系统通过先进的片上脑机接口技术紧密相连,开启了人脑与机器深度融合的新纪元。
    的头像 发表于 07-08 16:00 612次阅读

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 496次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 525次阅读

    科学家研制出一款新型柔性X射线探测器

    英国科学家开发出一种有机半导体材料,并利用其研制出一款新型柔性X射线探测器。这种探测器不仅“身段”更柔软,可贴合需要扫描物体的形状,从而提高患者筛查的准确性,降低肿瘤成像和放射性治疗的风险,而且成本
    的头像 发表于 06-13 06:29 311次阅读

    本源量子参与的国家重点研发计划青年科学家项目启动会顺利召开

    20244月23日,国家重点研发计划“先进计算与新兴软件”重点专项“面向复杂物理系统求解的量子科学计算算法、软件、应用与验证”青年科学家项目启动会暨实施方案论证会在合肥顺利召开。该项目由合肥综合性国家
    的头像 发表于 05-11 08:22 707次阅读
    本源量子参与的国家重点研发计划青年<b class='flag-5'>科学家</b>项目启动会顺利召开

    NVIDIA首席科学家Bill Dally:深度学习硬件趋势

    Bill Dally于20091月加入NVIDIA担任首席科学家,此前在斯坦福大学任职12,担任计算机科学系主任。Dally及其斯坦福团队开发了系统架构、网络架构、信号传输、路由和
    的头像 发表于 02-25 16:16 1152次阅读
    NVIDIA首席<b class='flag-5'>科学家</b>Bill Dally:深度学习硬件趋势

    康奈尔大学科学家研制出5分钟快速充电锂电池

    锂离子电池如今广泛应用于电动汽车及智能手机领域。其优点包括轻巧、抗震、环保,但充电时间较长及承受大功率电涌的能力不足。随着最新研究成果发布,科学家找到了一种独特的铟阳极材料,与锂离子电池内的阴极材料实现良好配合。
    的头像 发表于 01-26 09:57 681次阅读
    康奈尔大学<b class='flag-5'>科学家</b>研制出5分钟快速充电锂电池

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 495次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50 个团队被授予
    的头像 发表于 01-19 19:22 1737次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越工程师” 称号