0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在数据科学领域工作前需要了解的事情

如意 来源:百家号 作者:读芯术 2020-07-01 09:49 次阅读

毫无疑问,数据科学如今已经成为并将持续是最热门的职业选择领域,很多人一个猛子扎进了这一领域当中。但是,这个21世纪最热门的职业并不一定适合所有人,这不是说数据科学不值得,恰恰相反它几乎就是为了解决实际问题而生的。

当然啦,本文仅代表作者观点,可能存在一定偏颇。不同国家地区的职业设置以及各人掌握的技能存在差异,因而每个人看世界的角度都不一样。我只从我的经验和角度聊聊我的想法。

入行以来,笔者每天花费10到12小时在数据科学领域中,撰写了将近100篇相关文章,自认为已有资格对这个领域里的某些现象发表一点见解,那些现象令人失望却鲜有人提及。对笔者而言,实用数据科学是最有趣的领域之一,尤其是在进一步深入学习之后更有体会。

然而,为了数据科学而从事数据科学的意义何在呢?这么说吧,除非是研究人员,否则全职从事这个行业几乎没有任何意义。花费大量时间训练模型的理由何在呢?模型会被应用在网页和/或者手机app中吗?是会被用来解决一些实际问题吗?还是只会被闲置在电脑上呢?

数据科学似乎正在成为软件开发的另一个分支。这不见得是坏事,现如今模型训练和优化(只要用对工具)几乎全部都是自动化的,而“数据科学家”需要做的,仅仅是以恰当的方式准备数据,以及向上级汇报工作。

这或许是件好事,你有了更多时间去做有趣的事情,从而交付整个数据包并实际解决问题,而不会将模型闲置在电脑上。

但是,如果计划在这个领域谋求一份全职工作,请先读一读本文,看看行业光鲜外表下的其它方面,了解进入这个行业的优势和可能存在的劣势是很有必要的。

1.不关心业务

先说明一下,除了在Medium和TDS上发表博文以外,笔者还是一个全职的数据科学家。笔者所就职的公司并不专门从事于数据科学的某个分支,仅仅是一家以咨询为主的IT公司。

这意味着笔者并不专注于一个项目或一个产品,而是同时推进三到五个不同行业的不同项目。是的,笔者并不精通于那些行业里的任何一个。这可能是很多人不喜欢数据科学工作的原因,你对所工作的领域了解不多,从业者也并不愿意去学习那么多东西。

不过,对于某些在相关领域从事数据科学的人而言,情况可能并非如此。假设一个人已经在X领域接受了专业教育,并且对数学和统计学掌握得不错,因而被聘用在该领域里从事大量重数据型工作,这就皆大欢喜了。

我所指的是通才型数据科学家,就是那种从一个项目转移到另一个项目工作,但是感觉自己从来没有做出实际贡献的人。

2.缺乏全局观

这个缺点对数据科学领域的通才和专家都适用。

假设有某个项目团队的app需要“数据科学魔法”的加持,于是邀请了一位数据科学家参加会议。这位数据科学家一定会被问到这些问题:

· 你的模型可以做到这点吗?

· 这些现代神经网络可以用在10KB的数据集上吗?

· 你能只用30行数据做一个预测模型吗?

这就是问题所在了。在完全不了解项目及其架构的情况下,就必须很快提供一个最先进的解决方案,也就是所谓的全局观问题。

对于专家型数据科学家可能还没那么麻烦,因为他们至少具备了某些领域的专业知识,并且了解如何去适应全局,这使他们能够相对轻松地完成工作。

3.老板是商人

外行领导内行这件事很容易闹出一些荒谬的困难。如果你的上级不是数据相关领域的专家,那么他们对于数据科学的了解与任何一个普通人从新闻里了解到的没什么两样。

不过,这个问题带来的影响大小在不同的国家是不同的,毕竟不同国家的工作和生活文化可能存在很大差距。

而这带来了一个潜在的问题,团队可能接到一项任务,其研究工作需要数月才能完成,但是从商业角度来说这不太可行。理想的情形是,部门主管能够理解特定解决方案所需要的时间之长和工作量之大,然后在上一级那边帮忙交流疏通,但这样的主管可遇而不可求。

这时就是良好的人际交往能力派上用场的时候了。给你的老板解释清楚为什么花一两个月去搜查100项用不上的东西,这不是一件轻松愉快的事情,但掌握人际交往和项目展示的技巧可能会让局面更好一点。

在笔者看来,只有在有实际问题需要解决时,只深耕于数据科学和预测建模的全职数据科学家才有立足之地。归根结底,数据科学只是一种技能,不应用于解决业务问题就毫无价值。如果不关心相关业务,或者仅仅是不了解业务情况,都可能让工作无法顺利开展。

所以,是否要入行,还请你三思。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 自动化
    +关注

    关注

    29

    文章

    5519

    浏览量

    79126
  • 模型
    +关注

    关注

    1

    文章

    3181

    浏览量

    48732
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10046
收藏 人收藏

    评论

    相关推荐

    数据科学工作流原理

    数据科学工作流包括数据收集、数据预处理、数据探索与可视化、特征选择与工程、模型选择与训练、模型评估与优化、结果解释与报告、部署与监控等环节。
    的头像 发表于 11-20 10:36 141次阅读

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    驱动科学创新》的第6章为我提供了宝贵的知识和见解,让我对人工智能在能源科学中的应用有了更深入的认识。通过阅读这一章,我更加坚信人工智能在未来能源科学领域中的重要地位和作用。同时,我也意
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    研究的深入发展。 3. 挑战与机遇并存 尽管AI在生命科学领域取得了显著的成果,但也面临着诸多挑战。例如,数据隐私、算法偏见、伦理道德等问题都需要我们认真思考和解决。同时,如何更好地将
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    人工智能在科学研究中的核心技术,包括机器学习、深度学习、神经网络等。这些技术构成了AI for Science的基石,使得AI能够处理和分析复杂的数据集,从而发现隐藏在数据中的模式和规律。 2. 高性能
    发表于 10-14 09:16

    USB 3.2双通道操作:您需要了解的内容

    电子发烧友网站提供《USB 3.2双通道操作:您需要了解的内容.pdf》资料免费下载
    发表于 08-30 10:09 0次下载
    USB 3.2双通道操作:您<b class='flag-5'>需要了解</b>的内容

    要了解下大模型知识

    工作需要,想要了解一下大模型算力建设知识。
    发表于 08-20 15:31

    不只是前端,后端、产品和测试也需要了解的浏览器知识(二)

    继上篇《 不只是前端,后端、产品和测试也需要了解的浏览器知识(一)》介绍了浏览器的基本情况、发展历史以及市场占有率。 本篇文章将介绍浏览器基本原理。 在掌握基本原理后,通过技术深入,在研发
    的头像 发表于 08-12 14:32 297次阅读
    不只是前端,后端、产品和测试也<b class='flag-5'>需要了解</b>的浏览器知识(二)

    NI数据采集板卡如何连接使用?

    采集和控制。   1. 了解数据采集板卡: 首先,需要了解所使用的NI数据采集板卡的型号和规格。NI提供了多种型号的数据采集板卡,具有不同的输入通道数、采样率、接口类型等特性。在选择和
    的头像 发表于 07-11 10:05 840次阅读

    不只是前端,后端、产品和测试也需要了解的浏览器知识

    一、我们为什么要了解浏览器? 1. 对于前端开发者 1.浏览器是用户体验的第一线。我们需要了解浏览器的工作原理,才能有效地设计和实现用户界面,确保良好的用户体验。 2.好的产品需要考虑
    的头像 发表于 07-01 18:03 435次阅读
    不只是前端,后端、产品和测试也<b class='flag-5'>需要了解</b>的浏览器知识

    【天拓四方】边缘网关在数据采集中起什么作用?

    的基本概念、数据采集流程、核心技术等方面,深度解析其在数据采集中的关键作用。 首先,我们需要了解边缘网关的基本概念和特点。边缘网关是一种部署在网络边缘侧的网关设备,它通过网络联接、协议转换等功能,实现了物理世界与数
    的头像 发表于 04-12 15:06 334次阅读
    【天拓四方】边缘网关<b class='flag-5'>在数据</b>采集中起什么作用?

    选择贴片电容时需要了解哪些问题?

    购买贴片电容时,需要了解以下几个方面: 1、电容类型与规格:贴片电容有多种类型,如陶瓷电容器、铝电解电容器、钽电解电容器、多层陶瓷电容器(MLCC)以及聚合物电容器等。每种类型都有其特定的应用场
    的头像 发表于 03-29 15:45 322次阅读

    ADUC360 I2Cmaster.c中master handler与实际传送的数据什么关系?需要传送的数据是要放在数组里吗?

    ADUC360 I2Cmaster.c中 master handler 与实际传送的数据什么关系,需要传送的数据是要放在数组里吗?
    发表于 01-15 08:26

    磁环在数据线上的应用及选择

    磁环在数据线上的应用及选择 随着科技的进步和发展,数据线已成为人们日常生活和工作中不可或缺的一部分。数据线起着连接设备和传输数据的重要作用。
    的头像 发表于 01-11 15:24 1101次阅读

    关于IGBT 安全工作区 你需要了解这两个关键

    沒有下降的情况下的工作电流和电压条件。实际上,不仅需要在安全工作区内使用IGBT,还需对其所在区域实施温度降额。安全工作区分为正向偏置安全工作
    的头像 发表于 12-13 20:15 1910次阅读
    关于IGBT 安全<b class='flag-5'>工作</b>区  你<b class='flag-5'>需要了解</b>这两个关键

    J-Link 中的JTAG 接口:正确使用需要了解的注意事项,在这里!

    J-Link 中的JTAG 接口:正确使用需要了解的注意事项,在这里!
    的头像 发表于 12-01 16:01 1411次阅读
    J-Link 中的JTAG 接口:正确使用<b class='flag-5'>需要了解</b>的注意事项,在这里!