0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据科学容易犯的5个误区

西西 来源:T168编译 作者:Sri Megha Vujjini 2020-02-04 15:05 次阅读

数据如今已经体现出巨大的价值——企业通过数据分析来为包括市场支出、员工决策到产品开发等所有事情提供参考性建议,而这也意味着,数据科学家在工作中的价值正变得越来越突出。

随着人工智能的发展,数据科学家开始越来越受欢迎。与此同时,数据科学家确保自身能够持续地提升自我价值,以及通晓如何利用数据科学最佳实践是很重要的。这篇文章中列举了五个数据科学家可能常犯的误区,并对如何防止这些失误的出现给出了一定的建议。

误区1:专注于电脑,而不是同事

在数据科学初学者之中有一个常见的误解,即在实际工作中他们的工作主要是编写技术代码,而另有他人将向业务相关者展示他们的发现。但事实远非如此,数据科学家的工作是发现有助于业务增长的信息

首先,数据科学家必须能够与业务人员交流,共同探讨他们发现的信息如何在更大程度上对业务产生影响;其次,他们必须知道到哪里寻找这些信息。第二部分是至关重要的:一个整天坐在办公桌前的数据科学家,可能永远不会意识到销售团队正面临着客户流失的问题,或者营销团队正在为转化率的事焦头烂额。

业务运营中总会存在各种各样的问题,数据科学家可以帮助解决很多问题。不要只看数据,离开你的办公桌去了解公司的日常工作,这样你就能知道如何提供更大的价值。

误区2:忽略业务领域的大环境

除了定期与业务部门的同事沟通之外,花时间了解你所在行业的大环境也很重要。如果你正在为一家零售公司制定解决方案,花点时间开车去他们的实际地点,观察他们是如何运作的——销售人员在做什么、购物空间的设计、经理的工作内容,等等。

更全面地理解业务环境,对于提供业务洞察和数据科学最佳实践至关重要。如果你不了解企业是如何运作的,就不可能帮助它更好地运作。数据科学家必须理解数据代表什么,否则,您将会遇到这样的情况:根据您的模型,一切都应该完美地工作——但是仍然存在一些现实问题,您只能通过观察业务的实际情况来了解这些问题。

当您对业务的大环境有了一定的了解之后,就可以找到失效的流程,查看数据,并推测出了什么问题,在对您的假设进行测试并确认之后,做出相应的改进。

误区3:只注重理论而忽视实践

与许多领域一样,数据科学往往是实践重于理论。问题是,数据科学的实践是学不到的,你必须在真实的环境中运行。

在企业中,数据科学家必须经受各种压力,包括:

与其他部门和团队协调。有时可能会随着内部优先级的变化而从一个项目跳到另一个项目,或者当您的主要解决方案不能按照建议实现时,需要寻找替代解决方案。

代码集成的挑战。有时,您的代码不能轻松地与现有代码集成,这意味着您必须找到对应解决方案。

预算限制。在实际工作中,每个项目都有预算限制。弄清楚如何在有限的预算下,获得足够好的(而不是完美的)解决方案,这是数据科学家有效工作的关键部分。

虽然关注最新的文章、博客和前沿技术也很重要,但在这份工作中,有些部分你只能边做边学。一个具备高工作效率的数据科学家,应知道如何平衡他们的专业发展。

误区4:从不问为什么

要成为更好的数据科学家,只需问一问为什么。这个问题有助于消除数据科学家和公司其他部门同事之间的沟通障碍。

想象一下,一家零售公司的营销主管要求建立一个数据模型,该模型能够显示有多少消费者产生购买行为的原因是与他们访问网站的渠道相关的。在创建模型之前,你可以先问问为什么。是为了了解哪些客户是最有价值的,这样他们就能知道从哪里可以获得更高的转化率?是为了帮助销售团队优先考虑渠道吗?他们有办法衡量新老客户吗?他们会将产品收益作为考虑因素吗?

为了建立一个真正有用的模型,你必须理解你的同事希望用它去解决的问题——当你这样做的时候,你可能比你最初预想的更容易解决它,这对每个人都有好处。

误区5、假设您的数据是干净的

在许多情况下,数据科学家80%的工作是清理数据——最后20%的工作是运行机器学习深度学习模型,以获取数据洞察。

接收数据集时要做的第一步是辨认有多少数据是直接可用的,第二步是确定如何让获得一个完全可用的数据集。

数据从来都不是完美的——如果是的话,数据科学家就不会有工作了。我们必须使不完美的数据变得可用,这要求我们理解业务的大环境——您不需要哪些信息?哪些是关键任务?

人们很容易陷入一种现代思维模式,即数据是企业中所有意义和价值的来源(尤其是如果你是一名数据科学家)。但如果我们想要继续为我们工作的公司带来价值、发挥数据科学的最佳实践效果,我们必须承认只有当我们的工作是整个商业生态系统中的一部分时,我们的工作才最有价值——这取决于数据科学家本身与生态的协作。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6914

    浏览量

    88850
  • 人工智能
    +关注

    关注

    1791

    文章

    46903

    浏览量

    237680
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10046
收藏 人收藏

    评论

    相关推荐

    逻辑异或的常见误区及解决方法

    用于布尔值(真/假)之间的运算,其结果是基于输入值的逻辑差异。 按位异或则用于整数或二进制数的每一位进行异或运算,其结果是一新的二进制数。 误区在于有时会将两者混淆,尤其是在编程环境中,如Python中的 ^ 是按位异或运算符,而不是逻辑异或。 误解异
    的头像 发表于 11-19 09:56 133次阅读

    C++新手容易的十编程错误

    简单的总结一下 C++ 新手容易的一些编程错误,给新人们提供一参考。 1 有些关键字在 cpp 文件中多写了 对于 C++ 类,一些关键字只要写在 .h 中就好,cpp 中就不用再加上了,比如
    的头像 发表于 11-15 12:42 223次阅读

    编程语言的误区与常见问题

    : 选择编程语言时,应考虑项目需求、个人兴趣以及语言的适用性。例如,如果你对Web开发感兴趣,那么学习JavaScript可能是一好选择。 认识到没有一种编程语言是万能的。不同的语言有不同的优势和适用场景,灵活选择是关键。 误区二:忽
    的头像 发表于 11-15 09:35 203次阅读

    eda的常见误区和解决方案

    探索性数据分析(EDA)是数据分析过程中的重要步骤,它涉及对数据的初步检查和分析,以便更好地理解数据集的特征和结构。 误区1:忽视
    的头像 发表于 11-13 10:59 244次阅读

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工智能技术在生命科学领域中的广泛应用和
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第一章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据,发现传统方法难以捕捉的模式和规律。这不仅极大地提高了
    发表于 10-14 09:12

    必看!光伏并网逆变器的3典型认识误区

    必看!光伏并网逆变器的3典型认识误区-古瑞瓦特 逆变器作为光伏系统的中枢控制器,对整个系统的运行和产出起到关键作用。当系统出现待机、停机、告警、故障、发电量未达预期、数据监控中断等问题时,运维人员
    的头像 发表于 07-11 16:32 738次阅读
    必看!光伏并网逆变器的3<b class='flag-5'>个</b>典型认识<b class='flag-5'>误区</b>

    负载电容的误区: 如何选择合适的电容器?

    负载电容的直接误解: 一种常见的错误是认为石英晶体数据表上的负载电容直接决定了两外部电容器的值。例如,如果晶体的负载电容为20 pF,误以为两电容器都需要为20 pF,这会导致频偏。2. 负载电容
    发表于 06-05 11:41

    家用路由器使用中的误区和解决方案

    家用路由器在使用过程中,用户往往容易陷入一些误区,如忽视设置、过度使用无线信号、不重视网络安全以及忽视保养维护等。这些误区不仅可能影响网络的速度和稳定性,还可能带来安全隐患。因此,了解并避免这些
    的头像 发表于 04-17 11:17 361次阅读

    购买工控主板的三大误区

    最近有很多人问我什么样的工控主板算好的,有没有一统一的标准。工控主板作为整机的核心组成部分,在性能稳定上有着至关重要的作用,那今天小编就来给大家讲解一下在购买工控主板经常会的几个错误。
    的头像 发表于 04-16 16:40 308次阅读

    如何避免工业级路由器使用误区,提高网络效率

    工业级路由器在工业自动化、物联网等领域发挥着至关重要的作用。然而,由于其应用环境的特殊性,使用过程中容易出现一些误区,导致网络效率低下。本文将针对这些误区,提出相应的解决方案,帮助读者避免使用
    的头像 发表于 04-12 14:15 263次阅读

    贴片电容使用的四误区

    贴片电容是一种常用的电子元件,具有优异的性能和可靠性,在各类电路中得到广泛应用。贴片电容在电子电路中起着至关重要的作用,但在使用过程中,存在一些常见的误区。以下是四主要的误区误区
    的头像 发表于 04-12 11:32 388次阅读
    贴片电容使用的四<b class='flag-5'>个</b><b class='flag-5'>误区</b>

    低功耗设计的几个误区分享

    拉一单纯的输入信号,电流也就几十微安以下,但拉一被驱动了的信号,其电流将达毫安 级,现在的系统常常是地址数据各32位,可能还有244/245隔离后的总线及其它信号,都上拉的话,几瓦的功耗就耗在这
    发表于 01-09 08:04

    示波器探头的使用误区

    示波器探头是电子测试中常用的工具,但在使用过程中存在一些常见误区。小编将详细介绍这些误区,帮助您更好地理解和使用示波器探头。           误区一:探头匹配问题 许多示波器探头在连接
    的头像 发表于 12-18 14:49 498次阅读
    示波器探头的使用<b class='flag-5'>误区</b>

    电工接线的九大误区及解决方案

    不注意细节,电工在实际操作中常常会一些错误,导致电线接头不牢固、接线盒内乱七八糟等问题。本文将介绍电工接线的九大误区及解决方案,希望能够帮助电工们更好地进行接线工作。 误区一:接线过于匆忙 在赶工期或追求效率
    的头像 发表于 12-15 10:31 1699次阅读