0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何建立一个强大的数据科学团队?

如意 来源:TechTarget中国 作者:邹铮 2020-08-31 14:31 次阅读

数据科学团队中的每个角色都很重要。你需要了解这些角色以及正确发挥他们的作用,以从对数据科学家的巨额投资中获得价值,而不是为表现不佳的团队支付过多费用。

Deloitte AI Institute执行董事Beena Ammanath说:“我们不应该说‘让我们来聘请数据科学家,以及让我们来建立数据团队’,而是应该关联业务挑战,例如流程优化、成本节省、新产品线或竞争对手的业务。”

谁在数据科学团队中?

显然,数据科学家是数据科学团队的重要组成部分。很多数据科学家通常具有数据或统计学方面的高学位,并具有R或Python的编码技能,但他们还必须了解企业想要实现的目标。他们的工作往往具有探索性和迭代性。

俄罗斯数据科学咨询公司BroutonLab的首席技术官兼创始人Michael Yurushkin表示,企业想要实现的目标将确定其聘用的数据科学家的类型。

Yurushkin说:“如果你的目标是改善内容发现、广告定位、收入优化和搜索结果,则应雇用机器学习专家。如果你的目标是测试你的产品设计–使用带有最小偏差的受控实验,那么你需要专门从事实验设计和因果推断的统计人员小组。”

广告植入和许可公司Branded Entertainment Network的AI主管Tyler Folkman说,他是全栈数据科学的忠实拥护者,其中数据科学家收集自己的数据、对其进行清理、对其进行处理、建立模型、将这些模型投入生产,并确保它们为最终用户提供价值。

但是,数据科学家需要可靠的数据。这正是数据工程师的用武之地。他们建立数据管道并管理数据。

Folkman说:“数据工程师构建工具,使数据科学家能够轻松有效地全栈工作。我还没有找到开箱立即提供所需一切功能的供应商,因此让数据工程师构建自己的平台非常有价值,这个平台应整合内部工具、开源工具甚至企业工具。”

大多数专家表示,数据分析师通常是在数据分析师团队或业务部门工作,而不是数据科学团队。不管他们属于哪个部门,他们的技术水平都不及数据科学家和数据工程师,而且他们专注于数据科学的后期阶段,即分析和共享见解。

Folkman认为数据分析师和研究科学家应作为数据科学团队结构的一部分。分析师拥有数据,有助于确保数据健康,并为整个公司提供见解。研究科学家们不断提高技术水平,并投资基础研究。

BroutonLab的Yurushkin还认为需要数据战略家,他作为业务与数据科学团队之间的桥梁。他还认为那些计划建立大型数据科学团队的企业要有数据架构师。

大数据研究所董事总经理Jesse Anderson推荐三种数据团队:数据科学、数据工程和运营。他也是即将出版的《Data Teams: A Unified Management Model for Successful Data-Focused Teams》的作者。

Anderson说:“运营工程师具有专门的能力来监视和管理这些大数据系统。”

但是,当没有数据工程团队时,没有人会注意架构或代码质量问题,这会造成多年的技术负担。Anderson说,而当缺少运营团队时,企业可能会采用在生产中无法正常运行的模型和代码。

公民数据科学家的作用以及他们使用的工具

公民数据科学家是业务领域的超级用户。与真正的数据科学家不同,他们往往缺乏深厚的统计知识,不会使用R或Python进行编程,也不了解机器学习的工作原理

增强型分析工具供应商表示,他们正在使数据科学民主化,这意味着他们将提供简单、功能强大的工具,让公民数据科学家可以用来解决相对简单的问题,例如了解为什么某个地区或某个季度销售额下降。增强分析工具使用AI和机器学习来简化数据准备和分析等任务。相比之下,数据科学家使用专家级工具来帮助解决复杂问题。

Anderson说:“公民数据科学将能够访问企业用于决策的相同数据,而无需等待支持。”

目前有两种方法可以应对公民数据科学。首先是让数据科学团队为大家建立或提供自助服务工具。另一种方法是让业务部门获取自己的工具。前一种方法可最大程度地减少工具蔓延。还可以最大程度降低风险–通过确保对数据和数据使用进行管理和保护。

Ammanath说:“如果你在此过程中处于非常领先的地位,那么在整个企业中拥有公民数据科学是至关重要的,因为你希望他们能够进行自己的数据探索。但是,如果你还处于早期阶段,那么让每个人都可使用数据可能是没有意义,因为你需要了解数据的质量和背景信息。”

数据科学家向谁报告?

数据科学团队可以向首席执行官、首席运营官、首席财务官、首席信息官、首席技术官,首席行政官、首席数据官或其他高级管理人员或副总裁报告。该团队向谁报告将影响该团队所做的工作。根据Anderson的说法,首席营销官可能过于关注产品,首席财务官可能专注于规避风险,而首席技术官或工程副总裁可能不了解数据科学与软件工程的区别。

Ammanath说,数据科学团队应该向CAO或CDO报告,因为拥有集中的数据科学职能非常重要。否则,该举措会变得狭窄而迷失。

该团队向谁报告通常取决于其组织方式。有些企业创建集中的数据科学团队。在其他公司中,业务部门雇用自己的数据科学家。对于更成熟的组织,第三个选择是将这两种结构组合成中心辐射型模型,该模型具有卓越中心,由具有特定业务领域专业知识的数据科学家或数据科学团队支持。

你需要CAO还是CDO?

CAO和CDO的角色经常被混淆。企业可能会混淆使用这两个职位头衔,而没有考虑它们之间的差异。大公司可能同时兼有这两个职位。

Anderson说:“首席分析官通常具有很高的分析背景,而首席数据官则可能具有数据工程背景,也许是数据仓库甚至是DBA(数据库管理员)背景。”

你是否应该雇用CAO还是CDO?答案是肯定的,如果你的企业足够成熟,你可以适当地支持这些职位,而且你会意识到需要这种级别的责任。大公司往往会创建该职位,他们会发现对该职位的需求很明显。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据采集
    +关注

    关注

    39

    文章

    6161

    浏览量

    113762
  • 大数据
    +关注

    关注

    64

    文章

    8896

    浏览量

    137521
  • 数据科学
    +关注

    关注

    0

    文章

    165

    浏览量

    10078
收藏 人收藏

    评论

    相关推荐

    国外科研团队在X射线科学领域取得了重大突破

    了兆赫兹级别,为超快电子动力学研究开辟了新领域。 此次团队展示了单尖峰硬X射线脉冲,其脉冲能量超过100微焦耳,脉冲持续时间仅为几百阿秒(1阿秒=10-18秒)。这时间尺度使科学家能够捕捉到物质中最快的电子运动。
    的头像 发表于 12-20 09:11 154次阅读

    中国科学技术大学团队突破非接触心脏活动感知技术

    近日,中国科学技术大学的陈彦教授团队在非接触心脏活动感知研究领域取得了重大突破。他们首次发现并成功利用了心脏机械活动谐波中的“拍频效应”这关键物理现象,为远程监测心脏活动提供了全新的技术手段。 在
    的头像 发表于 12-17 11:09 616次阅读

    数据科学工作流原理

    数据科学工作流包括数据收集、数据预处理、数据探索与可视化、特征选择与工程、模型选择与训练、模型评估与优化、结果解释与报告、部署与监控等环节。
    的头像 发表于 11-20 10:36 205次阅读

    艾体宝产品 CircleCI:高效的CI/CD平台,助力开发团队加速交付!

    CircleCI是强大的CI/CD平台,专为提高软件开发效率而设计。它通过自动化测试、构建和部署,帮助开发团队加速交付,减少手动错误。支持平行化测试、Docker容器化管理,并与多
    的头像 发表于 11-20 10:22 217次阅读
    艾体宝产品 CircleCI:高效的CI/CD平台,助力开发<b class='flag-5'>团队</b>加速交付!

    《AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应用。这
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    阅读这章后,我深感人工智能与生命科学的结合正引领着场前所未有的科学革命,以下是我个人的读后感: 1. 技术革新与生命科学进步 这
    发表于 10-14 09:21

    《AI for Science:人工智能驱动科学创新》第二章AI for Science的技术支撑学习心得

    的训练和推理提供了强大的算力支持,使得AI在科学研究中的应用更加广泛和深入。 3. 数据驱动的研究范式 第二章还强调了数据在AI for Science中的核心地位。
    发表于 10-14 09:16

    《AI for Science:人工智能驱动科学创新》第章人工智能驱动的科学创新学习心得

    人工智能:科学研究的加速器 第章清晰地阐述了人工智能作为科学研究工具的强大功能。通过机器学习、深度学习等先进技术,AI能够处理和分析海量数据
    发表于 10-14 09:12

    如何使用PyTorch建立网络模型

    PyTorch是基于Python的开源机器学习库,因其易用性、灵活性和强大的动态图特性,在深度学习领域得到了广泛应用。本文将从PyTorch的基本概念、网络模型构建、优化方法、实际应用等多个方面,深入探讨使用PyTorch
    的头像 发表于 07-02 14:08 431次阅读

    建立神经网络模型的三步骤

    建立神经网络模型是复杂的过程,涉及到多个步骤和细节。以下是对建立神经网络模型的三主要步骤的介绍: 第
    的头像 发表于 07-02 11:20 1017次阅读

    中国科学技术大学科研团队取得量子计算研究新进展

    中国科学技术大学科研团队取得量子计算研究新进展 据央视新闻报道,中国科学技术大学科研团队利用自主研发的关键设备,利用“自底而上”的量子模拟方法,在国际上首次实现光子的反常分数量子霍尔态
    的头像 发表于 05-08 16:40 741次阅读

    如何快速建立PID控制程序

    回路输出设置。选择“模拟量”标定为“单极20%偏移量”,即输出信号的int数据范围也是5530~27648,对应电流为4~20mA,点击“下一个”;
    发表于 03-20 09:39 1216次阅读
    如何快速<b class='flag-5'>建立</b><b class='flag-5'>一</b><b class='flag-5'>个</b>PID控制程序

    日本上市企业Toppan Holdings计划在新加坡建立半导体封装基板工厂

    HNPCA消息 日本上市企业Toppan Holdings (7911.T)计划在新加坡建立半导体封装基板工厂,并计划于2026年底开始运营。
    的头像 发表于 03-14 11:22 1617次阅读

    比亚迪智驾团队规模超4000人

    在比亚迪的梦想日活动上,比亚迪集团总裁王传福宣布了项令人瞩目的消息:比亚迪的智驾团队规模已经超过4000人。这庞大的团队包括了1000多名算法工程师和3000多名软件工程师,展示了
    的头像 发表于 01-19 18:26 1704次阅读

    鸿蒙原生应用/元服务实战-AGC团队账户

    内部和跨部门之间的数据共享和流转问题,实现高效开发、分发、推广、变现。每个团队团队成员的上限为200。 本文主要参考引用华为开发者联盟官方文档
    发表于 01-18 16:38