0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么数据分析师都要求写代码?

电子工程师 来源:lp 2019-03-06 14:21 次阅读

Python官方在今年2月做了一份报告,从官方的角度说明了Python的使用状况和受欢迎程度:

该调查由 Python 软件基金会与 JetBrains 一起发起,有来自 150 多个国家的超过两万名开发人员参与。

从官方喜出望外的报告中,我们可以看到Python受到大部分人的欢迎,依旧是用户手中的香饽饽:

在Python的用途上,大家使用Python最常用的场景是数据分析,从涨幅来看也是最高的。相关的机器学习场景涨幅也有7%。

这不禁引出一个问题:Python作为编程语言在数据分析领域的地位似乎举足轻重,但明明有更亲民的Excel、Tableau、PowerBI等软件,为什么数据分析师最终都会代码化?

作为一名使用Python的数据分析师,我想举几个小例子说明:

原因 1

鼠标操作流程手速太慢

即使是打游戏,手速也很大程度上来源于快捷键的使用。

数据分析也一样,代码能简化大量鼠标操作流程,用语言将过程“脚本化”,会帮助分析师减去不必要的操作时间,留出更多时间放在“分析过程”上。

举个例子,Excel做分析的过程可能是:定位空值-删除空值-修改数据格式-去除异常值-公式计算-数据透视表-整理数据-插入图表-调整结果……

繁琐的每一步都是来自鼠标点击,中间错误了哪一步,很多步骤都需要重新调整,浪费大量时间。

图中演示的是使用Excel进行简单的描述统计分析过程,比较繁琐。

Python靠的是代码编写每一步过程,统一语言带来记录方法的统一。当分析过程需要修改,只需要调整设定好的参数,效率当然嗖嗖的。

使用Python代码可以迅速调用数据,计算需求,并记录每一步过程,方便修改。

原因 2

Python拥有强大的库

分析软件每开发出一个新功能需要大量投入。而Python作为编程语言,开发新工具相对容易,一个人开发一个库的例子比比皆是。并且Python的使用热度带来了大量的大神,Python工具库可谓应有尽有,这也是Python有前文报告中众多用途的原因。

回到数据分析,以Python可视化必知基本库matplotlib为例,光是他的官方gallery就有26个大类527个样式,数量上就碾压了市面上大部分同功能软件。

matplotlib官网:https://matplotlib.org/tutorials/index.html

此外Python可视化类工具会有针对图表样式进行调整的代码,也可以交互,几行代码,省时省力,分分钟关机下班。

原因 3

代码辅助数学算法

小时候不爱数学,因为讨厌记繁琐的公式和进行步骤推算,一步算错,步步算错,而且我还无法理解为什么老师要求这么算。

但代码的出现拯救了我对数学的偏见。它能从特例的角度复现数学推理过程。通过计算机成千上万次的计算,让我更快理解算法的含义。

截图来自3blue1brown的微积分教学视频《微积分的本质》

以一道高中数学求导题为例:

求y=x²在x=2时的导数。

这道题不难,使用求导公式可知导数是4。但很多函数是不方便推导求导公式的,是否可以从导数的定义出发,寻找特例说明问题?

有的。

这道题要求的其实是连续可导函数f的曲线上,x=2时切线的斜率,那么我们可以定义一个移动的点m,使得m不断的接近x,当(m-x)足够小时,(f(m)-f(x))/(m-x)会越来越接近该点的所在曲线的切线斜率,也就是我们要求的导数。

图中所示程序迭代了1000次,点m以一定的0.01个单位的速度不断趋近x,结果导数(斜率)在不断趋近于4。

通过这个案例,我想说明的是代码的存在让模拟和迭代变得可能,定义一个规则,找到一个特例,让程序模拟千万遍,答案会呼之欲出。

这是一种使用程序构建算法的思想。

另一个有趣的案例是基于Python的梯度下降算法,使用Python多次模拟寻找最小化的损失函数和模型参数值。

案例文名为《Python推导线性回归模型》的文章,用到了梯度下降的方法推导出线性回归模型,适合python数据分析及机器学习初学者观看,完整链接见文末。

总结一下,数据分析师为什么会要求写代码?

原因在于代码在数据分析上更高效、丰富和自由。事实上代码不仅帮助分析,更能帮助逻辑思维。

如果你想自己感受下使用代码做数据分析带来的高效,建议你现在就可以开始学习Python。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 代码
    +关注

    关注

    30

    文章

    4744

    浏览量

    68343
  • 机器学习
    +关注

    关注

    66

    文章

    8377

    浏览量

    132402
  • 数据分析
    +关注

    关注

    2

    文章

    1427

    浏览量

    34010
  • python
    +关注

    关注

    56

    文章

    4782

    浏览量

    84449

原文标题:会Python和不会Python的区别

文章出处:【微信号:TheBigData1024,微信公众号:人工智能与大数据技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    GPT-4替代年薪60万数据分析师,成本只要2000多

    万以上的数据分析师也包括在内。   GPT-4 完胜人类数据分析师   阿里达摩院与新加坡南洋理工大学合作研究了AI在数据分析上的作用,对比了OpenAI最新的GPT-4与金融行业中的数据分析
    的头像 发表于 05-30 04:47 2120次阅读

    数据分析需要的技能

    商业价值的转换,数据分析师是其中一个重要的职位,那么,想从事该职业需要具备哪些技能呢?1. 精通ExcelExcel处理技能是大数据分析师必备技能,并且需要十分精通,除了常规操作和函数,一些不常
    发表于 04-10 15:59

    python数据分析的类库

    Python之所以这么流行,这么好用,就是因为Python提供了大量的第三方的库,开箱即用,非常方便,而且还免费哦,学Python的同学里估计有30%以上是为了做数据分析师或者数据挖掘,所以数据分析
    发表于 05-10 15:18

    数据分析师当取数机?大材小用背后是BI软件的缺位

    好端端一个数据分析师,天天被业务部门指挥着去拉数据,累死累活不说,还挤兑得没时间做深度分析。久而久之数据分析师都被逼成取数机了。数据分析师
    发表于 12-24 14:05

    成为Python数据分析师,需要掌握哪些技能

    的三大任务分析历史预测未来优化选择第三、数据分析师要求的8项技能统计学统计检验、P值、分布、估计基本工具PythonSQL多变量微积分和线性代数数据整理
    发表于 06-23 12:16

    成为Python数据分析师,需要掌握哪些技能

    的三大任务分析历史预测未来优化选择第三、数据分析师要求的8项技能统计学统计检验、P值、分布、估计基本工具PythonSQL多变量微积分和线性代数数据整理
    发表于 06-30 11:42

    互联网寒冬对数据分析师的影响

    大家最近会看到各种互联网公司缩招、冻结HC、裁员甚至倒闭的新闻,也不免会去想,作为一名数据分析师,互联网人力需求缩减对我们到底有什么影响?
    的头像 发表于 01-11 14:23 2571次阅读
    互联网寒冬对<b class='flag-5'>数据分析师</b>的影响

    介绍从数据分析师转型为数据科学家的具体方法

    入门数据科学早已有许多优秀的博文可供参考,比如以下两篇:《成为Jet.com数据分析师的自学之路》和《入门数据科学需掌握的基础知识》,但是为数据分析师提供转型为
    的头像 发表于 03-01 15:34 3094次阅读

    数据工程数据分析师的区别在哪里

    不少朋友都很困惑,大数据工程数据分析师有什么区别,哪一个的就业好薪资高?
    的头像 发表于 03-12 11:49 1.4w次阅读

    数据分析师数据挖掘有什么区别

    数据分析师是指基于大数据进行数据处理分析的人员,能熟练的用适当的统计分析方法对收集来的大量数据
    的头像 发表于 03-13 14:52 2382次阅读

    目前数据分析师的招聘需求如何?评价待遇如何?

    从薪资来看,数据分析师确实是高薪职位,基本上是10k起步,能开30k的公司也不少。从薪资分布区域来看,各区平均工资基本在15k-22k之间,市场行情也比较统一,平均工资差距都不会太大。
    的头像 发表于 04-24 17:32 3287次阅读
    目前<b class='flag-5'>数据分析师</b>的招聘需求如何?评价待遇如何?

    数据分析师与大数据工程的区别

    数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。
    的头像 发表于 08-16 16:46 4983次阅读

    算法工程数据分析师有什么区别

    数据分析师在做什么?低阶和高阶的区别
    的头像 发表于 08-19 15:23 5386次阅读

    数据分析修炼手册教程免费下载

    本文档的主要内容详细介绍的是数据分析修炼手册教程免费下载包括了:前言,数据分析师如何分类? ,数据分析师的具体工作职责和工作内容有哪些?,如何在业余时间成为数据分析师?,
    发表于 10-08 08:00 1次下载
    <b class='flag-5'>数据分析</b>修炼手册教程免费下载

    高级数据分析师凭什么月薪三万?一文解答你所有困惑

    适逢全国上下都在探讨数字化,各行各业开始不遗余力地深耕数字化转型,数据分析师也成了大热职业,变身抢手的香饽饽。 不过打开招聘网站大家却能看见差距:数据分析师平均薪资在10k到20k之间, 大厂数据分析师
    发表于 07-08 18:07 387次阅读
    高级<b class='flag-5'>数据分析师</b>凭什么月薪三万?一文解答你所有困惑