0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

《经济学人》数据可视化编辑:针对数据可视化的问题分为三类

电子工程师 来源:lq 2019-05-08 17:27 次阅读

经济学人杂志除了色彩鲜明的文章之外,其在数据可视化方面也自成一派。绝妙的颜色搭配,风格鲜明的图表总能让读者过目不忘。

据图表编辑编辑Sarah Leo在一篇博客中介绍到:虽然对于每一张图表,他们都尽量准确地以最能支持故事表达的方式来可视化数字,但有时候也会犯错。

为了能够做的更好,他们在从错误中不断总结教训,不断的自我改进。为此Sarah Leo还把经济学人的错误总结为3点,并写成一篇博客,供大家参考,大数据文摘对文章编译如下☟

深入了解我们的记录后,我找到了几个有用的例子。我将针对数据可视化的问题分为三类:

误导性图表

模糊的图表

未能说明问题的图表

免责声明:大多数“原始”图表是在我们的图表重新设计之前发布的。改进的图表是为了符合我们的新规格而绘制的。它们的数据完全一致。

误导性的图表

以误导的方式呈现数据是数据可视化中最严重的问题,虽然我们从不故意这样做,但它确实时不时发生。我们来看看三个例子。

错误:截断标尺

这图就很左翼分子对不对

此图表显示了政治左翼Facebook页面上帖子的点赞平均数量。这张图表的重点是显示Corbyn先生与其他帖子之间的差异。

原始图表不仅低估了Corbyn先生的数量,还夸大了其他帖子的数量。在重新设计的版本中,我们完整地展示了Corbyn先生的数据并保证所有其他数据长条仍然可见。

另一个奇怪的是颜色的选择。为了模仿工党的配色方案,原图使用了三种橙色/红色色调来区分Jeremy Corbyn与其他国会议员和政党。虽然颜色背后的逻辑对许多读者来说可能是显而易见的,但对于那些不太熟悉英国政治的人来说,这可能没什么意义。

错误:通过故意操纵坐标轴来假装存在相关关系

难得的完美关联?并不是的。

上面的图表附有一个关于狗重量下降的故事。乍一看,似乎狗的体重和颈部大小完全相关。但这是真的吗?其实并不是很相关哦。

在原始图表中,两个坐标轴的跨度均为三个单位(左边是21到18;右边是45到42)。按百分比计算,左边的比例下降了14%而右边则下降了7%。在重新设计的图表中,我保留了双坐标轴的设计,但调整了它们的范围以反映可比较的比例变化。

考虑到这个图表的休闲主题,这个错误可能看起来并没有那么重要。毕竟,图表的信息在两个版本中都是相同的。但我们从中学到的事情很重要:如果两个变量过于紧密相关,那么再仔细观察一下坐标轴尺度可能是一个好主意。

错误:选择错误的可视化方法

对脱欧的看法几乎和谈判结果一样不稳定

我们在每日新闻应用Espresso中发布了此投票图表。它显示了民众对欧盟公投结果的态度,并以折线图绘制。从数据来看,似乎受访者对公投结果的看法相当不稳定——每周都会增加或减少几个百分点。

我们并未使用平滑曲线绘制单个民意调查来显示趋势,而是连接每个民意调查的实际值。这主要是因为我们的内部图表工具没有绘制平滑线条的功能。我们直到最近才逐渐开始熟悉更复杂的可视化统计软件(如R)。今天,我们团队所有人都能够绘制一个类似上面重新设计的投票图表了。

此图表中需要注意的另一件事是坐标轴如何起点的方式。原始图表将数据扩展到全部空间。而在重新设计的版本中,我在坐标轴开始的部位和最小数据点之间留下了更多空间。弗朗西斯·加农(Francis Gagnon)为此制定了一个很好的规则:我们应当试着在一个不从零开始的折线图下留出至少33%的空白区域。

模糊的图表

这没有误导性图表那么过分,但是一份难以阅读的图表还是表明可视化工作做得很糟糕。

错误:“发散性思维”过于发散了

…这啥玩意?

在“经济学人”杂志上,我们被鼓励创造“发散性思维”的新闻报道。但是有时候,我们会认为这有点太过分了。上图显示了美国的商品贸易逆差和制造业就业人数。

该图表非常难以阅读。它有两个主要问题。首先,一个变量(贸易逆差)的值完全是负数,而另一变量(制造业就业)都是正数。将这些差异结合在一个图表中而不平坦化任一变量非常不合理。有一个显而易见的解决方案,但这却会导致第二个问题:两个变量不共享共同基线。贸易赤字的基线位于图表的顶部(通过图表左半边那截红线突出显示),而右半部分的基线则位于底部。

重新设计的图表显示其实并没有必要组合这两个数据系列。贸易逆差与制造业就业之间的关系仍然很明显,而这一图表并没有额外占据多少空间。

错误:莫名其妙的颜色使用

该图表将政府在养老金福利方面的支出与国家65岁以上人口比例进行了比较,并特别关注了巴西的情况。为了使图表占据较小版面,可视化工具仅标记了部分国家/地区,并以电蓝色突出显示。经合组织的平均值则以淡蓝色突出显示。

可视化者忽略了这样一个事实,即不同颜色通常意味着不同分类。乍一看,这个图表似乎也是如此——所有电蓝色似乎属于与深蓝色不同的组合。但其实压根不是这样的,区别只是一个有打上国家标签,一个没有而已。

在重新设计的版本中,所有国家/地区的圆圈颜色保持不变。我将没有标签的数据点的透明度调高了。剩下的就靠排版了:巴西是重点国家所以用字体加粗;而经合组织则用斜体字表示。

未能说明问题的图表

最后一类的错误不太明显。像这样的图表不会误导读者,也不会让人感到困惑。他们只是没有证明他们存在的合理性 - 通常是因为可视化不合理,或者因为我们非要在小版面内塞进过多信息。

错误:包含太多细节

“颜色越多越好!”——好的可视化才不会这样

这彩虹真好看!我们在德国预算盈余的专栏中公布了这张图表。它显示了10个欧元区国家的预算余额和活期账户余额。

有这么多颜色,而且其中一些很难被区分。另外,因为对应的值太小了,压根没有办法得到任何图表信息。它只会让你眼前一愣然后赶紧转移视线。而且更重要的是,由于我们没有绘制所有欧元区国家,因此堆叠数据没有任何意义。

我回过头看看有没有办法简化这个图表。该专栏提到德国、希腊、荷兰、西班牙以及欧元区总数。在重新设计的图表版本中,我决定只强调这些。为了解决仅堆叠部分国家的问题,我添加了另一个类别(“其他”),其中包括所有其他欧元区国家。(由于欧盟统计局进行了数据修订,重新设计的图表中的流动账户余额总额低于原始图表。)

错误:大量数据,空间不足

我放弃。

受到有限版面空间的限制,我们经常试图将所有数据一股脑儿塞进图表中。虽然这可以节省页面上的宝贵空间,但它还是会有负面影响。比如这张2017年三月的图表,它是关于科学界的论文发表是如何由男性主导的。所有数据点都同样有趣且与主旨紧密相关。但是,一下子提供如此多的数据(四个研究领域类别以及发表人的比例)这些信息很难一起被接受。

经过深思熟虑之后,我决定不重新设计这个图表。如果我要保留所有数据,那么图表就会变得过于复杂而不简洁。在这种情况下,削减一些内容会更好。或者,我们可以展示某种平均化的衡量标准,例如所有领域的女性发表作品的平均比例。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7091

    浏览量

    89256
  • 可视化
    +关注

    关注

    1

    文章

    1198

    浏览量

    20984
  • 图表
    +关注

    关注

    0

    文章

    29

    浏览量

    8872

原文标题:《经济学人》数据可视化编辑:错误的图表,我们也画了很多

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    可视化MES系统软件

    单品在生产线上的装配制造过程,设计交互界面,使企业实现车间生产数据在各方面应用的可视化管理,为企业节约成本、创造更多的价值。2、MES系统软件架构针对MES系统软件在制造业车间的应用情况及反应出
    发表于 11-30 19:55

    python数据可视化的方法和代码

    Python数据可视化汇总
    发表于 10-14 14:59

    Python数据可视化

    Python数据可视化:网易云音乐歌单
    发表于 07-19 08:30

    请问怎么把BI数据可视化报表发给领导看?

    在BI工具上除两下搞定数据可视化报表后,怎么把做好的报表发给领导看?领导是否能够从手机或平板上快速打开数据可视化报表,并展开自助式
    发表于 09-01 17:26

    可视化的应用和优势

    的整体态势。  比如设备在偏僻区域(海下、深山、沙漠、分布全国各地等),可以实现无人检测,无需消耗人力物力进行检测,通过数据的分析可以直观的探测出设备状态和产能。  设备运行可视化:根据图像
    发表于 12-02 11:52

    大屏可视化报表也能自助分析了

    不管是在什么样规格的大屏设备上展示的大屏可视化分析报表,都能做自助式分析。也就是任意浏览者都能随时点击切换字段与维度组合,从而切换到任意角度进行数据可视化分析。大屏可视化报表:自带多维
    发表于 02-06 10:36

    数据可视化在电力行业的应用前景如何?

    现阶段,电力行业通过可视化,能使变电站的整体结构、设备分布立体,同时提供空中、漫游、自动巡逻等多种演示方式,满足多种展示要求,真实地展现环境形象。通过扩大变电站管理规模、管理工具多样
    发表于 07-06 07:44

    常见的几种可视化介绍

    说说常见的几种可视化一、信息可视化信息可视化就是对抽象数据进行直观视觉呈现的研究,抽象数据既包含数值数据
    发表于 07-12 07:49

    基于OneNET View 3.0的可视化数据监测系统的设计资料分享

    姿态定位制作说明功能说明将维特WT901C姿态传感器数据通过合宙Air724UG-4G模块将数据传输到onenet云平台,并建立onenetview可视化界面成果展示可视化成果注:由于
    发表于 01-20 06:28

    经验分享|BI数据可视化报表布局——容器

    容器功能是一种用于数据可视化图表排版的功能,主要作用对图表进行有效的布局调整,或者用于巧妙在同一地方安排多个不同类型的数据可视化图表,供使用者点击切换浏览。目前,在奥威BI软件上一同有
    发表于 03-15 17:10

    柔性动态可视化在医学图像可视化中应用

    针对数据智能表现的需要,提出了具有普适意义的基于二叉树结构的二层柔性动态可视化技术,并对柔性动态可视化技术概念、内涵、关键技术、解决柔性动态可视化关键技术方案做了深入研究。本文主要研究
    发表于 01-05 15:42 0次下载

    数据可视化到底有什么用?

    数据可视化到底有什么用呢?数据可视化是当下火热的大数据应用技术,很多新锐地大数据分析工具都注重开
    的头像 发表于 02-05 14:03 2.6w次阅读

    数据可视化的常用技术和并行与原位可视化方法分析

    数据可视化就是将抽象的“数据”以可见的形式表现出来,帮助人理解数据。大数据可视化相对传统的
    的头像 发表于 04-17 16:51 6456次阅读

    数据资源可视化是什么?有什么好处?

    数据资源可视化理解起来很简单,只需要将其拆分为数据资源”和“可视化”两个词,就很容易明白,数据
    的头像 发表于 09-09 16:44 2440次阅读

    智慧能源可视化监管平台——助力可视化能源数据管理

    博达可视化大屏设计平台在智慧能源领域的价值体现在实时监控、数据可视化、决策支持和效率提升等方面。借助该平台,企业可以轻松搭建智慧能源可视化
    的头像 发表于 11-29 10:00 385次阅读
    智慧能源<b class='flag-5'>可视化</b>监管平台——助力<b class='flag-5'>可视化</b>能源<b class='flag-5'>数据</b>管理