数据是我们听过很多次的新石油。但是,我们能否以适当的格式可视化这些数据?由于我们目前掌握的数据量,从中获取见解比以往任何时候都更加重要。每天创建数百个可视化。有些受到观众的好评,而另一些人则被拒绝。为什么会这样?嗯,答案在于创造。让我们找出原因和问题,看看如何解决它们。

在这里,我将总结一些最好的和最差的图表版本,所以你可以停止这一点,如果你这样做。

以 0 基线开始的图表

我在绘制图表时发现的最常见的错误之一是没有从 0 基线开始图表,并且使用一些随机值。

image-20211025153359998

使用正确的绘图条形图

image-20211025153433839

我们在数据可视化中常用水平或垂直条形图。有时,当我们使用简单的条形图进行比较时,它确实传达了信息,但以水平方式以垂直或堆叠条形图表堆叠条形图表更好。让我们以示。

示例 1:

我们有女性和男性的月度销售数据。两个图表都显示了每个象限的性别比率的比较。我们可以使用下面的图表进行比较。

image-20211025153443989

切勿在图表的同一侧绘制正负值,也不要绘制图表同一侧的比较特征,因此很难读取图表。

图表上的多种颜色

在图表中应出于某种原因使用多种颜色。在图表中荒谬地使用颜色是看到图表时真正的关闭。图表中大多只使用 2 种颜色。

image-20211025153451725

如果你有超过2个图表,那么分离图表将是一个好主意的颜色。让我们看看我们如何做到这一点。

image-20211025153505169

正如我们在这里看到的,每个列都有它自己的目的,所以给相同的颜色看起来并不有趣,这就是为什么在这里我给相同的颜色,只有图表代表相同的目的。

强调数据

有时强调数据也会使图表看起来不错。乍一看,我们会发现我们使用的所有其他功能中的C更高

在这里,我们只有 4 个功能,因此图表中的这个小变化不会那么有效,但是当我们使用 100 个功能时,突出显示该功能的最高值将对我们帮助很大。拥有 100 个功能并绘制它们是一项艰巨的任务,但此时我们可以通过一个条件,假设前 10 个功能将突出显示为灰色,而其他功能将具有粉红色。

image-20211025153516006

令人困惑的颜色选择

字体、颜色、轴所有这些功能在绘制图表时都具有重要性。选择图表的颜色是一个非常关键的步骤,因为如果你的图表上有非常明亮或非常浅的颜色,那么将变得难以阅读图表。

在示例中,我们有 2 个不同的图表,显示该地区最高到最低的销售额,在颜色上有所区别。如果我们看到图表的左边不同的黄色阴影是肉眼看不到的。在右侧,我们有蓝色和粉红色的颜色比例,在那里我们可以很容易地区分色调。

image-20211025153526137

避免图表上的随机性

始终根据其值按升序或降序排列条形。将水平条形图的最大值放在顶部,将最大值放在左侧的垂直条形图上。这将有助于受众从图表中定位最高和最低值。

image-20211025153535773

讲故事或至少回答问题

大多数入门数据可视化器只制作单个图表,如直方图或条形图。有时结合 2 个图表也有帮助。让我们看看它是如何做到的。

你可以找到卡格尔笔记本上的数据。因此,在这里,我制作了产品、商店和集群平均销售额分析图表。你可以制作不同的图表,如馅饼和酒吧,但我已经把它们合二为一,以概述分析。在这里,我们可以清楚地知道,A店的销售额最高,经常购买的产品是杂货和饮料。

image-20211025153552603

根据需要添加上下文

如果您认为添加附加文本有助于读者更好地了解图表,则仅添加文本。让我们用真实的例子看看。你可以在卡格尔找到这张图表

图表告诉我们哪些电视节目或电影在 Netflix 上的收视率最高。在这里, 我添加了一些文本, 如 97% 的观众喜欢电影, 而不是电视节目。因此,当观众阅读图表时,他们会知道观众更喜欢电影而不是电视节目,他们可以比较节目之间的评分。

image-20211025153602776

突出一些功能,如更改具有最高值的条形颜色。在这里, 当我们谈论 Netflix, 所以我选择了红色和黑色的图表, 而不是简单的白色。

与饼图配合工作

我见过很多人用错误的方式使用饼图。

在处理饼图时要记住的点

  • 饼图中永远不会超过 5 个值
  • 始终给出一个合适的标签,无论您如何出色地表示图表都无关紧要。直接在图表上标记是超级有用的,因为观众不必寻找传说。找到传说需要时间,我们不希望观众为此浪费时间。

在示例中,我们看到在 Netflix 上观看的节目的比例。我们可以清楚地看到,电影在这里更受欢迎。

image-20211025153612238

选择颜色托盘

颜色是有效数据可视化不可或缺的一部分,在设计时考虑这 3 种调色板类型:

对于分类数据,定性调色板最适合显示。分配的颜色应易于区分,以确保可访问性。

对于数字数据,顺序调色板最适合显示。因为数字数据需要按特定顺序放置(上升、下降)。

不同的调色板是 2 个连续调色板的组合,中间的中心值通常为零。

下图是从 Plotly 中获取颜色参考的。

image-20211025153621937

结束笔记

我们看到图表中的一些常见错误,以及如何用一些例子来克服它们。如果您有任何疑问,您可以通过任何这些媒体联系我。

数据可视化是一种艺术形式,需要随着时间的推移加以掌握。这些数据可视化提示和技术虽然不全面,但肯定会帮助您走上正确的轨道。始终记住我们制作图表或视觉效果,而不是为了我们的理解,我们制作这些图表,以便观众可以理解而无需进入技术内容。了解受众的视角是创建成功和有效的视觉效果的关键。

无论您使用哪种工具创建优雅和礼貌的图表,我们传递视觉效果背后的本质非常重要。