许多数据可视化和设计相关的问题都是依赖于上下文的。例如,如果有人问一种图表类型是否比另一种图表类型更好或更差,答案是“这取决于情况”。观众是谁?数据是什么?分享的怎么样了?不可能在每种情况下都说一种方式或另一种方式。我们都渴望简单的二元解决方案,但不幸的是,现实生活就是这样混乱。
在一次客户研讨会上,有人问我是否喜欢误差线以及他们是否应该在演示中使用它们。当我准备好标准的“视情况而定”回答时,我意识到这一次,它并不取决于。我想不出误差线何时会成为数据通信的理想解决方案。 (为了清楚起见,如果他们问是否应该阐明数据的误差幅度,我的答案肯定是视情况而定。我只是不会使用误差线来这样做。)
在讨论为什么我不喜欢误差线和替代解决方案之前,让我们先探讨一下它们是什么。
什么是误差线?
误差线的目的是传达图表中数据的精度。它们最常用于技术通信,是从数据点延伸出来的线,表示相关的统计测量值,例如标准差或置信区间。误差线可以添加到任何定量图表中:点、条、线和散点图等。在所有情况下,它们通常默认显示为末端带有平头的黑线。
让我们考虑一个使用误差线的客户端示例。 (我修改了详细信息以保护机密性。)该客户在其研究中捕获了患者的各种健康指标。下面的示例显示了特定队列的平均白细胞计数 (WBC)。蓝线描绘了一段时间内的平均 WBC,黑色加盖线是误差线,代表队列中所有 33 名患者记录的 WBC 值的范围。
可视化误差范围的另一种方法
在设计用于通信目的的图表时,您应该致力于使其处理简单且直观。这涉及消除分散注意力的元素。误差线,无论您如何格式化它们,都是引人注目的。
我忍不住把注意力集中在 WBC 折线图中的误差线上。有很多线与平均趋势相交。一种选择可能是修改添加的线条,这样它们就不会与图表上的主要系列竞争注意力。我可以将它们设为灰色,这样它们与白色背景的对比度就较小。我也可以取下两端的盖子。
这是一项改进,但从设计角度来看是有限的。一张小图表仍然有 40 多条线剖析,当我试图解读趋势时,我感到眼睛疲劳。我们可以将它们组合成蓝色数据系列周围的单个区域或阴影区域,而不是显示这么多单独的灰线。
请注意这感觉是多么简单。我们仍然可以看到平均值周围的方差,但主要焦点是 WBC 线。如果我想标记一些值或添加参考线,我现在可以这样做,而不会压垮图表。
几乎在所有情况下,当传达数据的不确定性时,我都会选择多个误差条上的误差区域。它看起来更干净,处理更少,并且对于不熟悉的观众来说感觉更直观。这种方法也适用于其他图表。让我们考虑一些分类数据。
用分类数据可视化不确定性
一家组织进行了一项调查以确定员工的幸福感。每个问题都是可选的。并非所有员工都被选中参与调查,每个问题的答复数量也有所不同。为了准确总结结果,该公司使用带有误差线的条形图来表示每个问题的不确定性。 (同样,这是一个真实的例子,为了保密我只是匿名了。)
虽然误差条并不像前面的示例那样分散注意力,但它们仍然会将注意力从误差条的末端转移开。此外,覆盖彩色条的部分由于对比度太小而难以阅读。
让我们修改图表以使用阴影区域方法。首先,我们需要使用另一个图表,该图表在数据值的左侧和右侧都有空间。我将从水平条形图切换到点图。
现在有了空白空间,我可以在每个点后面的阴影区域中添加不确定性。
注意这看起来有多干净。您的注意力集中在每个属性的大点上,但您还有其他详细信息可以帮助您更准确地解释调查结果。部门 A 的幸福水平与属性 1 和 5 的整体组织没有差异。这通过重叠的错误区域显示出来。
这个例子强调了有效传达数据不确定性的挑战,同时确保关键要点得到体现。误差线可能很熟悉、易于添加或在某些场景中常用,但它们通常会增加混乱并使了解底层故事变得更加困难。相反,使用阴影区域或替代可视化可以使信息更清晰、更直观。