我是六色订阅者,喜欢绘制数据图片,Jason Snell 好心地问我是否想破解并根据 2024 年成绩单绘制一些额外的图表。
杰森根据他的成绩单数据得出的数字已经非常好,因此没有必要仅仅为了它而重新制作它们。相反,我将展示一些其他视图,试图揭示数据中的一些结构。
我们可能对什么样的结构感兴趣?我们可以考虑三个广泛的领域:答案的排序和分布;不回答问题的模式;以及问题和受访者答案的关系结构。让我们依次看看每一项。
订购和配送
Jason 展示了每个问题的平均分数,对问题进行排序,从 Mac 和 iPhone 开始,一直到开发者关系和世界影响。当像这样按类别呈现平均值时,按平均值对类别进行排序通常很有用。我们还可以在绘制分数之前通过缩放和居中分数来快速了解事物的比较情况。我们一起计算所有问题的总平均值,并从每个受访者的答案中减去该数字。然后我们计算中心分数的标准差,并将每个分数除以该数字。现在我们计算每个问题的平均分数,并从最高到最低绘制它。现在可以看到每个问题的平均值与总体平均值的差距有多大(以标准差表示)。
Mac 和硬件类别的表现明显好于平均水平; Vision Pro 和开发者的关系严重恶化。如果我们不去中心化和缩放数据,而只是绘制平均值并对它们进行排序,我们会看到大致相同的模式。
缩放、居中和计算均值必然会总结数据。不过,报告卡调查规模足够小,我们应该能够很好地了解整个数据集。在答案方面,我们可以绘制每个问题答案分布的条形图,并将其组织成多面图或“小多重”图。这是直接查看答案总体分布的有效方法。
我们还将各个方面从最高平均得分(左上)到最低平均得分(右下)进行排序。这让我们看到,与高分类别相比,低分类别在受访者中的共识往往较少。虽然硬件可靠性几乎一致获得 4 分和 5 分,但开发者关系部门却并非一致获得 2 分和 1 分。相反,答案更加分散。
不回应的模式
当思考为什么不同的问题可能会显示不同的评分模式时,我们自然会问类别或主题的哪些内容会产生不同的答案模式。最基本的原因很容易被忽视。受访者无需回答所有问题。有些人可能会选择不回答问题,因为他们没有意见,或者因为这个话题与他们无关。因此,即使在这样的小型调查中,我们实际上也可以有不同的受访者子群体。让我们看看哪些问题最有可能得不到答案。
每个人对硬件、操作系统质量和 iPhone 都有自己的看法。但五分之一的受访者对 Vision Pro 没有意见。几乎同样数量的人跳过了电视、家庭和社会影响问题。 59 名受访者中有 22 名对开发者关系没有看法。
关系模式
像这样的调查是一个由行和列组成的表格。行是受访者,列是问题。每个单元格都是特定受访者针对特定问题的分数(可能会丢失)。我们可以利用此类数据做大量令人惊讶的事情。在这种情况下,我们可以以系统的方式对行和列进行洗牌,直到受访者和问题与我们合理地使它们相似为止。以这种方式对数据进行聚类的方法有很多很多。对于这种规模的数据,我最喜欢的方法之一是制作响应的“Bertin 图”。此类绘图以法国地理学家Jacques Bertin 的名字命名,于 20 世纪 60 年代开发,涉及对行和列进行排列或“序列化”。贝尔廷的团队最初使用类似乐高积木的矩阵手工完成此操作,这些积木可以在行和列中串起来。
有一个 20 世纪 70 年代初的非常有趣且非常法国的视频激发并演示了这种方法。因为我们现在的计算机上有互联网,所以我们可以选择一种排列表的方法并直接应用它。虽然速度快得多,但遗憾的是不再涉及任何串烧。以下是将该方法应用于报告卡数据时得到的结果。
这种表示的好处在于,通过仅填写“好”分数(4 和 5),但仍然显示“差”分数(3 及更低),我们可以很好地了解问题和组的情况的受访者聚在一起。这也包括不回应的模式。当然,事物并不会完美地聚集在一起。这是一种有助于解释的启发式方法,而不是自然法则。但这仍然是一种非常有用的方法,可以让您一目了然地立即了解整个数据集。
原文: https://sixcolors.com/post/2025/02/a-second-look-at-the-2024-report-card/