收入,Revenue_USD,Revenue_new,rev2,customer_revenue。这些你认识吗?它们可能是您可能在 BI 或分析工具中找到的列名称。使用哪个?
您选择 Revenue_new(毕竟它是新的!)并继续您的分析。与销售团队开会几分钟后,该团队大吃一惊:数据与他们的预期不符。
出了点问题。
你在用什么数据?!新收入?哦,Revenue_new 是旧列。上个季度,当我们聘请了一位新的财务副总裁并更新了定义时,公司转移到了 customer_revenue。
大约在 2010 年,公司只有一名全职分析师从事数据工作,他的笔记本电脑实际上是公司的数据仓库。查询通常直接针对生产数据库运行,昂贵的查询偶尔会导致严重事件并导致 Airbnb.com 瘫痪。
随着公司的发展,问题越来越严重:
几年前,当我们的 CEO Brian 会问一些简单的问题,比如上周哪个城市的预订量最多时,Data Science and Finance 有时会使用稍微不同的表格、指标定义和业务逻辑来提供不同的答案。
于是 Airbnb 构建了一个内部产品Minerva 来解决这些问题。 Minerva 在 Airbnb 内部无处不在——它管理 200 个数据生产者的 12,000 多个指标和 4,000 个维度。
MetricFlow是一个开源的 Minerva。
使用 MetricFlow,用户可以搜索指标,找到即将离任的财务副总裁批准的指标,在新的 VPF 更新时收到通知,查看计算,并确定指标的所有者。
MetricFlow 和 Minerva 对 BI 很有用,但它们做得更多。团队可以将它们作为一个平台进行构建。
想象一下,客户成功团队要求在他们的 CRM 中提供收入图表:这就像通过 API 调用从 MetricsFlow 中抽取数据一样简单。该软件是面向未来的。如果定义发生变化,图表也会发生变化。更新通过组织级联。
这是一个更详细的演示。
自推出以来的两周内,MetricFlow 已增长到 400 多个 Github 明星,现在是该标准下最受欢迎的指标框架。
如果您对指标存储以及它们如何融入现代数据堆栈和数据网格感到好奇,您可能有兴趣参加下周的第一届指标存储峰会,届时来自 Spotify、Airbnb、Mode 和 Hex 的人们将讨论它们。
这篇文章的标题是对柯勒律治的《古代水手霜》中文字的演绎。糟糕的指标就像盐水。对水手或分析师没有多大用处。