我的帖子Bing:“除非你先伤害我,否则我不会伤害你”真的很受欢迎。
它在 Hacker News 的顶部坐了一整天,目前是该网站有史以来第 18 位最受欢迎的帖子。
然后这发生了:
可能需要更多润色…… https://t.co/rGYCxoBVeA
– 埃隆·马斯克 (@elonmusk) 2023 年 2 月 15 日
鉴于最近对 Twitter 算法所做的更改,很多人都看到了这一点。 Twitter 目前报告该推文的浏览量为 3040 万次。
很多人问我其中有多少转化为页面浏览量。让我们开始吧!
头条人物
这是我过去几天对该帖子的 Plausible 仪表板:
总体数字:95.9 万独立访问者,110 万页面浏览量。
主要流量来源:
- 推特:721k
- 直接/无:132k(这包括来自 Mastodon 的流量)
- 黑客新闻:49.5k
- 脸书:13.4k
- Reddit:8.3k
- 谷歌:7.8k
- tldr 通讯:6k
- 领英:5.4k
如果我们假设绝大多数 Twitter 流量来自 Elon(这似乎是合理的),那么 30.4M / 721k = 大约 2.37% 的点击率。
值得注意的是,在 Hacker News 上停留一天的时间确实带来了巨大的流量——18% 的流量来自 Twitter 上第二大关注账户(看起来巴拉克奥巴马仍然是第一)。
通过 Plausible 和 Cloudflare 进行更详细的分析
我主要将Plausible用于我网站的分析。我真的很喜欢它们:它们以隐私为中心,开源(尽管我使用它们的托管版本)并准确地向我展示我想看到的数据子集。最重要的是,他们不设置 cookie。
我的站点也在Cloudflare后面运行,它也提供分析。我不为升级后的分析付费,但事实证明你仍然可以从中获得一些非常详细的数字——特别是如果你愿意在浏览器 DevTools 中挖掘。
Plausible 提供了一个“导出”按钮,所以我使用了它……并得到了一个包含一堆 CSV 的 zip 文件。 它们位于GitHub 存储库中。
Cloudflare – 至少对于免费层 – 没有详细的导出。但是……在幕后,Cloudflare Web 应用程序使用他们的 GraphQL API来检索统计数据以进行显示,并且通过一些挖掘你可以通过这种方式获得数字。
我使用 Cloudflare API 提取了这个 3.2MB 的 JSON 文件。
将其加载到数据集中
我编写了这个脚本来将我提取的数据加载到 SQLite 数据库文件中,然后使用Datasette将它们部署到 Vercel。
您可以在这里探索结果: https://i-will-not-harm-you-unless-you-harm-me-first.vercel.app/
以下是根据 Plausible 在相关时间段内的页面浏览量:
在我看来,该数据的时区是太平洋时间。
此页面显示根据 Cloudflare 按小时计算的页面浏览量。
此数据采用 UTC,UTC 晚上 7 点对应太平洋时间上午 11 点。
这些数字应该不同,因为 Plausible 使用 JavaScript 来跟踪分析,而 Cloudflare 在服务器端,而且 Plausible 被过滤为仅点击特定页面,而 Cloudflare 显示我网站上任何页面的所有点击。
在 Datasette 中有很多方法可以对数据进行切片和切块:
- 根据 Plausible,随着时间的推移,唯一身份访问者
- 根据 Cloudflare,随时间推移的独特性
- 来自 Plausible 的这些流量来源的完整数据
- 根据 Cloudflare 使用自定义 SQL 查询,随着时间的推移缓存请求的百分比——在 Elon 发推文之前大约是 40%,然后跃升至 90% 以上并保持在那里,谢天谢地!
长期以来,我一直热衷于使用全页 HTTP 缓存来防止意外流量事件——这是我过去使用 Varnish 和 Fastly 实现的一种模式,多年来我一直通过 Cloudflare 在我的博客上使用它.
这次绝对有收获!
原文: http://simonwillison.net/2023/Feb/17/analytics/#atom-everything