Simon Willison 就人们使用的工具提出了一个直截了当的问题:
如果有人给您一个包含 100,000 行的 CSV 文件,您使用什么工具开始探索和理解该数据?
然后他扩展了这个问题,询问人们用什么来处理 100 万行、1000 万行和 10 亿行的文件。
浏览数以千计的回复,您很快就会发现 (1) 有很多选项可以探索数据集,并且 (2) 很多人认为他们使用的是最佳选项。有点击播放程序、基于网络的产品、编程语言和命令行选项。有些人在给定时间对某个数据集使用对他们有用的任何东西的组合。
这就是为什么当人们问我“最好的”工具是什么时,我通常必须跟进他们已经知道的内容以及他们想用该工具做什么。这也是为什么最好的数据探索列表通常不值得您花时间,除非您考虑到有关使用的假设。
原文: https://flowingdata.com/2022/10/03/wide-range-of-data-exploration-tools/