上周,我试图找到一些大学毕业照。尽管只有十五年前,但事实证明它们令人惊讶地难以捉摸——被困在一个已失效的 Photobucket 帐户中,被损坏的硬盘驱动器丢失,并分散在不再存在的社交媒体平台上。这让我想到了一个悖论:我们生成的数据比以往任何时候都多,但我们留下的持久记录可能比历史上任何文明都要少。
数据洪流
我们正被数据淹没。人类每天产生约 2.5 万亿字节的信息。每分钟:
- 500 小时的视频上传至 YouTube
- 发布了 347,222 个 Instagram 故事
- 发送了 500,000 条推文
- 拍摄了无数的数码照片、交换了信息并创建了文档
无论以何种标准衡量,我们都是有史以来记录最多的文明。未来的历史学家应该有一个前所未有的窗口来了解我们的日常生活、思想和经历。
正确的?
数字铁锈地带
还记得地质城市吗?雅虎于 2009 年关闭了它,带走了数以百万计的早期网站——这是早期互联网文化的独特快照。互联网档案馆设法保存了一些页面,但大多数都永远消失了。 MySpace 在服务器迁移期间丢失了 12 年的音乐上传。 Google+ 消失了,社区和对话也随之消失。藤?走了。原来的推特?变得面目全非。
但平台死亡只是冰山一角。考虑格式过时:尝试打开 1995 年的 WordPerfect 文件,或从软盘运行软件。即使您拥有数据,您也可能无法访问它。
模拟优势
我们仍然可以阅读 5000 年前雕刻的埃及象形文字。我们可以研究中世纪的手稿、文艺复兴时期的绘画和维多利亚时代的照片。事实证明,这些模拟格式非常耐用。
相比之下,数字存储却出奇地脆弱:
- 硬盘驱动器出现故障
- 位腐烂会破坏数据
- 文件格式已过时
- 加密密钥丢失
- 云服务关闭
- 链接衰减
- 软件变得不兼容
网页的平均寿命只有 100 天。一块泥板可以保存数千年。
保存问题
“但是肯定有人保存着这一切吧?”
是和不是。
互联网档案馆做了英勇的工作,但他们只能拯救网络的一小部分,而且他们是在持续的、绝望的、紧握的法律威胁下做到这一点的。图书馆和档案馆正在努力保存数字资料。即使科技巨头也会丢失数据 – 只需要求任何信任 Google 的人永远保留其 Google+ 帖子即可。
核心问题是数字保存需要持续的主动维护。仅仅存储这些位是不够的 – 您需要:
- 定期将数据传输到新的存储介质
- 维护可以读取旧格式的软件
- 保持系统运行和兼容
- 支付持续的存储和维护费用
- 保留上下文和元数据
这是昂贵且劳动密集型的。相比之下,书架上的书只需要保持干燥并且(最好)远离火源即可。
社交角度
这还有一个社会层面。前几代人写信、记日记和打印照片。这些实物文物通常保存在阁楼和档案室中。今天,我们发送短暂的消息并将照片存储在云中。当我们去世时,我们的数字存在通常会随着我们一起消失——被密码锁定或因过时的服务而丢失。
这对普通人来说打击最为严重。国会图书馆可能会保留巴拉克·奥巴马 (Barack Obama) 的推文,但你祖母关于家族历史的 Facebook 帖子又如何呢?这些可能会随着她的帐户一起消失。
这不是为了保存猫视频。未来研究我们这个时代的历史学家将面临独特的挑战。如果我们的大部分通讯、文化文物和日常记录都消失了,他们将如何理解我们的社会?
一些潜在的解决方案:
- 更好的数字保存策略(但谁付钱? )
- 更强大的归档系统(但谁维护它们? )
- 返回一些模拟录音(但这现实吗? )
- 数据保存的法律要求(但如何执行以及由谁执行? )
没有一个是完美的,都需要我们尚未承诺的资源和协调。而目前看来,似乎不太可能。
也许我们需要一种混合方法。关键记录可以数字和模拟格式保存。个人归档可能会成为一项被强调的技能,就像数字素养一样。我们可能需要专门致力于长期数字保存的新机构。
但首先,我们需要认识到问题确实存在。数字时代承诺让一切变得触手可及,但却让一切变得短暂。除非我们采取行动,否则我们将面临进入意想不到的黑暗时代的风险——不是因为缺乏记录,而是因为缺乏可读的记录。
原文: https://www.joanwestenberg.com/why-the-internet-era-might-be-historys-least-documented-period/