研究概要随着地球上每个人上网的时间越来越多,数据量呈爆炸式增长。每次点击和滑动都是一个新的数据点。平均每个人每天上网时间接近6.5 小时,每天会产生15.9 TB的数据。但商业数据量却让这一点相形见绌。 41%的组织在任何给定时间管理着 500 PB 的数据;是普通人的近30,000倍。 2006 年,英国数学家 Clive Humby 创造了“数据就是新石油”这句话。自那时以来,全球数据量增长了500 倍以上!但如果数据是新石油,那么管道在哪里?尽管您可能认为世界在数据收集和传输方面已经非常高效,但您会感到惊讶。 提取、转换和加载 (ETL) 是一种“将多个来源的数据组合到大型中央存储库中”的方法。虽然有大型的成熟ETL 平台,但有些人会开玩笑说 Microsoft Excel 是世界上最常见的 ETL 工具。 人们可以使用 Excel 来操作逗号分隔值 (CSV)文件;一种文本文件格式,使用“逗号分隔值,使用换行符分隔记录”。大多数人认为 CSV 是他们不小心用来下载银行对账单或生日联系人的更糟糕的电子表格。 但实际上,大多数财富 500 强公司每年都使用数亿个电子表格来来回发送数据。如今,这是新石油管道方面的最前沿。毫不奇怪,它们非常脆弱。 OneSchema正在尝试构建更好的管道。无论公司时不时地处理 CSV,还是始终将其作为其业务的一部分,OneSchema 都围绕每个用例构建了可嵌入的功能。 OneSchema 正在解决的最大问题是任何给定数据中的大量边缘案例。无论是日期、数字、地址、电话号码等等。对于任何特定的数据点,都有 20 多种存储方法。 OneSchema 相信通用数据规范化引擎有一席之地。捕获数百万个电子表格中的边缘情况,并找到统一的语言来干净地管理整个集合。从那时起,人工智能非常适合介入并优化大型企业花费数千万美元和数千个工作时间来管理的手动流程。这就是梦想。 要了解有关 OneSchema 以及该公司如何为新石油建造管道的更多信息,请查看我们关于该公司的新备忘录。 Secureframe 是一个平台,可自动执行从 SOC 2 到 ISO 27001、HIPAA 和 PCI DSS 等框架的合规流程。要了解更多信息,请在此处阅读我们的完整备忘录并查看下面的一些空缺职位:
Maven Clinic 是一家虚拟健康诊所,提供生育、怀孕、育儿、儿科、心理健康和更年期的持续护理。要了解更多信息,请在此处阅读我们的完整备忘录并查看下面的一些空缺职位:
ElevenLabs 提供人工智能驱动的语音生成平台,可解决质量、信任和可靠性等关键行业痛点。要了解更多信息,请在此处阅读我们的完整备忘录并查看以下一些空缺职位: LangChain 是一个开源编排框架,用于使用法学硕士开发人工智能应用程序。要了解更多信息,请在此处阅读我们的完整备忘录并查看以下一些空缺职位: 查看本周的一些杰出角色。
在 Contrary Research,我们建立了了解私营科技公司的最佳起点。我们无法独自完成这件事,我们也不想这样做。我们专注于汇集各种不同的观点。 这就是我们的研究奖学金开放申请的原因。过去,我们曾与软件工程师、 产品经理、 投资者等合作。如果您有兴趣研究和撰写有关科技公司的文章, 请在此处申请! 每周都想要这些吗?
© 2025逆向研究 |
相反的研究纲要 #121
世界在电子表格上运行:OneSchema 如何为“新石油”建设管道,以及 ElevenLabs、LangChain 等的新备忘录
͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏ ͏