上周我们谈到了实验对于走向未来的重要性,但你怎么知道要进行哪些实验呢?这篇文章就是关于这个问题的。
I. 是什么驱使你做任何事情
做任何事都是一种信仰的行为。选择一个你相信的未来状态。
但是我们如何选择做什么呢?
在老电影《罗宾逊夫人》中,达斯汀霍夫曼被告知要研究塑料。这对 1963 年来说是一个很好的建议。从那时起,塑料行业继续快速增长,到 2000 年代它实际上已经在世界范围内饱和,增长逐渐回落到全球 GDP 水平。这是一项非凡的成就。
然而,这些建议是否足够好?如果他去了半导体怎么办?还是去了 IBM,在 System 360 上工作,然后转到 Microsoft?
他本可以走很多路,即使假设他在塑料方面没有任何隐藏的天赋。
所以想象你是他。你会如何做出这个决定?你会选择塑料吗?油?半导体?电子产品?银行业?你应该如何做出这个决定?
就像解决大多数问题一样,自然界优雅地解决了这个问题。如果你是一只蜜蜂,并试图弄清楚去哪里采蜜,你就会做出数学上接近完美的选择。蜜蜂一旦找到一朵花,就会根据花蜜的多少来利用它。它回到蜂巢并跳摇摆舞,通过持续时间、角度、来自太阳的方向等告诉其他蜜蜂它发现了什么。如果数量很多,蜂巢就会跳进去,成群结队地扑向花朵。随着花蜜的减少,其他蜜蜂看到了摇摆舞,并开始到别处探索。他们在发现大宝藏时就开始开采,在其他时间进行探索。
做好这一点是困难的,是探索-利用的困境。我们被教导要利用在学校或大学的时间去探索,至少探索一点,并利用几乎所有其他可用时间来探索。这种困境是决策科学中最基本的问题之一,很难用简单的答案来解决。与蜜蜂不同,答案并不简单或直接。奖励无法用盎司的花蜜来衡量。而且这些困难并不简单到可以用摇摆舞来解决。
或者,假设您正在寻求创办一家公司。你去告诉你的朋友,作为好朋友,他们说,“你知道风险投资公司的成功率大约是 0.5% 吗?”
这是事实,但也无济于事。这 0.5% 会根据你的背景、知识、你追求的想法、你周围的团队等等而大幅波动。
在这种情况下,有人问我职业想法,我问他们喜欢做什么。我一生中有过一百次这样的谈话。结果通常是略微茫然的凝视,然后是一些通常是派生的或通用的东西。
因为当有人问你喜欢什么时,这个答案通常不容易回答。对于大多数工作领域,您都非常不习惯听到这个问题,以至于很难理解这个问题的重要性。对你甚至可以振振有词地得到答案的期望阻碍了你的发展。
要回答这些问题,您必须知道如何平衡对可能性的探索与对具体事物的利用。
我们拥有的最好的工具就是我们的好奇心。感觉我们已经完全失去了作为我们搜索核心的好奇心的位置。
二。好奇心从何而来
很长一段时间以来,我们一直被好奇心所困扰。对好奇心进行了理性分析,提出好奇心是由希望最大限度地提高在未来做出适当反应的能力所驱动的。他们谈论的主要理论似乎将好奇心视为 a) 寻求新奇,b) 信息差距,以及 c) 学习进步。
它并不是特别引人注目,因为它确实试图在 n 刺激优化问题中推导出代理的最佳解决方案,并且依赖于代理完美地预测她的知识会根据刺激发生的变化。
还有一个事实是,在进化的引导下,我们确实有好奇心。毕竟,婴儿是通过编造自己的活动来学习的,并且非常好奇。在某种程度上,早年为人父母的一半时间都花在确保他们的好奇心不会杀死他们。不过,这项研究很有趣,它使用了机器人学习者,他们探索了学习进步会产生内在奖励的假设。
还有更有趣的学术工作,在计算机科学领域完成。在这里, 对好奇心作用的分析通常与奖励应该是外在的还是内在的想法有关。外在奖励,就像现实世界中的金钱一样,在现实世界中通常被视为一种强大的激励因素。它是。然而,它并不普遍。在计算机视觉领域对此进行的一项检查中,我们看到:
在许多现实世界的场景中,代理人的外部奖励非常稀少,或者根本不存在。在这种情况下,好奇心可以作为一种内在的奖励信号,使代理能够探索其环境并学习可能在以后的生活中有用的技能。 ……我们的公式可以扩展到像图像这样的高维连续状态空间,绕过直接预测像素的困难,而且至关重要的是,它忽略了不能影响代理的环境方面。
这个想法当然是这项研究在 VizDoom 和超级马里奥中运作良好,因此应该适用于现实生活。
一篇竞争性论文确实表明,在他们创建的使用强化学习验证假设的世界中,这本身是不够的。
即使在创造世界时,好奇心也可以作为一种内在的奖励信号。代理开始探索其环境并学习技能,这可能在以后的生活中有用。
据推测, 拥抱好奇心也可以消除探索-利用困境。
通过理论和模拟,我们证明基于此的探索-利用问题可以通过产生最佳解决方案的简单规则来解决:当信息比奖励更有价值时,保持好奇,否则寻求奖励。我们表明该规则在自然约束下表现良好且稳健。
我们应该开始将其应用于 AI 范例。
三、令人困惑的世界观
让我们退后一步。假设您是一名投资者,即将起步。你想弄清楚你的方法。所以你开始阅读传记、视频和教科书。
事实证明,这些课程无处不在。
让你的跑步者跑步,或者平衡你的投资并重新平衡你的投资组合。关注便宜的股票,价值股,除非你应该关注动量和成长股。对于你所在的公司,你应该扩展到其他相邻的产品线,除非你应该专注于你的核心竞争力。你应该专注于你特定的竞争优势和专业化,除非你应该垂直整合来控制你的供应链。
答案似乎是,你应该做你需要做的事才能赢。随着世界的复杂性,你需要做的事情是多变的。
几周前我问过为什么没有商业哲学。我收到了相当多的回应,谈到了现有的少数经济学流派,主要是科斯的组织形成理论和关于激励的论文,关于人们如何在公司内部工作的人类学,甚至令人高兴的是一些与生态学的相似之处,比如增长粘菌和对商业利基的影响等。
所有这些都非常有帮助,但都是描述性的,而答案似乎更简单。做生意的秘诀就是不断尝试直到成功。
当我们尝试并让我们的好奇心发挥作用时,我们会发现不可思议的事情。
-
Normal Joseph Woodland 是费城的一名研究生,暑假期间在一家杂货店工作。他们有一个问题,如何实际跟踪产品,一个主要问题。他开始尝试各种编码信息的方法。墨水,表演,电脉冲。最终,他认为一系列不同宽度的线条很适合被传感器扫描,并将其称为“靶心”。他为它申请了专利,但又花了三年时间进行修修补补,这就是最终成为“条形码”的原因。又过了十年它才流行起来,但是修补的冲动,追随他的好奇心,以及尝试解决这个问题的余地是在一家杂货店工作时开始的。
-
当一位年轻的工程师在从事大型公共项目时对共享文档感到沮丧时,他查看了周围的事物,并发现了一种称为超文本的较旧技术。因此,他花了一个夏天编写了一种语言来使用它,并编写了一个浏览器来浏览它,并创建了万维网。英国计算机科学家蒂姆·伯纳斯-李 (Tim Berners-Lee) 在欧洲核子研究中心 (CERN) 工作期间,最终创造了一些非同寻常的东西,因为他花了很多时间思考解决如何让科学家彼此共享文件的问题。
这就是好处。
四、下一步是什么
它已经改变了。 1991 年所做的工作表明,最近的书籍开始以负面的方式表现出好奇心。在儿童读物中!它来自一个低 n,阅读和评估 210 本书,但作为一个数据点,它感觉很有启发性。
对于我们似乎需要在生活中做出的许多重要决定,没有路线图。没有明确的成功之路。这就是需要 Taleb 所说的漫游者。学习兴趣技能的好奇心驱动的观察者,而不是狂热的优化者。
正如所说:“历史上大多数突破性发现和非凡发明,从打火石到自动驾驶汽车,都有一个共同点:它们都是好奇心的结果。寻求新信息和经验并探索的冲动新颖的可能性是人类的基本属性。”
但是,在一个该死的自我报告的证据中:
在我最近对 520 名首席学习官和首席人才发展官进行的一项调查中,我发现他们常常回避鼓励好奇心,因为他们认为如果允许人们探索自己的兴趣,公司将更难管理。
或者
研究发现,尽管人们将创造力列为目标,但当实际提出创意时,他们经常会拒绝。
那么,当事实证明我们系统地关注培养创造力产生了高度可预测的结果时,我们真的可以责怪这个世界吗?
同样,这不是普遍的,也不是丧钟。存在一些有用的纠正措施,散布在一些较小的初创公司和一些较大的组织中。但它是存在的,它是反常的,它是无孔不入的。
五、万物好奇论
还有另一个著名的问题,也是在赌场中设置的。想象一下,您走进一个满是老虎机的房间。你如何决定玩哪一个,因为你显然不知道下注的最佳机器?出色地。您尝试随意拉动杠杆,密切注意,看看哪些有效,哪些无效。这称为多臂老虎机问题。
当您处理老虎机时,它会起作用。一旦机器开始给出不规则的响应,当奖励不再容易计算,当机器本身的数量随时间变化时,它就会被击败。
可悲的是,对于机器和我们来说,我们的生活并没有那么容易受到限制。我们无法创建像秘书问题这样的简单解决方案来确定何时停止寻找新事物或选择我们所见过的最好的事物。
现实生活并没有简单的地形或易于理解的规则。您不知道自己是在玩老虎机、二十一点还是水下洞穴潜水。任何时候的选择都多得无法理解,你选择的各种路径可能会让你走不完。
我们必须帮助我们做出这个决定,几乎总是,是我们对什么是有趣的和你对什么感到好奇的内在感觉。这是缩小选择范围的关键。这就是您如何定义地形,然后开始探索和试验。
这部分是由于现代世界奖励差异化这一事实,正如 Packy 上周写得很好,而差异化来自于遵循至少对其他人来说不直观的东西,但你会被你内心的东西所引导。当我对别人说这句话时感觉如此不对劲的原因是它太像新时代的 woowoo 哲学了。它不是。这不是关于吃、祈祷、爱你通往幸福的方式,而是关于用你的好奇心作为探索的领头羊。
正如 John Fio 在与 Patrick 的对话中所说:
有价值的东西是你无法教授或复制的东西。
生活中的大多数事情都没有遵循的秘诀。它要求我们在不知道结果如何的情况下使用一些判断并做出决定。您在周围看到的几乎所有有趣事物的根源都源于有人放开了好奇心。
可怕的是,这也意味着我们引导一条独特道路的能力几乎完全取决于我们自己。大多数时候,我们陷入了探索-利用的困境。我们应该做一些明显最大化回报的事情,尤其是在短期内,还是应该尝试跳下悬崖并在下落的过程中建立我们的翅膀。
问问你最喜欢的强化学习算法,他们会告诉你它偶尔做随机动作的原因是为了更有效地搜索整个潜在空间。我们可以创建规则——只探索特定百分比的时间,或者预先大量探索然后停止,等等。
写到这里,是一种探索的行为。在一个有无限选择的世界里,怎么可能是别的!
原文: https://www.strangeloopcanon.com/p/the-curiosity-theory-of-everything