医学理论?
正如今天的实践,医学几乎总是与细节有关:“出了问题;出了问题;”这就是解决方法”。但是否也有可能以一种更普遍、更抽象的方式来谈论医学——也许可以创建一个框架,在这个框架中人们可以研究其基本特征,而无需涉及其所有细节?
我的目标是朝着这样一个框架迈出第一步。从某种意义上说,我的中心结果是,医学中有许多广泛的现象,其核心似乎从根本上来说是计算性的,并且可以通过非常简单的计算模型来捕获,这些模型很容易通过计算机实验进行研究。
我应该在一开始就明确表示,我并不是试图为生物系统的任何特定方面或组成部分建立一个特定的模型。相反,我的目标是“缩小范围”并创建人们可以认为的“元模型”,用于研究和形式化医学的抽象基础。
我将要做的事情建立在我最近使用计算范式研究生物进化基础的工作的基础上。事实上,在构建理想化有机体时,我们将使用同一类基本计算模型。但现在,我们不再考虑理想化的基因突变并询问它们产生什么类型的理想化生物体,而是研究特定的进化理想化生物体,看看扰动对它们有什么影响。粗略地说,这个想法是,如果没有扰动,理想化的有机体会以其正常的“健康”方式运行,但扰动可能会“脱轨”其运行并引入我们所认为的“疾病”。通过这种设置,我们可以将“医学的基本问题”视为识别额外的扰动,这些扰动可以“治疗疾病”并使有机体至少大致回到正常的“健康”轨道。
正如我们将看到的,大多数扰动都会导致我们理想化的有机体发生许多细节变化,就像生物有机体中的扰动通常会导致大量的影响一样,比如在分子水平上。但就像在医学中一样,我们可以想象我们所能观察到的(也许我们所关心的)只是某些粗粒度的特征或“症状”。医学的根本问题是从这些症状中找出什么“治疗”(如果有的话)最终将是有用的。 (顺便说一句,当我说“症状”时,我指的是人们在实践中可能使用的一整套体征、症状、测试等,比如诊断。)
值得再次强调的是,我在这里并不是想得出具体的、可操作的医学结论。相反,我的目标是建立一个概念框架,例如,在这个框架中,过去似乎充其量是模糊和轶事的医学普遍现象可以开始被形式化并以系统的方式进行研究。在某种程度上,我想做的事情有点像达尔文主义对生物进化所做的事情。但在现代,出现了一个关键的新元素:计算范式,它不仅引入了各种新的、强大的理论概念,而且引导我们走向计算机实验的实用方法论。事实上,接下来的大部分内容都是基于我最近所做的计算机实验的(通常令人惊讶的)结果,这些结果为我们提供了原材料来构建我们对医学基本现象的直觉并构建我们的思维。
最小元模型
我们如何建立医学元模型?我们需要对生物有机体及其行为和发展进行理想化。我们需要对此类生物体的疾病概念进行理想化。我们需要对治疗概念进行理想化。
为了实现生物有机体的理想化,我们将使用一类称为细胞自动机的简单计算系统(我碰巧从 20 世纪 80 年代初就开始研究它)。这是一个具体的例子:

这里发生的事情是,我们通过重复应用右侧规则的案例(代表理想化的基因组以及其他生化等规则),逐步构建左侧的模式(代表我们有机体的发育和行为)。我们的有机体)。我们大致可以认为左边的模式对应于我们有机体的“生命史”——随着页面的向下生长、发育和最终死亡。尽管该模式看起来相当有机,但请记住,我们建立的系统并不是为了为任何特定的现实世界生物系统提供模型。相反,我们的目标只是让它捕获足够的生物学基础,以便它可以作为一个成功的元模型,让我们探索有关医学基础的问题。
更详细地观察我们的模型,我们发现它涉及一个正方形网格或“细胞”(计算的,而不是生物的),每个网格都有 4 种可能的颜色之一(白色和其他三种颜色)。我们从网格顶行上的单个红色“种子”单元格开始,然后通过连续应用右侧的规则来计算后续步骤中单元格的颜色(即页面下方的后续行)。这里的规则基本上非常简单。但我们可以看到,当我们运行它们时,它们会产生相当复杂的模式,在这种情况下,恰好在 101 个步骤之后,该模式恰好“消失”(即所有单元格都变成白色)。
那么如果我们干扰这个系统会发生什么呢?在左边,我们显示了上面的系统,没有受到干扰。但在右侧,我们通过改变特定单元格的颜色(在步骤 16 中)引入扰动,从而产生相当不同的(如果性质相似)模式:

以下是我们系统的一些其他扰动的结果:

一些扰动(就像这里第二个面板中的扰动)很快就消失了;从本质上讲,系统很快就会“自我修复”。但在大多数情况下,即使是像这里这样的单细胞扰动也会产生长期影响。有时它们可以“延长生物体的寿命”;通常他们会减少它。有时——就像这里显示的最后一个例子——它们会导致本质上无限制的“肿瘤样”生长。
用生物学或医学术语来说,我们引入的扰动是对“有机体在其生命过程中可能发生的事情”的最小理想化。有时,扰动对生物体影响很小或没有影响。或者至少它们不会“真正伤害它”,并且有机体将“活出它的自然寿命”(甚至延长一点)。但在其他情况下,扰动会以某种方式“破坏”有机体的稳定性,实际上“使其患上疾病”,并常常使其“提前死亡”。
但现在我们可以提出我们所认为的“医学的基本问题”:鉴于扰动对有机体产生了有害影响,我们能否找到随后应用的扰动,将其作为克服有害影响的“治疗”影响?
这里的第一个面板显示了一种特殊的扰动,它使我们理想的有机体在 47 个步骤后死亡。随后的面板显示了至少可以“保持有机体存活”的各种“治疗”(即额外的扰动):

在后面的图中,生物体的“生命史”越来越接近最终图中所示的“健康”未受干扰的形式。如果我们的标准是恢复总体寿命,我们可以合理地说“治疗已经成功”。但值得注意的是,有机体的详细“生命史”(也许还有“生活质量”)本质上永远不会像以前一样:正如我们稍后将更详细地看到的,几乎不可避免地会出现这样的情况:扰动+治疗至少会产生一些(通常是许多)长期影响,即使它们不被认为是有害的。
既然我们已经有了“医学问题”的理想化模型,那么对于解决它我们能说些什么呢?嗯,最重要的是我们可以了解为什么它从根本上来说是困难的。最重要的是,核心问题是一个根本性的计算问题: 计算不可约性现象。
给定任何特定的元胞自动机规则,具有任何特定的初始条件,人们总是可以从该初始条件逐步明确地运行该规则,看看会发生什么。但我们能做得更好吗?数学科学的经验可能会让人们想象,一旦人们知道了系统的基本规则,原则上就应该立即能够“求解方程”并跳到计算出系统所做的一切,而无需明确追踪通过所有步骤。但我在 20 世纪 80 年代初研究简单程序时发现的核心问题之一是,此类系统通常会表现出我所说的计算不可约性,这意味着计算出其详细行为的唯一方法本质上就是运行它们一步步规则,看看会发生什么。
那么生物学呢?人们可能会想象,通过增量优化,生物进化将产生以某种方式避免计算不可约性的系统,并且(就像简单的机械)具有明显易于理解的运行机制。但事实上,这并不是生物进化通常所产生的结果。相反, 正如我最近所论证的那样,它似乎所做的基本上只是将随机发现的恰好满足其适应度标准的“不可约计算块”放在一起。结果是生物系统充满了计算不可约性,而且大多数都不能直接“机械解释”。 (计算不可约性的存在大概也是基于数学模型的理论生物学一直如此具有挑战性的原因。)
但是,好吧,考虑到所有这些计算的不可约性,医学怎么可能呢?我们如何能够充分了解生物系统的作用,从而能够确定对其使用何种治疗方法?嗯,计算不可约性使得这变得很困难。但计算不可约性的一个基本特征是,在任何计算不可约过程中必须始终存在计算可约性的部分。如果我们试图仅实现一些相当粗略的目标(例如最大化总体寿命),则有可能利用一些计算可简化性来做到这一点。
(事实上,计算不可约性中的计算可约性使许多事情成为可能,包括具有可理解的物理定律、进行高等数学等)
疾病的多样性和分类
通过我们将疾病简单地理想化为扰动对理想化有机体生命史的影响,我们可以开始提出诸如“所有可能疾病的分布是什么?”之类的问题。
为了开始探索这一点,以下是我们上面讨论的理想化有机体的 4383 个可能的单点扰动的随机样本生成的模式:

显然,这些生活史存在很多差异——实际上有很多不同的症状。如果我们将它们全部平均,我们就会失去细节,而只会得到接近原始的东西:

但如果我们观察生命周期的分布,我们会发现,虽然它在原始值处达到峰值,但它仍然扩展到更短和更长的值:

在医学(或至少是西方医学)中,传统上是根据离散疾病对“可能出错的事情”进行分类。我们可以想象在我们的简单模型中也这样做。但从上面的一系列图片已经可以清楚地看出,这不是一项简单的任务。对于每种不同的扰动,我们都有不同的详细模式。那么我们应该如何将它们组合在一起呢?
嗯——就像医学一样——这取决于我们关心什么。在医学中,我们可能会谈论体征和症状,在我们的理想化模型中,我们基本上可以将其与模式的特征进行识别。举个例子,我们可能会认为唯一重要的特征是与模式的边界形状相关的特征:

那么这些具有不同扰动的边界形状会发生什么?以下是最常见的形状(及其概率):

我们可能认为这些代表了我们理想化有机体的“常见疾病”。但是,如果我们考虑所有可能的“疾病”——至少是所有由单细胞扰动产生的疾病呢?使用边界形状作为区分“疾病”的方法,我们发现,如果我们根据疾病的等级绘制疾病的频率,我们会得到大致的幂律分布(是的,目前还不清楚为什么它是幂律分布):

“罕见病”(即频率较低的疾病)是什么样的?它们的边界形状可以非常多样化:

但是,好吧,我们能以某种方式量化所有这些“疾病”吗?例如,作为一种“模拟医学测试”,我们可能会看看每个模式的边界向左移动了多远。对于单点扰动,84% 的时间与未扰动的情况相同,但存在其他“不太健康”结果的分布(此处以对数刻度绘制)

极端的例子是:

是的,我们可以将任何比不受干扰的模式更靠左的模式诊断为“左撇子综合症”。我们可能会想象,如果我们进行足够的测试,我们就可以开始区分许多离散的“疾病”。但不知怎的,这似乎是非常特别的。
那么,我们是否可以通过使用机器学习来变得更加系统化呢?假设我们只查看每个完整图案,然后尝试将其放置在图像特征空间(例如 2D 空间)中。这是我们得到的示例:

其细节取决于我们使用的机器学习方法的细节(此处为Wolfram 语言中的默认FeatureSpacePlot方法)。但这是一个相当可靠的结果,“视觉上不同的”模式最终被分开,因此机器学习实际上成功地自动化了某种“视觉诊断”。至少有一点证据表明,机器学习将识别分离的模式簇,我们可以合理地将它们识别为“真正不同的疾病”——即使更常见的情况是,在任何两种模式之间,都存在中间的模式。整齐地分类为一种疾病或另一种疾病。
有点像人类“国际疾病分类”(ICD)的风格,我们可以尝试将所有模式按层次结构排列——尽管我们总是能够进一步细分,这基本上是不可避免的,而且永远不会有一个我们可以说“我们已经对所有疾病进行了分类”:

顺便说一句,除了谈论可能的疾病之外,我们还需要讨论什么才算“健康”。我们可以说,只有当我们的有机体的模式完全符合没有任何扰动的情况下(“自然状态”)时,我们的有机体才是“健康的”。但可能更好地体现日常医学思维的是,如果我们的有机体没有我们认为不好的症状(或特征),那么它就应该被认为是“健康的”。特别是,至少“事后”我们可以说,如果它的寿命很长,它一定是健康的。
值得注意的是,即使在我们的简单模型中,虽然有许多扰动会缩短寿命,但也有扰动会延长寿命。在生物进化过程中,我们理想化有机体的总体基本规则的基因突变可能已经成功地实现了一定的寿命。但关键是,没有什么可以说“在有机体的生命周期内”应用“长寿扰动”不会走得更远——事实上,这里有一些例子,它们确实做到了:

事实上,人类医学中还没有(至少还没有)反映出来的一个特征是,存在一些扰动可以使寿命显着延长。对于我们在这里研究的特定理想化有机体,通过单点扰动获得的最极端的例子是:

好的,但是如果我们考虑多个点的扰动会发生什么?立即就有更多的可能性。以下是两个扰动的 1000 万种左右可能配置的一些示例:

以下是三个扰动的示例:

以下是我们尝试应用五个扰动的示例(尽管有时在我们应用后续扰动之前生物体“已经死亡”):

在这些情况下,生命周期的总体分布会发生什么变化?已经有两次扰动,分布就变得更广泛,并且有三个或更多扰动,原始寿命的峰值几乎消失了,对于实际上几乎立即死亡的生物体出现了新的峰值:

换句话说,我们正在研究的特定理想化有机体对于一种甚至两种扰动相当稳健,但随着扰动的增加,它越来越有可能屈服于“婴儿死亡率”。 (是的,如果扰动数量增加,“预期寿命”就会逐渐缩短。)
但反过来呢?在多重扰动下,有机体实际上可以“永生”吗?以下是一些在 300 步后仍然“强劲”的示例:

但在 500 步之后,大多数这些都消失了:

正如计算宇宙中的典型情况(也许就像医学中一样),由于计算不可约性,总会有惊喜。就像突然出现的明显周期性的情况(周期为 25):

以及更复杂的情况(在最终图片中,模式已被“纠正”):

所以,是的,在这些情况下,有机体实际上确实“永远活着”——尽管不是以一种“有趣”的方式。事实上,这样的案例可能会让我们想起生物有机体中的类似肿瘤的行为。但如果有一个案例不仅可以永远存在,而且可以永远增长呢?好吧,不用说,在计算宇宙中,人们可以找到一个例子:

对于 2 次扰动,这种行为的“发生率”约为百万分之一(或者更准确地说,960 万种可能性中的 7 种),对于 3 次扰动,这种行为的“发生率”约为 30 万分之一。尽管可能还有更复杂的行为有待发现,但它们不会出现 2 次扰动,并且 3 次扰动的发生率低于约一亿分之一。
诊断与预后
医学的一个基本目标是根据我们所做的测试或我们观察到的症状和体征来预测将会发生什么。是的,我们现在知道,计算不可约性不可避免地使这通常变得困难。但从经验中也知道,一定量的预测是可能的——我们现在可以将其解释为成功地利用了计算可简化性。
举个例子,让我们问一下,根据我们在某个步骤中测量的模式宽度,我们理想化的有机体的预后是什么。例如,如果我们仅考虑 25 个步骤后测量模式的宽度小于其未受干扰(“健康”)值的情况(以及我们所处的位置),则原始寿命分布(绿色)会发生什么情况减少 25 步之前生物体“已死亡”的 1%):

我们的“狭义”病例约占总数的 5%。他们的中位寿命为 57 岁,而总体中位寿命为 106 岁。但显然,中位寿命本身并不能说明全部情况。两条生存曲线也没有:

例如,与未受干扰情况下的宽度序列相比,以下是所有狭窄情况下作为时间函数的实际宽度:

从这些图片看来,通过第 25 步中模式是否狭窄的单一测试来预测寿命的前景并不乐观。就像在类似的医疗情况下一样,人们需要更多数据。在我们的案例中,一种方法是查看实际的“窄”模式(直到步骤 25)——这里按最终寿命排序——然后尝试识别有用的预测特征(尽管,例如,尝试任何严肃的机器学习训练都会需要更多的例子):

但也许更简单的方法不仅仅是进行离散的“窄与否”测试,而是在步骤 25 中查看实际宽度。因此,这里是在步骤 25 中作为宽度函数的寿命

这是结果的分布,以及每种情况的中位数:

我们的宽度测量的预测能力显然相当弱(尽管毫无疑问有一种方法可以“破解p值”以至少得到一些东西)。毫不奇怪,机器学习也无济于事。就像这里的机器学习预测(基于决策树方法)的寿命作为宽度的函数(是的,非常接近于中位数):

如果我们使用更多历史记录会有帮助吗?换句话说,如果我们不仅根据特定步骤的宽度进行预测,而且根据截至该点的所有宽度的历史记录进行预测,会发生什么?作为一种方法,我们可以收集生命周期特定“宽度历史”(例如到步骤 25)导致的“训练示例”:

这里已经存在一些问题了,因为给定的宽度历史(在某种意义上是详细“微观”历史的“粗粒度”)可能会导致多个不同的最终生命周期:

但我们仍然可以继续尝试使用机器学习根据训练数据(例如一半)的宽度历史来预测生命周期,但结果并不令人印象深刻(垂直线与单个生命周期的多个生命周期相关)训练数据中的宽度历史):

那么我们怎样才能做得更好呢?好吧,考虑到我们系统的底层设置,如果我们不仅可以确定宽度,还可以确定所有单元格的整个精确值序列,即使只是在第 25 步,那么原则上我们可以使用它作为“初始条件”并运行系统向前看它做了什么。尽管这样做“在医学上不可信”,但无论如何,这也算不上是一个预测。更重要的是“观察并看看会发生什么”。关键是,就计算不可约性而言,人们不能指望——至少在完全普遍的情况下——做得更好。 (而且,正如我们稍后将讨论的,没有理由认为生物进化产生的有机体将避免这个级别的计算不可约性。)
但是,在任何计算不可约的系统中,总是存在计算可约的部分。所以我们可以预期将会做出一些预测。但问题是,这些预测是否是关于我们关心的事情(比如寿命),甚至是关于我们可以衡量的事情。或者,换句话说,它们会是针对症状等内容的预测吗?
例如,我们的物理项目涉及各种计算上不可简化的基础过程。但关键的一点是,像我们这样的物理观察者所感知的是聚合结构(如空间的整体特征),显示出显着的计算可简化性。从某种意义上说,这里存在一个类似的问题:下面存在计算的不可约性,但是“医学观察者”实际上感知到什么,以及是否存在与此相关的计算可约的特征?如果我们能找到这样的东西,那么从某种意义上说,我们就已经确定了“医学一般定律”,就像我们现在有“物理一般定律”一样。
寻找治疗方法的问题
我们已经讨论过对遭受扰动的理想化有机体将会发生什么进行预测。但尝试修复它又如何呢?尝试干预另一种可以“治愈”系统的“治疗扰动”,并赋予其至少接近于没有原始扰动时的生活史,怎么样?
这是我们最初的理想化有机体,以及它在“遭受”显着缩短其寿命的特定扰动时的行为方式:

但是如果我们现在尝试应用第二次扰动会发生什么?以下是一些随机示例:

这些例子都不能令人信服地“治愈”系统。但让我们(正如我们在理想化模型中所做的那样)列举所有可能的第二次扰动(此处为 1554 个)。然后事实证明,其中一些实际上成功地为我们提供了至少准确再现原始生命周期的模式:

这些是“治愈”的真实例子吗?嗯,这取决于我们的意思。是的,他们已经成功地使生命与没有最初的“诱发疾病”的扰动完全一样。但在基本上所有情况下,我们在这里看到都存在各种“长期副作用”——从某种意义上说,生成的详细模式最终与原始未受干扰的“健康”形式有明显差异。
这里的一个例外是第一个案例,其中“疾病发现得足够早”,“治疗扰动”成功地完全治愈了“疾病扰动”的影响:

我们在这里一直在谈论通过“治疗扰动”进行干预来“治愈”我们的“疾病扰动”。但事实证明,有很多“疾病扰动”会自动“自愈”,无需任何“治疗”干预。事实上,在所有可能的 4383 个单一扰动中,有 380 个基本上可以自我修复。
在许多情况下,“治愈”发生在局部,经过一两个步骤:

但也有更复杂的情况,其中扰动会产生相当大范围的模式变化,但“会自行治愈”:

(不用说,在扰动“自行治愈”的情况下,添加“治疗扰动”几乎总是会导致更糟糕的结果。)
那么我们应该如何看待自发自愈的扰动呢?它们就像永远不会生根的疾病的种子,或者像很快就会自行消失的疾病。但从理论的角度来看,我们可以将它们视为理想化有机体的不受扰动的生命史充当吸引子的地方,某些受扰动的状态不可避免地会聚到吸引子上——有点像摩擦力如何消散对运动模式的扰动。机械系统。
但假设我们有一种扰动,它不会“自行治愈”。然后为了补救它,我们必须“做医疗事情”,并在我们的理想化模型中尝试找到“治疗扰动”。那么我们如何系统地着手做到这一点呢?嗯,一般来说,计算不可约性使得这变得很困难。作为这一点的一个指示,这显示了通过在模式中每个可能的点(在初始扰动之后)进行“治疗扰动”所实现的寿命:

我们可以将其视为提供了不同治疗扰动的影响的地图。以下是针对不同初始扰动(或者实际上不同“疾病”)的一些其他示例:

这里有一些规律性。但主要的观察结果是,治疗扰动的不同细节选择通常会产生截然不同的效果。换句话说,即使是“附近的治疗”也常常会导致截然不同的结果。考虑到计算的不可约性,这并不奇怪。但从某种意义上说,它强调了寻找和应用“治疗方法”的难度。顺便说一句,上面以深红色表示的细胞是经过治疗后导致寿命“过长”的细胞,或者实际上显示出肿瘤样特征的细胞。事实上,这些似乎是随机分散的,反映出很难预测治疗是否会产生这种效应。
到目前为止,我们所做的工作中,我们的“处理”始终只包含一个额外的扰动。但是施加更多扰动又如何呢?例如,假设我们做了一系列实验,在第一次“治疗扰动”之后,我们逐渐尝试其他治疗扰动。如果给定的额外扰动没有超出预期寿命,我们将保留它。否则我们拒绝它,并尝试另一种扰动。下面是如果我们这样做会发生什么的示例:

突出显示的面板代表我们保留的扰动。以下是我们实验中连续迭代中整体生命周期如何“收敛”的情况:

在我们刚刚所做的事情中,我们允许在任何后续步骤中添加额外的治疗扰动。但是,如果我们要求始终在连续步骤中添加治疗扰动(从“疾病扰动”发生后立即开始)怎么办?以下是这种情况下发生的情况的示例:

这是我们一开始看到的放大内容:

从某种意义上说,这相当于在最初的“疾病扰动”发生后就“进行积极的治疗”。这里的特定例子的一个显着特征是,当我们连续的治疗扰动成功地“恢复生命”(这发生得相当快)时,它们产生的生活史与原始未受扰动的病例相似(尽管不相同)。
正如本例所示,这种情况肯定不会总是发生,但相当常见:

值得指出的是,如果我们允许自己同时进行许多单个扰动(即在模式的同一行上),我们可以有效地为模式“定义新的初始条件”,并且,例如,完美地“重新生成” ”这次“重置”后原始未受干扰的模式。一般来说,我们可以想象通过施加大量的治疗扰动,实际上“热连线”有机体,这些扰动只是反复将其引导回未受扰动的形式。
但这种广泛而详细的“干预”——实际上取代了有机体的整个状态——似乎与典型(当前)医学中的实际情况相去甚远(也许除了某种“再生治疗”)。事实上,在实际(当前)医学中,人们通常在这样一种情况下进行操作:人们没有任何关于有机体状态的接近完美的“逐个细胞”信息,相反,人们必须弄清楚诸如什么治疗方法之类的事情。根据更粗略的“症状级别”信息给出。 (不过,在某些方面,免疫系统所做的事情更接近于逐个细胞的“治疗”。)
那么,在给定粗粒度信息的情况下,我们可以做什么呢?作为一个例子,让我们考虑尝试使用上面讨论的那种模式宽度信息来预测哪种治疗方法最好。具体而言,假设我们拥有模式的整体宽度的历史,直到特定点,然后我们想预测哪种治疗扰动将导致系统的最佳寿命结果。我们可以通过多种方式来解决此问题,但是一种方法是对在此类扰动的示例中训练的机器学习训练在哪里应用治疗扰动。
这类似于我们在应用机器学习以预测宽度历史记录的生命时所做的类似。但是现在,我们想从宽度历史上预测哪种治疗扰动要应用。为了生成我们的培训数据,我们可以搜索从具有给定宽度病史的生活历史开始时,这些治疗扰动会导致不受干扰的寿命。现在,我们可以使用一个简单的神经网络创建一个预测因子,该预测因素试图从宽度历史告诉我们“要给予的治疗方法”。这是我们先前的搜索结果之间的比较,基于查看完整的生活历史,(带有红色箭头)的机器学习预测纯粹基于原始疾病扰动之前的宽度历史:

很明显,机器学习正在做某事,尽管它看起来并不像看起来那样令人印象深刻,因为各种各样的扰动实际上都具有相似的生活历史。因此,作为正在发生的事情的定量指示,这是我们基于机器学习的疗法实现的生命的分布:

在所有这些情况下,我们的“最佳治疗方法”能够给予终生101。尽管我们现在实现的分布看起来围绕着不受干扰的价值达到顶峰,将这种分布除以我们在没有任何治疗的情况下所获得的,这清楚地表明,我们能够做到的机器学习实现了很多:

从某种意义上说,这不足为奇。与工作中基础过程的计算不可约性相比,我们的机器学习 – 基于粗粒的特征,基于粗粒的特征,这是非常弱的。
遗传多样性的影响
到目前为止,我们只研究了一个理想化的生物,其中一组基础“遗传规则”。但是类似于人类的局势,我们可以想象遗传上略有不同的理想化生物,对扰动的反应不同。
我们理想化的有机体对基本规则的许多变化将导致未识别的模式,例如,我们对我们一直感兴趣的有限但很长的一生。对于我们特定的理想化生物来说,有一些特定的变化实际上根本没有任何影响,至少是对行为的不受干扰模式。原因是,在生成不受干扰的模式时,这些规则中的特定案例永远不会被使用:

结果是,对于规则中的那些情况,4 3 = 64可能的结果选择仍将产生相同的不受干扰的模式。但是,如果存在扰动,则可以对规则中的不同案例进行采样,包括这些情况。就像规则中最初“非编码”的案例最终会在行为路径通过扰动更改时“编码”。 (或说不同的是,这就像在条件不同时被激活的不同基因。)
因此,要制作一个像具有遗传多样性的人群之类的理想化模型,我们可以研究(最初)“非编码”规则结果的不同选择会发生什么:

在扰动之前,所有这些不可避免地会显示出相同的行为,因为它们从不对“非编码”规则案例进行采样。但是,一旦发生扰动,模式就会改变,并且在不同的步骤之后,以前的“非编码”规则案例确实会被采样,并可能影响结果。
以下是所有64种“遗传变异”中发生的情况的不同情况,在每种情况下,红色箭头都指示模式首先与我们原始理想化的生物的不同之处:

然后,这是实现生命的分布 – 效果显示了这种特定的“疾病扰动”对我们所有遗传变异的不同后果:

其他“疾病扰动”会发生什么?这是实现生命的分布的样本(其中“ __”对应于所有64种遗传变异的情况下的寿命相同):

好的,那么每个遗传变异的所有(单个)扰动的总体寿命分布又如何呢?对于每个变体,我们获得的详细分布都是不同的。但是它们的总体形状总是非常相似

尽管与我们原始理想化的有机体相比有所不同,但揭示了一些结构:

作为遗传多样性影响的另一个迹象,我们可以在所有扰动中绘制生存曲线平均,并将我们原始理想化生物的案例与如果我们在所有64种遗传变异中平均平均平均的情况进行比较。差异很小,但是遗传变异的平均尾巴比我们特定的原始理想化有机体更长:

我们已经看到了理想化的遗传变异如何影响“疾病”。但是它如何影响“治疗”?对于上面的“疾病”,我们已经看到有一种特殊的“治疗扰动”成功地将我们原始的理想化生物归还其“自然寿命”。那么,如果我们在所有遗传变异中使用相同的治疗方法会发生什么?实际上,这就像对我们的潜在治疗方法进行非常理想化的“临床试验”。我们看到的是结果非常多样化,而且实际上比疾病本身更多样化:

从本质上讲,我们看到的是,是的,有一些遗传变异疗法仍然有效。但是,有很多(通常是相当戏剧性的)副作用。
生物进化和我们的模型生物
那么我们一直在研究的“模型生物”的特定规则从何而来?好吧,我们将其进化了 – 我最近引入了理想化的生物进化模型的略有概括。我们进化过程的目的是找到一条规则,该规则会产生尽可能长的模式,但并非无限长,甚至在扰动的情况下也是如此强大。本质上,我们将寿命(或更准确地,“扰动下的生命周期”)用作“适应性功能”,然后通过随机突变逐渐进化了我们的规则(或“基因组”),以尝试最大程度地提高此适应性功能。
更详细地,我们从null(“一切变成白色”)规则开始,然后依次对规则中的单个情况进行随机更改(“点突变”) – 每当生成一生的模式(在下面)扰动)并不小(或无限)。借助此设置,这是我们获得的特定(随机)规则序列(为每个规则显示其64个案例中的每种结果):

这些规则中的许多规则没有“取得进步”,因为它们会增加扰动下的寿命。但是,每隔一段时间都有“突破”,并且达到了寿命较长的规则:

而且,正如我们看到的,我们一直使用的特定模型生物的规则是最后达到的规则。
在研究我最近的生物进化的理想化模型时,我考虑了适应性功能,例如生命周期,可以直接通过从某个初始条件运行基本规则来直接计算。但是在这里,我将其概括,并考虑到健身功能不仅是寿命,而且是“在扰动下的寿命”,通过采用特定规则来计算,并找到使用某些随机扰动所产生的所有模式的最小寿命。
因此,例如,在这里,“扰动下的生命周期”将被认为是没有扰动而生成的生命的最小值,并且在某些随机扰动中,或者在这种情况下60:60:

然后,该图说明了(蓝线终身扰动)适应性(蓝线表示)在我们的自适应演化过程中的表现,即在上述适应性60“突破”的位置:

这个情节发生了什么?在每个自适应步骤中,我们都在考虑一个新规则,该规则是通过前一个突变获得的。运行此规则,我们将获得一定的生命。如果此寿命是有限的,我们通过绿色点表示。然后,我们应用一套随机扰动,这指示了我们通过灰点获得的寿命。 (我们可以想象使用各种方案选择随机扰动;在这里,我们要做的就是在不受干扰的模式下驱动大约十分之一行的随机点。)
然后,对于任何给定规则,我们用红点表示的最小寿命,这是我们分配给该规则的适合度。因此,现在我们可以看到我们自适应演化过程的整体进展:

值得注意的一件事是,不受干扰的寿命(绿点)比最后的最小寿命(红点)大得多。这意味着我们对“鲁棒性”的要求,通过在扰动下查看终生而不仅仅是不受干扰的寿命,从而大大降低了我们可以达到的生命。换句话说,如果我们理想化的有机体将变得健壮,那么如果不必“担心”随机扰动,它将往往能够拥有一生的时间。
为了说明这一点,这是通过自适应演化获得的寿命更长的典型示例纯粹由未受动力的寿命(与我最近的生物进化工作一样)给予:

好的,因此,鉴于我们会随着终身扰动的适应性功能而发展,我们特定模型有机体有哪些替代方法?以下是一些示例:

从总体上讲,这些似乎对我们原始模型有机体的扰动做出反应:

不过,这里的一个值得注意的特征是,似乎有一种简单的总体行为趋于不受扰动的破坏。换句话说,我们理想化的“疾病”似乎对“简单”理想的生物的戏剧性影响较小。如果我们绘制上述四个规则的总体(单扰动)寿命分布,我们可以看到这种现象的反映:

但是尽管有详细的差异,但主要的结论似乎是我们使用的特定模型有机体没有什么特别的,并且如果我们重复对不同模型生物(即“不同的理想化物种”)的整个分析,那么我们将会取得获取将非常相同。
这意味着什么,从这里去哪里
那么这意味着什么?从一开始,目前尚不清楚以形式化的理论方式可以有效捕获有关医学基础的任何方法。但是实际上,我们发现的是,即使我们研究的非常简单的计算模型似乎都成功地反映了我们在医学中看到的各种功能。许多基本效果和现象似乎不是生物医学细节的结果,而是其核心纯粹的抽象和计算,因此可以使用形式化的理论和元模型。这种方法与医学上的传统方法大不相同,也不可能直接导致特定的实用医学。但是,它可以做的是帮助我们发展强大的新一般直觉和推理方式,并最终了解正在发生的事情的概念基础。
我们所看到的许多核心是计算不可约性的基本和无处不在。我最近认为,计算不可还能是使生物进化起作用的核心,并且不可避免地印在生物生物的核心“计算架构”上。正是这种计算不可约性无情地导致了我们在医学中如此普遍看到的许多复杂性。我们可以期望找到对有机体某些扰动的后果的简单叙事解释吗?通常,由于计算不可约性。总是有大量的计算降低性,但是总的来说,我们没有期望,例如,我们能够通过将它们整齐地分类为一系列独特的“疾病”来描述不同扰动的效果。
在很大程度上,医学的核心使命是关于“治疗疾病”,或者用我们的角度来补救或逆转扰动的影响。再次,计算不可约性意味着不可避免的是这样做的基本困难。这有点像第二种热力学定律,在微观分子动力学中,有足够的计算不可还能能力,可以严重逆转(或超过)这种动力学,至少远远超出了像我们这样的计算界面观察者的范围。在我们的医学环境中,类似于“计算有限的干预措施”只能系统地导致医疗成功,因为它们挖掘到计算降低的口袋中。而且,只要他们面临整体计算不可约性,它们似乎不可避免地会显示出一定的明显随机性。
在传统的医学方法中,一个人最终倾向于“屈服于随机性”,而不仅仅是为事物分配概率。但是,我们在这里所做的工作的一个重要特征是,在我们理想化的计算模型中,我们总是可以明确地看到内部发生的事情。通常,由于计算不可约性的原因,这很复杂。但是,我们可以看到它使我们有机会对所涉及的基本机制更加清晰。而且,如果我们最终通过提出概率和执行统计数据来总结发生的事情,那是因为这是我们选择做的事情,而不是我们被迫做的事情,因为我们对正在研究的系统缺乏了解。
我们努力探索医学的计算基础有很多事情要做。但是已经有一些含义开始出现。当今医学的大部分工作流程都是基于将可能出错的事情分类为离散疾病的基础。但是,我们在这里看到的(考虑到医学上的实际经验,这并不令人惊讶)是,当人们查看细节时,可能会发生大量的事情 – 他们的特征和结果并不能真正整齐地纳入离散的“疾病” ”。
确实,当我们试图找出“治疗”时,细节很重要。作为第一个近似值,我们可能会将治疗方法基于粗晶片,以分散疾病。但是,正如我在这里概述的方法可以帮助我们分析的方法,我们可以直接从详细的测量到详细的治疗方法(通过计算,机器学习等),越有希望可能是。并不是说这很容易。因为从某种意义上说,我们试图通过计算界限的测量和干预措施来击败计算不可约性。
原则上,人们可以想象,我们的治疗努力具有更多的计算复杂性(实际上,免疫系统大概已经提供了本质上的榜样)。我们可以想象,算法药物和人造细胞之类的东西能够进行数量的计算,这些计算与有机体的不可还原计算更紧密匹配。确实,我在这里概述的那种形式化的理论很可能是人们需要开始了解这种方法如何起作用的想法。 (在热力学类比中,我们需要做的有点像通过发送大量“智能分子”来逆转熵的增加。)
(顺便说一句,看到扭转扰动的效果的可能性有多么困难,这为考虑“从头开始”(大自然在连续的生物体中所做的事情)的动力更大,而只是批发生物体的元素,而不是批发生物的元素试图“修复那里的内容”,是的,在我们的模型中,这是例如,从新的种子开始再次成长,并将所得模式编织成现有的种子。
在计算基础级别上操作的重要特征之一是,我们可以期望我们得出的结论非常笼统。我们可能会想知道,我们在这里描述的框架是否可以在医学之外应用。在某种程度上,我怀疑它可以 – 在大型技术和社会系统的鲁棒性上,特别是计算机安全和计算机系统故障等领域。 (而且,是的,就像医学中的人一样,例如,计算机系统的“分类疾病”。)但是,在这种情况下,情况可能不会完全相同 – 因为基础系统具有更大的人为确定的机制,即和“盲目”的自适应进化。
但是,当涉及到医学时,生物进化引入的计算不可还能性的存在可能使人们可以开发一个强大的框架,在该框架中,人们可以纯粹基于抽象的计算现象得出结论。在这里,我刚刚开始刮擦可能的表面。但是我认为我们已经看到了足够多的人,我们可以相信医学是另一个可以看作的基础,从根本上讲,其基础源于计算范式。
谢谢和笔记
感谢Wolfram Institute研究人员Willem Nielsen的广泛帮助。
我以前从未写过任何关于药物的重要内容,尽管多年来我与医学研究和生物医学群落有很多互动,这些互动逐渐扩大了我对医学的知识和直觉。 (尤其要归功于比阿特丽斯·戈洛姆(Beatrice Golomb),在过去的40多年中,他们帮助我更多地了解了医学推理,通常强调“比阿特丽斯定律”,“医学上的一切都比您想象的要复杂得多,甚至考虑到比阿特丽斯的考虑法律”…)