“读完计划”之《复杂》

上个月也就是 7 月 14 号整理完购买的纸质书后,在朋友圈说要搞个“买书读完计划”,定的是每2 周一本的速度读完,输出以笔记或文章为主,当时应朋友建议第一本读《复杂》,今天就对这本书做一个读书小结。

先来介绍下这本书吧,这本书的作者是梅拉妮·米歇尔 (Melanie Mitchell),她是美国圣塔菲研究所(Santa Fe Institute)的客座教授。而圣塔菲研究所主要研究方向就是复杂系统,它建立于 1984 年,如今在世界上非常有名。

这本书源自于梅拉妮·米歇尔为圣塔菲的乌拉姆纪念讲座(Ulam Memorial Lecture)作的演讲。当时讲座的题目是“复杂性科学的过去和未来”,而它就是由这个扩充而来的。所以,从这里就可以看出,这本书是了解复杂性科学非常不错的入门书籍。

说到“复杂性科学”,我最早了解的是“复杂网络”,当时是在 2016 年开智学习写作的时候了解的。后来听说集智俱乐部经常做这方面的读书会,一直到今年 6 月经朋友邀请才有机会参加了4 期,并做了一次分享。

其实这本书我早在 2017 年双十一的时候就买了,之后却没有打开来看。

这次读完后对复杂科学有了一个全面的认识,也解开了以前的一些疑惑。比如,以前对复杂网络和复杂科学两者的关系有点混淆不清,读了后才明白原来复杂网络只是复杂科学的一部分,其他还有社会性昆虫群落、大脑、免疫系统、全球经济等。

复杂性研究解决什么问题呢?它研究的主要是诸如蚂蚁、细胞、免疫系统、经济个体等等是如何通过简单规则产生出复杂和适应性的行为。即涌现和自组织行为是如何产生的。

换句话说,它解释的是在不存在中央控制的情况下,大量简单个体怎样自行组织成能够产生模式、处理信息甚至能够进化和学习的整体。比如蚁群寻找食物、蜂群采蜜、免疫系统工作,它们是如何组织和运行的。

从17世纪以来,还原论就一直在科学中占据着主导地位。还原论说的是“如果你理解了各个部分,以及把这些部分‘整合’起来的机制,你就能够理解这个整体”。从逻辑上看这完全正确,毫无问题。

18-19 世纪,牛顿力学给人们描绘了一幅“钟表宇宙”的图景:设定好初始状态,然后就遵循着三条定律一直运行下去。拉普拉斯甚至在1814年断言:根据牛顿定律,只要知道宇宙中所有粒子的当前位置和速度,原则上就有可能预测任何时刻的情况

只是到了 20 世纪,人们发现把这个“宇宙钟表”拆卸之后,却怎么也拼不起来了——物理学家海森堡证明,不可能在准确测量粒子位置的同时,又准确测量其动量(质量乘以速度)。对于其位置知道得越多,对于其动量就知道得越少,反过来也是一样。还有混沌系统发现,比如飓风、人口数量、股票市场等等,只要初始条件有一点点误差,不管多小,就会导致长期预测不精确。

人们渐渐发现还原论在气象变化,生物进化、疾病传播,社会的经济、政治和文化行为,网络的发展和影响等等越来越无力。于是反还原论——“整体大于部分之和”的思想开始占据上风。

司马贺在《人工科学:复杂性面面观》中对复杂性研究的阶段进行了简要论述。他说,20 世纪以来,人们对复杂性和复杂系统表现出了一波又一波的强烈兴趣。

第一波兴趣在第一次世界大战后,当时哲学家斯穆茨提出了“整体论”这个词,也导致了对“格式塔”和“创造性进化”的热衷。

第二波兴趣在第二次世界大战后,最开始由维纳提出了“控制论”,信息论用熵也就是无序的减少来解释组织化的复杂性,系统从外部吸取能力并将其转化为模式或结构就可实现熵减。当时的热门的词语是“信息”、“反馈”、“控制论”和“一般系统”。

第三波兴趣就是1996 年前后,主要动机是理解与把握世界上的一些大规模系统,比如环境,人类社会,生命体等。这一时期的热词是“混沌”、“自适应系统”、“遗传算法”和“元胞自动机”。

三次兴趣波尽管都留意复杂性问题,但它们选择了复杂性的不同侧面作为特别关注点。司马贺在书中总结说,第三波研究活动的新鲜之处不在于对具体复杂系统的研究——天文学家、生物学家、经济学家、心理学家等都在研究,而在于将复杂性现象作为独立门类来研究。

就像1992 年米歇尔·沃尔德罗普出版的《复杂:诞生于秩序与混沌边缘的科学》 介绍的就是一群美国科学家如何开创复杂性科学的故事。

而本书则是从信息、计算、动力学和混沌、进化四个基础上,对复杂性科学进行一个全面的介绍。其中主要介绍了复杂性科学中的自我复制、遗传算法、元胞自动机、生命系统中的信息处理、网络科学和生物中的比例之谜等等。

一些摘录:

在复杂系统研究中一个主要的方向就是研究理想模型。通过相对简单的模型来理解一般性的概念,而不用对具体系统进行详细的预测。下面是我在书中曾讨论过的一些理想模型的例子:

麦克斯韦妖:用来研究熵的概念的理想模型。

图灵机:用来对“明确程序”进行形式化定义以及研究计算概念的理想模型。

逻辑斯蒂模型和逻辑斯蒂映射:用来预测种群数量的极简模型;后来成为研究动力学和混沌一般性概念的理想模型。

冯·诺依曼自复制自动机:用来研究自复制“逻辑”的理想模型。

遗传算法:用来研究适应性概念的理想模型。有时候也作为达尔文进化的极简模型。

元胞自动机:用于研究一般性的复杂系统的理想模型。

科赫曲线:用来研究海岸线、雪花等分等分形结构的理想模型。

模仿者:用来研究人类类比思维的理想模型。

理想模型有许多用途:

研究一些复杂现象背后的一般机制(例如,冯·诺依曼研究自复制的逻辑);证明解释某种现象的机制是不是合理(例如,种群数量的动力学);研究简单模型在变化后的效应(例如,研究遗传算法的变异率或逻辑斯蒂映射的控制参数 R变化所带来的影响);或者更普遍是作为哲学家丹尼特( Daniel Dennett)所谓的“直觉泵 ( intuition pump)”——用来引导对复杂现象进行理解的思维实验或计算机仿真。

复杂系统的理想模型也能为新的技术和计算方法提供灵感。例如,图灵机启发了可编程计算机;冯·诺依曼的自复制自动机启发了元胞自动机;达尔文进化、免疫系统和昆虫社会的极简模型分别启发了遗传算法、计算机免疫系统和“群体智能( swam intelligence)”方法。

梅西基金会系列会议聚集了当时许多杰出人物,除了维纳,还有冯·诺依曼、麦卡洛克( Warren McCulloch)、米德( Margaret Mead)、贝特森、香农、阿什比( W. Ross Ashby)等人。这些会议促使维纳提出了一门新的学科,控制论 ( cybernetics),这个词来自希腊语的“舵手”一词,也就是船的操控者。维纳将控制论归结为“整个控制和通讯的理论 ,无论是关于机械还是动物”。

….他们想知道:信息和计算是什么?它们在生物中是如何表现的?生物与机器有什么相似之处?反馈在复杂行为中起什么作用?信息处理是如何产生出意义和目的的?

….还有一个寻找共性的类似尝试,就是所谓的一般系统论, 20世纪 50年代由贝塔朗菲( Ludwig Von Bertalanffy)发起,他将其描述为“对一般性‘系统’有效的原则进行形式化和演绎”。

系统论学家拉普波特将一般系统论(应用到生物系统、社会系统和其他复杂系统)的主线描述为在变化中保持的一致性,有组织的复杂性以及目标导向性。

生物学家马图拉纳( Humberto Maturana)和维埃拉( Francisco Varela)试图用自创生( autopoiesis,或“自我建构”)的概念统一前两条主线,这个概念表示自我维持的过程,系统(例如一个生物细胞)作为一个整体运转,不断产生出系统本身的构成组分(例如细胞的部件)。

人工智能、人工生命、系统生态学、系统生物学、神经网络、系统分析、控制理论和复杂性科学都是由这些控制论学家和一般系统论学者播下的种子发展而来。对控制论和一般系统论的研究仍然很活跃,但基本已经被这些从中衍生出来的学科掩盖了。

…..到目前为止复杂系统研究最有意义的贡献也许是对许多长期持有的科学假设提出了质疑,并且发展出了将复杂问题概念化的新方法。

混沌告诉了我们看上去行为随机的系统并不一定是因为有内在的随机性;遗传学的新发现对基因变化在进化中的作用形成了挑战;对随机和自组织的作用的新认识挑战了将自然选择作为进化的核心力量的观念。非线性、分散控制、网络、层次、分布式反馈、信息的统计表示、本质的随机性,这些思想的重要性在科学界和大众中都逐渐被认识到。

自然系统的“计算”指的是什么呢?大致上说,计算是复杂系统为了成功适应环境而对信息的处理。但是这样的说法还能更精确些吗?信息在哪里?复杂系统又是如何处理信息的?

为了让这类问题更易于研究,科学家们通常会将问题理想化——也就是尽可能简化,但仍然保留问题的主要特征。鉴于此,许多人都用元胞自动机这种理想化的复杂系统模型来研究自然界中的计算。

“在我看来,意义与生存和自然选择密切相关。如果事件影响到某个生物的生存或繁衍能力,那么事件对生物就具有某种意义。总之,事件的意义是如何应对事件的依据。

事件对生物免疫系统的意义是其对生物适应度的影响。(我在这里非正式地使用适应度一词。)这些事件对免疫系统有意义是因为它们告诉免疫系统该如何应对,以提高生物的适应度—对于蚁群、细胞以及其他生物的信息处理系统也是一样。

聚焦于适应度是我理解意义的概念,并将其应用到生物信息处理系统的一条途径。

科学上许多最基本的思想都是由技术进步促进。19世纪的热力学研究就是由改进蒸汽机时遇到的挑战驱使。而数学家香农( Claude Shannon)发展信息论也是受 20世纪的通讯革命推动,尤其是电报和电话的发展。

人们有时候将香农的信息量定义描述为接收者在接收信息时体验到的“平均惊奇度”,其中“惊奇”意指接收者对于发送源将要传送的信息的“不确定度”。