联系是普遍的,网络无处不在。网络其实是大量的复杂系统的研究的骨架。复杂系统就是指一个系统当中有很多的子系统,有很多的元素,这些元素是相互联系在一起的,而这个联系又不是通过类似于随机网络或者说规则网络来描述的。
为什么这么说?因为所谓复杂系统就是指一个系统当中有很多的子系统,有很多的元素,这些元素是相互联系在一起的。而这个联系又不是通过类似于随机网络或者说规则网络来描述的。
所有的这些网络科学的其他的概念,以及前面所讲的例子,到底研究具体工作是怎么做的,那些细节怎么办?巴拉巴西写了他的第三本关于网络科学的书,就叫《网络科学》。
这本书里头,除了补充上面两本书里头的研究工作例子的细节,以及补充更多的网络科学当中的研究方法以及概念之外,《网络科学》这本书里头,它的精神是什么?它说了一些非常非常重要的思想性的东西。第一个当然就是联系是普遍的,网络无处不在。这个已经通过第一本书看见了。那么第二个,他说网络其实是所有的,我不应该说所有的,但是是大量的复杂系统的研究的骨架。
为什么这么说?因为所谓复杂系统就是指一个系统当中有很多的子系统,有很多的元素,这些元素是相互联系在一起的。而这个联系又不是通过类似于随机网络或者说规则网络来描述的。所谓规则网络,也就是说我每一个人连着几个是定的,这种比如一个环上的,一个正方形格子上的等等这样子的。一旦你的连接方式突破这些规则方式,也突破这个随机方式。那么剩下你就要去问这样的东西该怎么研究了。那么复杂系统里头,你就会发现大量的子系统或者大量的系统内的元素,它们的相互作用方式,都是突破这些规则和随机连接的方式的。
所以第一个非常非常重要的视角是,网络其实是复杂系统研究或者复杂系统描述的骨架,这样他就把整个网络科学放在了一个复杂性研究的学科里的非常非常重要的地位。比如说具体的例子来说,你可以说考虑一个,比如说大脑,当然我们知道我们很多时候搞不清楚思维是怎么形成的,其中一个关键的地方是什么呢?就是因为在大脑里面,我们所要考虑的相互联系在一起才能完成某一个行为的这样的一些子系统。它的规模一般来说都比较大,而且更重要的事情是大多数时候,这些子系统相互之间是如何联系在一起的我们不太清楚。
目前已经画出来的大脑当中各个子系统相互连接的系统,就没有几个。那当然如果我们想搞清楚大脑是如何做决策的,思维是如何形成的,第一步要搞清楚的就是这个系统里面有多少个元素,这些元素是如何联系在一起来完成某个功能的。网络科学这本书的第一章导言,也就是沿着这样一个主题和沿着这样一个思路给你介绍一些例子,除了我刚才说的大脑的例子,比如说你还可以考虑细胞内的化学反应的例子。也就是说人的生命的基本的行为是由细胞内的化学反应。
这些东西我们研究清楚了,才能知道生命过程是什么样子的。而细胞内的化学反应它有很多很多个,不是一个,它有大量的反应物和产物来参与。那么除了这个化学反应的网络,这个跟人的生命过程有关的,还有一个什么样网络非常重要,就是蛋白质相互作用的网络。什么样的蛋白质它和什么样的其它的蛋白质在物理上是相互连接在一起,或者相互接触,从而实现某一个特定的功能的。这样的过程也会跟你的生命过程有关系。
那一旦你研究,比如说类似于疾病这样的问题,你显然要搞清楚蛋白质网络和化学反应网络,你才能研究这个类似于哪一种基因,决定了哪个疾病,或者哪一对基因合起来才决定哪一个疾病,或者哪一种蛋白质是哪一种疾病的治疗方式等等这样的问题,所以这个联系的角度来讨论问题,并且大多数的多个体的相互作用的系统的问题的讨论方式,都应该从这里开始,是一个非常有价值的信息。从我个人来说是非常同意这个看法的。我是做复杂性研究的或者说我是一部分时间做复杂性研究的。
我发现大多数时候,在我所讨论的复杂性的问题里头,我需要做的第一步事情就是搞清楚这个系统里头有哪些元素,每个元素如何联系在一起。除了网络是复杂性研究的,除了网络是描述复杂系统的骨架这个核心的观点之外,还有一个在这本书里头非常强调的视角是什么?就是什么是网络,也就是什么是网络的精神?网络的精神第一是需要从一个孤立的系统,也就是没有相互作用的系统变成一个有相互联系的,就是内部元素之间有相互联系的系统。
所以从无相互作用到有相互作用,第二从相互作用的直接的效应到相互作用的间接效应,这是网络的精神。在推荐前面的书的时候,我们就讨论到了这个普适性的问题,一个学科要成为科学,除了精神和方法之外,普适性也是一个很重要的问题。那么普适性在网络科学里头的意义,就是指第一很多很多问题可以通过网络这样一个角度来描述;第二,当一个问题转化成网络的描述之后,从网络这个结构开始提出来的那些量具有描述能力;第三,你通过这样的分析方法,得到的这个系统的行为具有一定程度上的共性。
于是,下面这本书的其他的章节,它就会逐步的来完善和介绍这样一些共性。所以如果你有足够高的悟性,又没有时间,那你干什么?你看完这本书的第一章,你就基本上知道了这本书的主题。这本书将来要说的主要的内容是什么?第二章在做一件什么事情?就是说在网络这样一个基本结构里头,第一是如何描述的,所以这个叫做邻接矩阵的东西非常的重要;
第二,有哪一些基于邻接矩阵可以定义出来的量,具有普适的描述能力?比如说“度”,比如说最短距离,比如说集聚系数,比如说我刚才说的介数等等,这些量是如何定义,如何计算的,又如何在实际的问题当中发挥作用的,具有实际问题的描述能力的?而且通过这些量去运用,有没有发现在实际问题当中、具体系统当中,你可以发现有共性的表现?比如说当你用“度”这样一个东西去分析大量的实际系统,你就发现什么?很多实际系统的“度”分布是符合幂律的,当然也有很多它不是。
然后第三章,就是介绍了一下整个网络科学发展的历史,比如说随机网络的模型是什么样子的,随机网络的静态统计量有哪一些,这样一些东西在和实际系统做对比的时候是不是相符的。然后网络科学的下面三章,四、五、六三章就相当于对于前面那两本书里面牵涉到的什么是幂律,什么是无标度网络,什么是小世界,这样的东西以及什么是具体BA模型的细节是什么。为什么节点增长和偏好依附在BA模型知识当中是重要的,以及BA模型如何可以做进一步的推广和调整,来描述更多的现象做了展开。
这个时候如果你真的想用网络科学这样一个工具来描述和研究你所面对的问题,那学习这样一些具体的概念就是非常有帮助和有必要的。接着,第七章描述了一个事情是这样的,就是很多时候我们前面所说的模型,都没有考虑度度相关的问题,所谓度度相关的问题就是一个高度的顶点,是不是它通常各一个高度的顶点联系在一起的,还是说它通常倾向于选择那些低度的顶点相互联系?这样的选择上的,就是非随机性在实际的系统当中是很普遍的。比如说如果是一个人类社会的系统,比如说人类社会关系的系统,例如电影演员,例如朋友,很多时候是那些有名的人,他经常喜欢跟有名的人交往。
有很多朋友的人喜欢跟有很多朋友的人交往,可是在很多技术网络当中,比如说你需要构造一个internet路由,你需要去设计一个好的电网,或者好的运输网络,那么这个时候没准不是把度跟度高的连在一起更合适,而是把一个度高的和一个度低连在一起可能更合适。这一章就讨论了这种度度关联在现实当中是什么样子的。那一旦我们把模型当中以度度关联之后,对于整个模型当中描述的量会产生什么样的影响,那引入度度分布这样的事情,在哪些问题上可以增加我们对于现实的了解。
然后由于我一会儿要提到的逻辑关系的问题,我先跳过第八章,先说一下第九章。第九章讨论了一个什么问题呢?就是网络的粗粒化的问题。就是如果你面对的个体,它超过了一个很大的规模,比如说几万的顶点,甚至几千的顶点,那么你不可能很清楚的去把握每一个顶点它的具体的行为。这个时候,你更希望看见的事情是什么?看见我大概可以把这样一团顶点当成一个,说它们其实是内部联系相互紧密的,它们的行为其实比较粗糙的来说,可以有一个顶点代表,而其他的那一团又可以由另外一个顶点来代表。这个就叫做粗粒化。
而这个粗粒化的过程怎么做的?就是研究网络上的集团,就是看哪一些顶点,它内部的联系远远超过这些顶点跟外界的联系。那一旦这样的集团结构能够发现,就会很大程度上帮助我们对网络有更好的把握。当然实际问题当中用什么方式来研究,来发现这些集团,用什么方式来检验你发现的集团等等这样的问题都是很重要的,要了解细节就得去看这样一章。
我把前面这几章放在一起,叫做网络的静态性质,或者静态统计量。就是给了一个网络之后,就来看或者所谓给了一个网络,按照我们前面说的数学定义,就是给了一个谁跟谁连在一起的,一个叫做邻接矩阵的东西。有了它之后,我们可以做哪些分析,定义哪些量,这些量有什么样的描述现实的能力?这就是整个网络科学里头应该说一大分支的研究,就是网络的静态属性。
第二个问题是网络上的,我其实把第五、第六章网络本身的演化模型也放在了一起,也就是网络的静态量,网络的演化模型。那么还有一部分是什么?叫做网络上的动力学过程。也就是说把网络当成现实世界的舞台,是看这个舞台性质的不一样,会造成这些演员的行为发生什么样的变化。
这个方面有一个非常有意思的典型的研究是什么?就是网络上的传染病。在传染病研究里头,有一个有趣的现象,叫做阈值,也就是说如果这个传染病开始发生,仅仅在离散的少数人身上发生,你可以发现只要这个系统当中存在着一定程度上的,对传染病的抑制,比如说这些人会死掉,或者过一段时间之后,这些人如果不死掉也会自然好等等这种抑制,那么将来这个传染病是不会大范围流行起来的。也就是说这个被传染的人跟整体的人类这个population,整体的人类大小相比,是一个很小很小,可以忽略不计的量。
这个所谓的初始需要多少人感染才能突破这个,才能形成大范围的传播的这个初始感染的人的大小,就叫阈值。之前的研究,大家就发现在规则网络和随机网络上,这个阈值是可以算出来的一个量,可是有一个研究就发现,在一个符合幂律分布的,具有小世界效应的网络上,如果你仍然来讨论这种传染病的传播方式,你发现这个阈值是不存在的。也就是说基本上只要是有很少很少的人感染,它将来就会在这个网络上形成一个有限大小的被感染的集团。
所以网络的结构,也就是舞台的属性的不同,就算你是同样的演员,同样的决策方式,同样的传播方式也会造成行为上的不同。这就是另外一部分,就是网络上的动力学过程研究的主要内容,沿着这个思路还有一个主要内容是什么?就是网络的演化和网络上动力学过程放在一起的演化。这个放在一起的演化,比如当你考虑传染病的时候,一旦有传染病那个人假设真的死了,那么原则上他就应该在舞台当中把这样一个点也剔除,这个就叫做共同演化的问题。
这样一个问题,在目前这本书里头并没有写进去,还有很多其他的没有写进去的,比如说kcore的分析方法,就是网络的核多大程度上我们可以找出来,这也是识别网络重要,顶点重要性的方法。所以这样一本网络科学的书,不是说它就覆盖了整个网络科学,它是告诉你网络科学大概是什么,是研究哪些问题的,这样一些问题体现了什么样子的精神。就是我刚才说的网络要从无相互作用到有相互作用,从直接的相互作用到间接的相互作用,网络要作为复杂系统描述的骨架。
然后联系前面两本书里的例子,我们就发现所谓的复杂系统,远远不仅仅是物理系统,大量的包含多个个体相互联系的,都可以当成复杂系统。所以这就回到前面爆发的主题,就是网络这样一个工具,它应该成为计算社会科学,或者说社会物理学这样一个,企图用物理学的方法和视角来描述人类行为,来描述整个世界的这样一个研究的基础。
作为这三本书的总结,我想最后把这三本书相互联系的地方再稍微强调一下。第一,事物之间是相互联系的,这个联系可以用网络的方式来描述;第二,我们现在的人类活动留下了大量的数字面包屑,这样子的数字痕迹,使得我们用这样一个复杂网络的方法,或者用物理学这样一种描述问题的方式和角度,来研究人类行为成了可能。同时,另外一个使得这件事情成为可能的是什么呢?是计算和计算机技术的发展。于是,我们下面要解决的问题就成了什么?成了如何去用这些数据来分析什么样的问题,在这里如何去用,也就是方法的问题。分析什么样的问题,也就是问题的问题。
这个时候我们发现什么呢?整个或者是你管它叫大数据科学,或者你管它叫计算社会科学,或者你管它叫社会物理学,在这个里头核心的问题是什么?是方法和问题。就是你想用数据来研究什么?你想如何来研究?这是核心的问题。
当然你会说如果万一没有数据那我们这些都是瞎扯,那当然也是。如果没有这些大量的数据,我们就不用去问后面的问题了,但是有了这些大量的数据,剩下的而且是更关键的问题,是方法和问题。
另外一个需要大家带回家的信息,除了我说过事物是联系的,联系可以用网络来描述,还需要注意的一个点是它的反面。这个反面就是我们总是需要在合适的地方切一刀,不能因为事物是相互联系的,联系是普遍的,我们就把所有的东西都当成一个整体来研究。这样的话,我们研究不了任何问题,因为你想研究的任何一个小问题,它永远和别的问题是联系在一起的。也就是说你必须要么研究整个世界,要么不研究。而在实际的问题当中,我们只要考虑到这些东西把它当成内部,其他当成外部就可以了,这个就是在合适的地方切一刀,就是联系是普遍的。但是在研究工作当中,我们总是要切一刀。
第二我们确实要讨论从个体变成整体的。因为个体之间有了联系,他们之间的行为就会有相互的影响,而一旦有相互的影响,就会出现整体的行为,而这些整体的行为没准不是任何一个个体所具有的。所以整体性非常重要。但是同时,也就是说从无相互作用到有相互作用,从相互作用的直接效果到间接效果,体现了整体性。
但是同时它的反面,也就是还原论,也就是往细的去切也非常非常的重要,如果你不搞清楚你这个元素,你这个子系统内部它包含的元素,它内部的子系统,以及内部的元素之间的相互作用,那么你就很难去把握这个子系统本身的行为。所以一个往下切分的还原的思路,和整体一样的重要。
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!
作者(译者)面对面为你讲解一本书的核心要义。
喜欢就下载APP试用吧!