杨钦元 博客

网络科学初探

最近翻阅了不少关于网络科学的书籍和视频,包括《网络、群体与市场》,《隐秩序》,《失控》,《大自然如何工作》,《链接:网络新科学》等,还有 coursa 上面的「复杂科学课程」。这是一门复杂而迷人的新兴学科,其研究基于计算机模拟和数学模型。但许多术语翻译成中文后难以准确表达其精髓,陷入「知识的诅咒」。此文借此一探网络科学中的几个关键模型和其相关思想,顺带讨论其更优美的中文表达。

什么是网络科学?

维基百科上定义:网络科学是从交叉学科研究成长起来的一个新兴的学术领域。致力于研究复杂网络的性质,并且应用这些性质去研究一些具有网络特点的领域,比如信息技术网络,计算机网络,生物圈网络,学习和认知网络,社会关系网络以及经济和金融网络。这个领域以数学中的图论为理论基础,从物理中的统计力学,计算机科学中的数据挖掘和信息可视化,统计学中的推断建模,以及社会学和经济学中的社会结构理论等学科和分之中汲取方法论营养。美国国家科研委员会(National Research Council)将网络科学定义为“研究物理,生物,和社会现象的网络化表达,建立针对这些象限具有预测效果的模型”的学科。

简单说来就是,网络科学是为各类具备网络结构的系统建模,并研究其规律的学科。

网络科学的术语

复杂网络

网络分为简单网络和复杂网络。一个班级的几十位同学可以组成一个简单网络,每个同学占据一个节点,同学之间的关系称为连接。这种少量节点与线组成的网络叫做简单网络。复杂网络则是由很多节点连接起来的网络,比如一个国家人口组成复杂网络,或者互联网站点的复杂网络。

如何才能称为简单,如何才能称为复杂?多少粒沙子合在一起才能称为一堆沙?阈值是多少?

自组织临界

自组织的意思是,一个系统会自发形成「稳定有序的层级结构」。

该理论认为,由大量相互作用成分组成的系统会自然地向自组织临界态发展;当系统达到自组织临界态时,即使小的干扰事件也可引起系统发生一系列灾变。

该理论提出者做了一个沙堆实验:他们让沙子一粒一粒落在桌上,形成逐渐增高的一小堆,借助计算机模拟精确地计算每在沙堆顶部落置一粒沙会连带多少沙粒移动; 初始阶段,落下的沙粒对沙堆整体影响很小; 然而当沙堆增高到一定程度,落下一粒沙却可能导致整个沙堆发生坍塌。

他们解释道:

沙堆一达到“临界”状态,每粒沙与其他沙粒就处于“一体性”接触,那时每粒新落下的沙都会产生一种 “力波”,尽管微细,却有可能贯穿沙堆整体,把碰撞次第传给所有沙粒,导致沙堆发生整体性的连锁改变或重新组合; 沙堆的结构将随每粒新沙落下而变得脆弱,最终发生结构性失衡——坍塌。临界态时,沙崩规模的大小与其出现的频率呈幂函数关系。

所谓“自组织”是指该状态的形成主要是由系统内部组织间的相互作用产生,而不是由任何外界因素控制或主导所致。所谓“临界态”是指系统处于一种特殊敏感状态,微小的局部变化可以不断放大、扩延至整个系统。也就是说,系统在临界态时,其所有成分的行为都相互关联。临界态概念与“相变”密切联系;相变是由量变到质变的过程,而临界态正是系统转变时刻的特征。

自组织临界还具备以下几种特征:

涌现

涌现这个词含义比较模糊,你就当作是火山爆发一样,突然喷出很多岩浆。涌现是在自我组织的过程中,所产生的各种新奇且清晰的结构、图案和特性。例如大脑神经元:大量神经元以某种自组织的方式形成大脑,然后大脑的功能就「涌现」出来了。

弱联系与强联系

指网络中节点与节点间的联系强弱。强联系,表示紧密和频繁的节点连接。弱联系,表示比较偶然和少有的节点连接。

结构洞

如图,图中如果没有B节点,则该网络会分成三个连通分量

结构洞

A 要联系 C ,则必须通过 B。如果两者之间缺少直接的联系,而必须通过第三者才能形成联系,那么行动的第三者就在关系网络中占据了一个结构洞,显然,结构洞是针对于第三者而言。

因此,个人在网络的位置比关系的强弱更为重要,其在网络中的位置决定了个人的信息、资源与权力。因此,不管关系强弱,如果存在结构洞,那么将没有直接联系的两个行动者联系起来的第三者拥有信息优势和控制优势,这样能够为自己提供更多的资源和回报。因此,个人或组织要想在竞争中保持优势,就必须建立广泛的联系,同时占据更多的结构洞,掌握更多信息。

小世界网络(六度分隔)

小世界网络中大部分的结点不与彼此邻接,但大部分结点可以从任一其他点经少数几步就可到达。若将一个小世界网络中的点代表一个人,而连结线代表人与人认识,则这小世界网络可以反映陌生人由彼此共同认识的人而连结的小世界现象。

关于小世界模型有个有趣的结论,也就是著名的「六度分隔」理论。你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。 六度分隔

无标度网络

无标度网络具有严重的异质性,其各节点之间的连接状况(度数)具有严重的不均匀分布性:网络中少数称之为Hub点的节点拥有极其多的连接,而大多数节点只有很少量的连接。少数Hub点对无标度网络的运行起着主导的作用。从广义上说,无标度网络的无标度性是描述大量复杂系统整体上严重不均匀分布的一种内在性质。

无标度网络的形成:

无标度网络的形成

随机网络

尽管连接是随机设置的,但大部分节点的连接数目会大致相同,即节点的分布方式遵循钟形的泊松分布,有一个特征性的「平均数」。连接数目比平均数高许多或低许多的节点都极少,随着连接数的增大,其概率呈指数迅速递减。故随机网络亦称指数网络。

随机网络

随机网络与无标度网络分布对比: 随机网络与无标度网络分布对比