首页 优秀范文 复杂网络分析

复杂网络分析赏析八篇

时间:2023-06-19 16:16:50

复杂网络分析

复杂网络分析第1篇

关键词:加权网络 权重 赋权方式

中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2013)05(b)-0013-01

近年来,越来越多的学者对复杂网络产生了兴趣,来自各个不同领域的研究者正对复杂网络的发展进行着密切的研究,复杂网络以及加权复杂网络的各种性质正逐渐被揭示出来。构建一种能较好模拟现实网络的复杂网络模型是每一个研究者的目标。

复杂网络经历了规则网络、随机网络、小世界网络和无标度网络几个阶段。在现有文献中大多数的研究都是针对无权网络的,但现实世界中很多网络都是各个连接间具有不同权值的加权网络,例如航空网、科学家合作网等就是典型的加权网络。加权网络能够对实际复杂网络的动力学演化特性提供更加真实、细致和全面的描述。因此,对加权网络研究的重要意义是显而易见的。

1 研究现状

复杂网络就是由节点和连线画出的一种网络。在考虑实际网络的时候,我们通常关心的是节点之间是否有边相连,而不考虑不同节点间连接的紧密程度—即边的权值。事实上,许多网络的节点间相互关系的强度是不同的,仅知道边的有无还不足以准确反映个体之间的关系和差异,此时就不能再将系统抽象成无权网络了,必须引入一个新的维度来描述和区分边与边之间的这种差异性。权重将提供更加细致的刻画,加权网络的研究就在这种要求下诞生了。事实证明复杂加权网络能够更贴切地描述实际复杂系统,提供了人们深入探索实际复杂系统特性和复杂行为的一个数学工具,也拓展了复杂网络在实际中的应用。

实际的许多系统都可抽象为加权网络,例如人际交往网络,对于传染病的传播,有无接触虽然起着决定作用,但频繁接触者和偶尔接触者被感染的几率应该不同。在科学家合作网中,任意两个科学家之间的合作次数是不同的,合作一次与合作十次对信息传播的贡献显然不一样,应用不同的边来表现两个人合作的亲密程度和思想传播的难易程度,此时就需要根据实际情况给每条边赋予权重才能反映出现实网络的特点。因此研究网络的权值问题是有必要并且是有意义的。

目前对加权网络的研究主要集中在网络静态统计特性、网络上的动力学特性和网络演化模型等几个方面。对于加权网络统计特性研究:除要研究拓扑结构之外,还需要分析在拓扑结构上的权值分布情况,以及引入权重以后网络几何量的重新定义和实证分析等方面工作。研究结果表明:在许多实际加权网络中,除了幂律度分布、平均最短距离小、聚类系数高这些无权网络所具有的基本特点外,点权和边权也遵从幂律分布。

对于加权网络上动力学特性的研究:加权网络将不同的边赋予了权值,必然会影响各种物理量如信息、流量等在网络上的动力学特性。Brau nstein等[1]引入了随机权值,研究了这种加权网络中权重随机性强弱对最优路径的影响。Crucitti等[2]基于网络上流量简单再分配过程,研究了加权网络关于一系列点(或边)瘫痪与失效的模型,指出负载量最大的节点受到攻击将会最大程度地降低网络的有效性,甚至使系统瘫痪,这对于具有负载广泛分布的Internet网和电力网等实际网络预防攻击是有重要意义的。

对于加权网络的建模研究:在加权网络中,模型的建立以及运用必须充分考虑各个网络节点和通路由于不同的实际权值所造成的网络总体统计特性的极大差异。最近,Zheng等[3]研究了随机分配权重的加权网络模型;Gao和Zhao等[4]首次提出了网络形成的机制源于系统的阶段平衡,这种平衡是确保新加入节点不能再通过改变自身的选择而获得更大的效用。

2 研究方法

(1)建立复杂网络模型。自然界中存在的大量复杂系统都可以通过形形的网络加以描述。比如人际关系网络:以人为节点,以“认识”为连线,全中国某一天的人口就组成一个复杂网络。在交通系统中,以地点表示节点,以公路、铁路或航线表示边而建立起来的公路网络、铁路网络和航空网络等等。这些关系网都可以用一个复杂网络的数学模型来表示。

(2)复杂网络的权值研究。采取一定方式给网络的边赋权值,计算并分析点权的分布规律。通常采取以下三种方式给网络的边赋权重:①常数权重:网络中每条边的权重均为常数构建的加权网络。②服从指数分布的边权重:假设边的权重服从指数分布,即,其参数为>0。③服从节点度乘积分布的边权重:设节点i与节点j的度分别为和,则连接这2个节点的边权重定义为:,其中可有效地调节节点强度大小。(3)加权网络的稳定性分析。可以采用选择性攻击和随机性打击的方法考察加权网络的容错能力和抗攻击能力,讨论网络的静态统计特征量的变化及特点。(4)实际应用。以现实世界的各个网络为例抽象出相应的加权复杂网络模型,并对其统计特性及动力学特性进行研究,得出相应分布规律,以指导实际。例如,公交站点网络,通过模型的建立及静态统计特征量的分析,可以给出缓解交通压力的方案,以指导实际。

3 结语

现实世界中的大多数网络都是加权网络,所以越来越多的人加入到加权复杂网络的研究队伍,研究其几何性质、形成机制、网络演化的统计规律、网络模型的性质以及网络的结构稳定性,并把它与真实系统结合起来。但由于目前对小世界网和无标度网相关的工作还相当有限,并且复杂加权网络已展示出比拓扑网络更广泛的统计特性,所以对于复杂加权网络的研究尚处于早期阶段,还有许多问题有待解决,许多方面要加强探索,许多相关课题值得进一步研究。

参考文献

[1] Braunstein L.A.Buldyrev S.V.Cohen R.et al.Optimal paths in disordered complex networks.Phys.Rev.Lett. 2003,91:168701.

[2] Crucitti P.Latora V.Marchiori M.. Model for cascading failures in complex networks.Phys.Rev.E,2004,69(4):045104.

复杂网络分析第2篇

互联网技术的普及和发展在一定程度上改变了社会模式和关系,人们更多地开始依赖互联网,同时,互联网也开始大量传播计算机病毒,并且种类变得更多,具备更强的破坏性,极大程度地威胁互联网的安全。相关学者和专家也大量进行分析和研究,不断更新杀毒、防毒技术。不同网络拓扑结构模式下,传播计算机病毒会出现不同的特征,以此,本文主要对计算机病毒传播的复杂网络模型作了相关的分析。

1均匀网络上病毒模型及其传播特性

1.1经典病毒传播模型

1.1.1 SI模型

网络病毒传播模型最开始建立的基础都是随机网络,SI模型是最早的传播病毒模型,假设上述模型存在感染状态(I)和易感染状态(S)2种模型状态,易感染模型会十分容易感染计算机,如果被病毒感染会极大程度变为永久性感染。因此,SI模型中只有一种计算机转变状态过程,就是把易感染变为感染状态,模型微分方程如下:

如果t接近无穷大的时候,i(t)会趋近1,也就是说,经过长时间以后,病毒会感染网络中所有计算机,此时不符合病毒感染实际情况,主要就是没有分析计算机从感染到恢复的情况。

1.1.2 SIS模型

在充分分析从感染计算机到计算机恢复以后的实际情况后,研究计算机病毒时合理加入SIS模型,上述分析模型中存在感染状态和易感染状态2种。类似于SI模型中的基本设置,但是在此基础上又增加了新的转换情况,也就是依据相应的传播概率感染计算机恢复成易感染计算机。此模型可以降低感染病毒的概率,增加治愈率。

1.1.3 SIR模型

SIS病毒分析模型没有实际考虑升级系统或者断开网络后被感染计算机形成病毒免疫,因此,相关专家学者提出了SIR计算机病毒传播模型,此模型中分为免疫状态、感染状态、易感染状3种状态,感染状态和易感染状态类似于SIS模型,只是新增加了升级系统或者断开网络后被感染计算机形成病毒免疫性能,不会被感染以及感染其他计算机。

1.2双因素模型

CliffC.Zou等学者提出了双因素传播模型,上述模型主要就是适当模拟Code red蠕虫传播过程。在研究此病毒的时候,需要考虑到2种影响因素:一是网络拥塞现象。快速传播的网络病毒会形成很大数据流量,从而导致网络拥堵,应该从其他方面来达到降低传播网络病毒速度的目的。二是抵制病毒行为。例如升级系统、查杀病毒、安装过滤器、断开网络等能够在一定程度上降低传播病毒的速度。在模型中需要相互联系相关计算机,从而出现完全无向网络,所有时刻的任何计算机都存在免疫状态(R)、感染状态(I)、易感染状态(S)3方面。模型中的所有计算机彼此相互直接联系,所形成的是一个完全无向网络。其中每个计算机在任何时刻都处于3个状态之一,即易感染状态(S)、感染状态(I)、免疫状态(R)。但是仅仅只是存在2种转换状态,SR或者SIR。

1.3随机常数传播模型

模拟Code red病毒爆发过程的随机常数传播模型是Staniford等人提出的,模型分析中假设的是无向完全连接图的互联网,网络计算机总数是常数N,t时刻感染计算机的实际比例是a,Na就是计算机感染数目,平均初始感染率为K,也就是在单位时间内计算机主机被感染攻击的数目是常数K,也就是合理通量化网络带宽和计算机处理速度差异。在单位时间内,计算机主机会被Na个被感染计算机依据K的速度感染,实际上单位时间内被感染的主机数目是K(1-a),单位时间新感染计算机的数目n表达式是:

现阶段,主要寻址方式就是IPv4,具备232大的IP地址空间,Code red蠕虫会适当随机扫描地址,因此,不可能在相同计算机上同时扫描地址。也可以发现感染速度和数目没有关系,只是依靠平均感染效率。

1.4间隔模型

分析计算机Code red蠕虫与Slammer蠕虫合理应用随机扫描方式,Slammer是在UDP基础上实施进攻的,不用建立相应连接,但是Code red主要就是在TCP基础上攻击的,需要事先建立连接。因为网络带宽的限制,Slammer不能全速传播,不适合所有病毒结构。对比RCS模型理论估计值以及Slammer蠕虫扫描增长过程,可以发现只有Slammer蠕虫刚开始扫描增长的时候符合RCS模型,此时具备最大扫描速度的Slammer蠕虫扫描。1800s以后实际数据和相关模型之间存在极大差距,降低增长速度。因此为了可以更加细致地分析传播Slammer蠕虫的特性,考虑结点的带宽,从而提出了间隔模型。此模型能够有效分析刚开始攻击的时候,Slammer蠕虫不断增加速度以及突然降低的因素。基本表达式如下:

2非均匀网络上病毒模型及其传播特性

2.1含拓扑结构因素的病毒传播模型

经过多年的分析和研究,不少学者不再局限于病毒模型建立在均匀网络中,开始研究病毒传播过程中网络拓扑结构的影响。由于不同程度的连接率,相同感染的计算机会不同情况地感染其他计算机,所以,形成了含拓扑结构因素的病毒传播模型,存在k个连接度感染计算机的数目:

可以发现计算机具备越大的连接度,就越容易被感染,并且,因为存在很大度的结点,如果被感染会极大程度上威胁整个网络安全,因此,需要在分析病毒传播的时候加入网络非均匀性,对于没有标的网络来说,结点概率就是:

2.2电子邮件传播模型

相关专家学者认为电子邮件病毒属于特殊的存在,不能依据传统的病毒模型来分析电子邮件病毒。主要就是由于传播电子邮件病毒的根本就是依据电子邮件用户联系建立的网络逻辑结构,上述逻辑结构具备一定无标度特性,所以,专家学者建立了电子邮件传播模型,在实际分析的时候,电子邮件属于无标度网络结构,并且模型中也合理分析了使用邮件的基本特征,所以,使用邮件人员会定期检测邮件,如果收到相关病毒邮件的时候,人们可能出现警惕,删除病毒邮件,但是也有人员会毫不犹豫地打开邮件,在运行或者下载病毒附件以后,会立即感染用户计算机,并且会向邮件好友发送相关病毒软件,基于此,需要从两方面分析电子邮件传播模型:一是用户打开病毒电子邮件的实际概率;二是电子邮件用户定期检查的时间间隔。相比较其他网络来说,拓扑结构网络能够更加方便病毒的传播,主要就是由于存在差异很大的网络无标度结点度数,极易感染高连接数的结点,并且形成极大反应。

复杂网络分析第3篇

关键词 复杂网络 软件体系 程序分析

中图分类号:TP3 文献标识码:A

0前言

网络信息技术的飞速进展,促使人们的各项生活不断的自动化、智能化、信息化、现代化,这在很大的程度上推动了国内经济的发展。基于复杂网络之下的Java程序分析工具之中,其JPAC的运用,合理有效的提升了Java软件体系的可靠性、稳定性以及高效率,有效的推进了现代化软件产业的持续发展。

1 JPAC工具原理及整体结构

1.1 软件体系结构

JPAC工具最主要的目的就是为Java软件的相关体系结构构筑复杂网络。Myers其定义了一个可以代表相关的软件体系结构网图,也就是软件协作图(SCG),其与UML中的类图非常类似。可以进一步把SGG进行细化为了可以描述Java软件体系结构的JavaSCG。如图1,简单JavaSCG构建实例。

图1 简单JavaSCG构建实例

把其构建的JavaSCG作为是可以代表Java软件体系结构的对应网络,能够对相关的网络特性实行详细的分析。网络级特性也就是代表了全局特性,这些特性合理的反映了Java复杂软件体系中对应复杂网络情况。

1.2 软件体系结构演化

复杂网络也还具有一定的演化特性,依据复杂网络的演化模型演化相关的网络,并且在相关的演化之后依然具备复杂网络特性。

图2 基于模块软件的演化模型演化过程

有研究人员把复杂网络演化概念应用至软件体系结构中,并提出一种基于对应模块的软件演化模型。该演化模型合理的模拟了软件体系结构的复杂网络特性形成的全部过程,并且和复杂网络的相关演化一致,软件体系结构会依据该模型的对应演化,从而得到的网络仍然具备复杂网络的相关特性。如图2,为该模型的具体流程图,P1、P2、P3代表了相关的过程被执行概率,在进行新边链接时考虑了其相关的软件结构模块的存在。

1.3 工具整体结构

考虑到前两小节所述,JPAC工具是应合理的实现Java程序相关代码实行分析,并为相关的Java软件体系结构构件复杂网络的相关功能。并且对构件好的相关复杂性网络,展开复杂性网络特性合理分析,有效的显示软件体系结构复杂网络的相关特性,并进行合理有效的软件结构演化规律。与此同时,JPAC工具也能够提供较为抽象化的复杂网络,促使人们能够对其相关的特性及演化规律展开模拟性研究。所以,可以把JPAC工具的相关功能依据对应层次展开划分,主要可以分为三个层次的模块:

(1)数据分析层

其是相关工具的最底层,主要是和Java的代码文件或者是XML文档展开对应交互,并封装了Java的代码以及XML文档至相关的网络计算所表示的构建过程。其能够不依靠于高层数据运算层及用户界面层的相关存在,所以对应的用户能够依据其需要来增加数据分析层所需要的各类对应功能。

(2)数据运算层

其有效的呈现了依据数据分析层所提供的相关网络功能运算,例如,统计分析和演化模拟运算。该运算是指对相关的网络计算机的表示实行对应操作以及计算。数据的运算层可以进行一定程度的扩展,属于可扩展层次。

(3)用户界面层

用户界面层是处在最上层的,其是负责把相关的网络计算机表示呈现为可视化,把其运算的结果可视化,并为用户提供可靠的操作等。

2 基于复杂网络的Java程序分析工具设计

对于JPAC工具设计来讲,依据JPAC工具结构可以将其分为三个层面,数据分析设计、数据运算设计以及用户界面设计,以合理有效的呈现JPAC对Java的系统软件运用复杂网络进行构建,也就是进行JavaSCG的构建。

2.1数据分析设计

在对应的数据分析中,数据分析层则主要包括了Java代码以及存取XML文档、计算机网络的内部网络功能从而生成三个主要的功能,在JPAC工具的相关设计中可应用BCEL技术来实行字节的码文分析以及DOM技术对XML文档分析,其能够构建相对应的网络,并且对其储存,提供给较高层运用。对于数据分析层来讲,其有五种类图来同步完成相关数据分析层的功能支持。ProgInput是属于抽象类图,能够对Java相关的文件实行读入以及解析操作,以有效的呈现Java文件的相关解析;XMLParse则是应用DOM技术对XML文档实行一定程度的解析,进而合理的呈现XML文档的对应读入及保存;DataLayer是较为抽象的一种图类,其可以用于相关的保存构建网络;JavaBinDataLayer是具体化类图,其应用于保存Java体系的结构构建网络;RandomDataLayer属于具体化类图,其用于随机网络的保存。

2.2 数据运算设计

在JPAC的相关工具设计过程中,是基于JavaSCG的相关构建,数据的运算层能够实行多种运算,并且依据实际用户的各种需求来实行功能的扩充,所以,JPAC工具的相关数据运算层能够实行一定的统计分析以及演化模拟运算。

2.3 用户界面设计

在相关的JPAC工具中,对应的用户界面设计是应用EdlipseRCP框架,其运转的速度较快以及相对应的功能强大、可扩展等特性,属于RCP在Eclipse上所研发的一种客户端的运用平台。其开发了对应的插件功能,依据客户的不同需求,来呈现JPAC的扩展。因为Eclipse以及Java具备一定的跨平台功能,所以,JPAC工具能够在多种平台之下运行。

3 复杂网络环境之下的Java程序分析功能实践

Version1.5JDK为例,运用JPAC工具的相关复杂网络统计特性来展开计算。经过对V1.5版本的JDK之中的Java包分析而获得,其网络的中心节点读书较大,并且在中心周围也会分布着些许度数较大的相关节点,小节点主要分布在网络的周边,这充分的显示了无标度特点的相关迹象。依据上述分析可得,JDK系统结构的网络是具备小世界的对应效应以及幂率度分布特性,这就证明复杂网络的特性是在JDK的体系中所存在。

因为JDK体系是最常见的Java软件体系,所以,相关的定义上可以说明复杂的网络之下Java程序的分析工具有着复杂网络特性。并且,经过应用、探究以及分析,能够得到Java软件体系也是具备一定的演化特性,这能够为软件研发人员提供可靠的研究依据,有效的促进软件的研发技术水平持续提升。

4 结语

近些年,信息化的不断进步促使网络化环境逐渐的变得复杂,提升软件对于相关体系的合理支持、管理以及维护,就成为了当下各类软件开发的重点。想要更合理有效的进行软件开发,复杂网络的有效管理,软件的开发人员依据其相关网络特性、性质、变化,合理的提出Java程序的对应分析工具,这样有效的推进Java程序代码分析与复杂软件体系的研究。

Java工具研发以及运用,提供了复杂网络环境为Java软件体系,促进对Java软件的相关体系网络特性及变化规律展开深层探究,推进Java软件体系基于复杂网络之下的探究能够持续探究并创新。

参考文献

[1] 陈焘,李孔文,王树森,顾庆,陈道蓄.基于复杂网络的Java程序分析工具设计与实现[J].计算机科学,2013(4).

复杂网络分析第4篇

〔关键词〕复杂网络;微博用户;行为;小世界特性;关注;非均匀网络

DOI:10.3969/j.issn.1008-0821.2013.09.007

〔中图分类号〕G202〔文献标识码〕A〔文章编号〕1008-0821(2013)09-0035-09

伴随着移动通信技术的不断发展,移动互联网日趋成熟,为微博的发展提供了发展契机。Twitter是产生最早的微博,据Semiocast的数据调查数据显示,截至2012年12月,Twitter用户数达到517亿,成为仅次于Facebook的全球第二大社交网站,其中141亿美国用户;2012年6月,Twitter用户一共消息1058亿条[1],这个信息量是任何一家媒体,无论是传统媒体还是网络媒体,都无法企及的。目前国内较具代表性的微博主要以门户网站为主,如新浪微博、腾讯微博、人民网微博等,它们依靠网站自身的影响力与巨大的用户群,几乎占据了微博的全部用户,有着较大的影响力。据中国互联网络信息中心的最新报告,2012年12月底,我国微博用户规模为309亿,其中手机微博用户规模达到202亿,手机成为微博用户的首选终端,微博逐渐移动化发展[2]。

自2005年Twitter出现后,学术界关于微博行为的研究的不断增加,对于用户行为、用户关系、用户兴趣等都进行了较为深入的研究,也取得了较多成果。麦田(2009)认为,以Twitter为代表的微博信息平台能够成功的主要原因有:可迅速的内容,可迅速的网站结构以及病毒式的信息传播[3]。所以,微博自身的信息传播模式的便利性与快捷性对于用户来说吸引力是极大的。彭兰教授在《微博发展的动力》(2009)中指出,微博的发展除了来自微博形式的自动力外,还有来自微博用户需求的拉动力和微博社会功能的主动力[4]。实践方面,主要研究微博用户行为的动机,以及其对微博用户行为的影响程度,在此基础上对微博用户行为的表现进行预测,以及微博用户行为对兴趣构成和购买行为的影响;理论方面,主要运用相关的理论基础来解释微博用户行为,并通过一些实证研究对用户行为的具体表征进行统计分析。

基于复杂网络和社会网络的理论研究微博是近年来的一个热点,它能够较好的解释微博用户的信息、评论、转发等行为所呈现的网络关系,也可以从中挖掘出关键用户,可以较好的反映出用户之间的关系,并对用户行为进行预测。李林红和李荣荣认为,新浪微博社会网络是一个自组织系统,从整体网络、个体网络、小团体、小世界效应构建模型,通过实证研究考虑用户在信息“、转发、评论、@、回复”之间的关系,认为微博中存在自组织行为,通常整体的自组织现象弱,局部明显,而且这种关系的形成往往依据用户角度的不同,形成的自组织网的凝聚力也是不同的[5]。易兰丽(2012)利用人类动力学和复杂网络的相关理论,从网络互动的角度出发,对用户的信息、转发和评论行为进行统计分析,了解三者之间的关系,并建立用户信息评论模型和兴趣驱动模型,对微博用户的行为做了较详细的分析[6]。

从以上的分析可以看出,研究者主要是通过直观的静态分布的网络形态表现用户在关注、评论和转发方面的特征,大多是从数学和技术方面考虑,较少地考虑社会因素和用户因素。本文以复杂网络的基本统计特性为基础,以新浪微博为例,通过抓取相关数据,对其进行处理分析,对微博用户的关注行为和转发评论行为的网络特性进行分析,提出微博网络是典型的小世界网络;微博网络较为稀疏,但也存在部分密集的社群,即微博群体;微博网络是一个不均匀的网络,在信息传播与分享方面存在较大的信息不对称。

1数据获取与处理

通过新浪微博的最新数据报告可知,目前新浪微博的用户已超过4亿,同时在腾讯微博、人民网微博等平台上也拥有大量的用户;但在用户总量、活跃用户数量、微博影响力与代表性方面,新浪微博有着显著的优势。所以本文选取新浪微博中的数据作为研究样本,以期能够较好的反映微博的复杂网络特性,完整地呈现微博用户行为的基本特性。

目前获取微博中的数据有两大主流方式:一是通过新浪微博开放端口,利用API平台获取。这种方式获取较为简洁、方便、高效,便是数据数量有一定的限制;二是网络爬虫。通过设定的URL地址,按照一定的爬行策略抓取信息,这种方式获取的信息数量大且全,但是较为繁琐,且效率低,后期数据处理难度也较大。所以本文通过新浪的API平台抓取数据。

本文采用滚雪球抽样的方法,选中其中一个节点,对其粉丝的信息进行抓取,再对粉丝的粉丝信息抓取,持续若干轮,共获取节点信息65 536个、100万余条用户关系信息、10万条微博信息等。抓取的用户信息内容主要包括:用户ID、昵称、姓名、省、市、地区,个人描述、URL、图像URL、性别、粉丝数、关注数、收藏数、创建时间、是否加V、是否允许定位等用户的基本信息,用户评论信息主要包括:评论ID、评论内容、来源URL、方式、时间、者ID、评论者ID等基本信息。微博内容信息主要包括:内容ID、创建时间、具体内容、来源URL、方式、收藏数、时间、者ID等基本信息。以这种方式获取的微博数据使一些孤立的节点和“僵尸粉”也被囊括其中,使得网络密度可能较稀疏;但在很大程度上反映了微博的整体特性,无论是活跃用户,还是僵尸粉,都是分析数据的组成部分。

在进行实际分析的过程中,为了确保分析的准确性和真实性,剔除无效信息后,对获取的64 961条信息进行基本分析。在数据库中,选取1 021个关注信息,组成关注矩阵,对其关注行为进行分析;提取1123*386的微博评论矩阵和1122*537的微博转发矩阵,对微博用户的评论转发行为进行分析。

2微博用户行为的复杂网络特性

2.1小世界网络特性分析

小世界网络最基本的特征是有较短的平均路径长度和较大的聚类系数。用N表示节点数量,dij表示节点之间的最短距离,那么网络平均路径长度的计算公式如下所示:

L=21N(N-1)∑N-11i=1∑N1j=i+1dij

另外,假设节点i与其他Ki个节点都相连,如果这Ki个节点也相互连接,那么它们之间应该有Ki(Ki-1)/2条边;但这Ki个节点之间实际存的边数只有Ei,那么二者之比即为聚类系数Ci,用公式表示如下:

Ci=2Ei1Ki(Ki-1)

复杂网络分析第5篇

[关键词] 传染病 复杂网络 小世界网络 无标度网络

艾滋病自1985年传入我国,历经传入期和扩散期,现已进入快速增长期。据专家估计,如不采取积极有效的措施,到2010年我国艾滋病病毒感染人数将达到1000万,社会经济损失将达到或超过77000亿元(约9000亿美元)。以艾滋病为例,结合我国以前爆发的SARS、禽流感等大规模传染性疾病,尽管它们的病理都存在一定的差别,但是随着对传染病传播规律认识的深入和相关知识的积累,研究者们发现它们在传播机制上存在一定的共性。

对于传染病的传播,传统理论的主要基本假设是把社会中人与人的关系看成规则网络,传染病的早期模型是基于规则网络而提出的。但是,随着人际沟通和商业贸易活动的显著增多,此模型已经不能很好地反映传染病的实际情况,一个更好的替代是从复杂网络的角度来理解传染病的传播。复杂网络是由数量极大的节点相互联结而成的,现实世界中可以找到很多复杂网络的例子,如互联网等。社会网络也是一个典型的复杂网络,每个人都成为这个网络中的一个节点,而人与人之间的接触和交往形成了复杂的连接关系。像艾滋病这类高传染性的疾病,其传播的基础是社会网络,因此应该基于复杂网络来阐释传染病的传播机理并制定相应的政策措施。

一、复杂网络理论的研究状况

刻画网络的特征需要涉及到两个主要指标:一是网络的平均距离L,一是网络的群聚(团簇)系数C。通常网络中的两个结点可以通过一些首尾相连的边连接起来,把连接它们所需要的最少的边的数目称为它们之间的距离,对所有节点的距离求平均,就得到了网络的平均距离L。而群聚系数用来衡量结点集聚成团的程度。对于某个结点,它的群聚系数C定义为,其所有相邻结点之间连边的数目与可能的最大连边数目之比。类似地,网络的群聚系数则是所有结点群聚系数的平均值。规则网络具有大C和大L,随机网络则具有小C和小L。

实证结果表明,大多数的真实网络具有小世界性(较小的最短路径)和聚集性(相对较大的聚集系数),规则网络和随机网络并不能很好展现真实网络的性质,这说明现实世界既不是完全确定的也不是完全随机的。

(一)小世界网络及其特征

1998年,Watts和Strogatz提出一个兼具小世界性和高聚集性的网络模型(WS模型),该网络模型介于规则网络和随机网络之间,可在规则网络的基础上加入随机性产生:对于规则网络依次选择每条边,按某一概率P将该边的一端随机地连接到网络的一个新节点上(见图1)。当P=0时为规则网络;P=1时为随机网络。对于0

复杂网络的这种小世界特性在现实世界中是普遍存在的。以人们的社交网络为例:每个人很自然的与他周围的人熟识,体现了高度的集群性;同时又有机会认识远方的人,体现了远距离连接的可能性。大量的实证研究表明,真实网络几乎都具有小世界效应。

(二)无标度网络的特征

1999年,Barabási和Albert提出复杂网络的无特征尺度(Scale-Free),通常简称为无标度特性。大量真实网络的节点度服从幂率分布。节点度是指一个节点拥有相邻节点的数目,节点度服从幂律分布就是说具有某个特定度的节点数目与这个特定的度之间的关系可以用一个幂函数近似地表示。因为幂函数具有标度不变性,所以称这种节点度的幂律分布为网络的无标度特性,该类网络叫做无标度网络。

现实生活中的复杂网络有很多是具有无标度特性的,如演员合作网、万维网和电力网等。在无标度网络中有些集散结点甚至具有数不清的连结而且不存在代表性的结点。这种网络具有可预期的行为特性。对意外故障具有惊人的承受力但面对协同式攻击时则脆弱。这些发现大大地提升了人们对复杂外部世界的认识。

二、基于复杂网络理论的传染病传播研究

随着网络理论研究的日益深入,将传染病的传播简单抽象为规则网络难以符合实际情况,复杂网络理论的研究给我们重新审视这一问题提供了新的视角。

复杂网络的最新研究成果――小世界网络和无标度网络,它们都同时具有两个基本特征:高平均集聚程度、小的最短路径。高平均集聚程度反映了事物在小世界的境况下自发走向有序的态势;而小的最短路径特征反映了演化速度快的特征。在Watts和Strogatz所研究的传染病模型中,其接触传染率为1,感染的顶点(可能是个体的人)在一个单位时间以后退出系统。对于任何网络,这样的传染病都将在整个网络扩散;他们的研究发现,对于从规则网络到随机网络的所有P∈(0,1)网络,其扩散时间刚好与最短路径一致。在这个传播模型上,任何一个顶点都同时向其所有近邻传播,如果集聚程度高,传播会更广泛。

另外,Moore等人研究了小世界网络中的传染病传播行为,发现传染病在小世界网络中的传播阈值明显比在规则网络中小,相对于规则网络,传染病在小世界网络中更适宜传染;Paster-Satorras等研究了在无标度网络上传染行为,结果发现,规则网络和小世界网络总存在正的传染强度阈值,而无标度网络中传染病传染的阈值却非常接近于零。

三、控制传染病的公共政策建议

现实世界在客观上是典型的复杂网络。艾滋病的爆发,提醒我们要对传染病的传播特性进行深入和细致的研究,从而为制定相应的公共政策提供参考。要成功控制传染病的传播,不仅要切实提高医疗诊断水平,还需要借鉴复杂网络的理论和观点,把疫情的危害降低到最小限度。

(一)迅速识别病源

在现实世界的复杂网络中,传染病传播可能只需要很低的传染阈值就可以快速传播,给公共健康造成巨大危害。因此,政府在应对危机时,采取控制措施的时间点越早,防范的效果就越明显。事实上,传染病危机的发生都是有预兆的。政府应在危机刚出现或者未出现之前,就迅速准确地识别病源,分析其产生的原因,以便采取有效的应对措施。

在具体操作的过程中可采用病源识别的案例分析法,即通过对已出现的传染病事件进行分析,将其出现时暴露的典型特征记录在案,以便今后作为借鉴。例如,对SARS疫情进行分析与研究就是为政府将来成功识别类似的传染病病源打下基础。病源识别的其他方法还有现场观察法、咨询法等。

(二)切断传播网络

因传染病以复杂网络为基础进行传播,基于复杂网络的特性,其传播速度之快、波及范围之广远远超出人们的想象之外。SARS疫情就有很多经验教训值得吸取。“非典”自出现以来,通过四通八达的航空网络和其它各种运输工具,逐渐向我国及世界其它地方蔓延,最终导致疫情发展到比较严重的地步。因此,在确定病源之后,一方面对其进行治疗,但更重要的是进行有效的隔离,防止进一步的传染。

由于疾病感染者本身已成为传染源,会使得一些潜在的传染地点如医院,发生大规模的传染事件。为避免这种情况,对于疑似和确诊病人的可行措施是就地隔离,从而减少大规模传染的可能性。

另外,临床统计表明,由于职业的关系,医务人员成为最大的被感染群体,进而成为继发感染源;对医务人员的防护和对定点医院的封闭式管理成为控制疫情的关键。因此,应通过相关的法律、法规或行政命令,对相关医务人员进行严密防护,定点医院实行封闭管理;对病毒污染区一切可能的传染渠道进行彻底消毒,从根本切断传染病的传播网络。

(三)完善辅助配套措施

对传染病的预防与控制是一项系统工程,需要有多种配套措施的沟通治理。首先,需要建立一套完善的危机预警系统。对传染病的可能发生进行分析和预先判断非常重要,尽可能把这种危机消灭、化解在萌芽状态。危机预警系统的首要目标是把许多分散、零星的信息组织到一起,向风险防范指挥部门提供决策的信息基础。系统要全面地监测、跟踪传染病传播的动态,要特别注意那些有可能导致局部危机扩散的要素,建立相应的数据库系统。

其次,艾滋病之类传染病的传播是在全球范围内的进行的,其传播的网络基础是一个现实的复杂网络。这个网络的复杂性不仅意味着它是跨空间地域的,而且从政府管理的角度而言,也是跨职能部门的。因此,应对此类传染病的传播,既要加强国际之间的合作与交流,从保障全人类健康的高度来处置危机;同时,还要注重各个政府职能部门之间的协调配合,个别地区或个别职能部门的孤军奋战是难以取得成功的。

最后,与传染病同时传播的还会有各种流言,流言的传播也是藉由复杂的社会网络,处置不当也会带来公共危机,加剧传染病对社会的危害程度。因此,要做好与公众的沟通,充分利用大众传媒这样的公众沟通交流工具。当传染病危机突发事件爆发时,公众会比平时更依赖媒体。他们需要理解更多的相关信息,而新闻媒体是保障公众知情权的重要力量。传媒恰当的危机报道策略可以在很大程度上帮助政府处理好传染病危机,稳定民心,保持社会秩序的良好运转。

(作者单位:华中科技大学公共管理学院)

参考文献:

[1] 魏葳.禽流感的危机与商机[J].新西部,2004(3).

[2] 吴彤.复杂网络的研究及其意义[J].哲学研究,2004(8).

[3] 王,郑应平.基于复杂网络的疾病传播[J].科技导报,2005(5).

[4] 方锦清.迅速发展的复杂网络研究与面临的挑战[J].自然杂志,2005(5).

[5] 周涛等.复杂网络上传播动力学研究综述[J].自然科学进展,2005(5).

[6] 刘涛, , 陈晓荣.复杂网络理论及其应用研究概述[J].系统工程,2005(138).

[7] 林国基,贾,欧阳颀.用小世界网络模型研究SARS病毒的传播[J].北京大学学报(医学版),2003(1).

[8] 朱书堂,马远乐.“非典型肺炎”传播规律研究与建议[J].科技导报,2003(8).

[9] 任兆璋,贾肖明.SARS向我国政府危机管理机制提出挑战[J].改革与理论,2003(7).

[10] 邓宏永.从抗击非典看政府危机管理对策[J].湖北社会科学,2004(2).

复杂网络分析第6篇

关键词 武昌城区 交通网络 数字特征

中图分类号:U491.13 ;TU984.191 文献标识码:A

1武昌城区基本网络结构特点

我们所得到的网络是一个连通的整体,它是由194个相互独立的节点组成的。也就是说,如果用连线来表示两位节点之间有合作,则任意两个不同的节点之间有直接的连线或间接的连线。

在该交通网络中整个网络的度分布情况如下表1所示:

从表1中可以看出,整个网络平均度=3.299大部分的节点数度值都集中于2、3、4。其中,含4个节点的小组最多,有55个。

虽然度值最高的点和聚类系数大的点不一定是实际公交线路中的繁忙点,但是它们却是网络中取的交通规划中流通性最好的站点。在这些站点上如果发生交通堵塞时,公交网络受到的影响并不是很大,公交线路可以很容易的改变继续运行,即该公交网络也具有某种“鲁棒性”。由此可见,当这几个节点发生交通堵塞的时候,整个公交网络的流通性有了明显的下降;即某种意义上,该公交网络也具有“脆弱性”。

在该网络中我们分析了它的全局数字特性,那么下面我们来看看聚类系数与度之间有没有什么关系。(如表2)

我们由前面所给出的度分布可以看出,大多数节点的度值集中于2、3、4;其中,含4个节点的小组最多;而我们通过上表可以看到,尽管度值在4的节点的聚类系数都很低,但整个网络具有比随机网络更高的平均聚类系数,显示了比较明显的聚类效应。

下面我们从该网络中选取几个有代表性的子网进行一下研究:(选取的五个网络的数字特征分别如表3所示。

在这几个子网中,我们可以看到它们的全局效率比整个网络要高的多,聚类系数均高于整个网络的的平均聚类系数。这说明了这几个子网的流通性要比该整体公交网络要好。但我们也可以发现在E子网中,当节点137与节点138的线路堵塞时,该网络被分为两个网络,即该子网具有非常高的脆弱性。因此在以后的公交网络的规划中,我们应该注意在保持局部公交网络的效率不降低的情况下对整个网络进行改造,提升公交网络的整体效率。

2一个公交网络查询系统的开发

基于我们的研究结果,我们尝试开发了一个用于研究该交通网络结构与功能的工具查询系统,该查询系统界面如下图所示:

复杂网络分析第7篇

【关键词】复杂网络 无标度 小世界 统计特性 演化模型

一、引言

20世纪末,以互联网为代表的信息技术的迅速发展使人类社会步入了网络时代。从大型的电力网络到全球交通网络,从Internet到WWW,从人类大脑神经到各种新陈代谢网络,从科研合作网络到国际贸易网络等,可以说,人类生活在一个充满着各种各样的复杂网络世界中。

在现实社会中,许多真实的系统都可以用网络的来表示。如万维网(WWW网路)可以看作是网页之间通过超级链接构成的网络;网络可以看成由不同的PC通过光缆或双绞线连接构成的网络;基因调控网络可以看作是不同的基因通过调控与被调控关系构成的网络;科学家合作网络可以看成是由不同科学家的合作关系构成的网络。复杂网络研究正渗透到数理科学、生物科学和工程科学等不同的领域,对复杂网络的定性与定量特征的科学理解,已成为网络时代研究中一个极其重要的挑战性课题,甚至被称为“网络的新科学”。

二、复杂网络的研究现状

复杂网络是近年来国内外学者研究的一个热点问题。传统的对网络的研究最早可以追溯到18世纪伟大数学家欧拉提出的著名的“Konigsberg七桥问题”。随后两百多年中,各国的数学家们一直致力于对简单的规则网络和随机网络进行抽象的数学研究。规则网络过于理想化而无法表示现实中网络的复杂性,在20世纪60年代由Erdos和Renyi(1960)提出了随机网络。进入20世纪90年代,人们发现现实世界中绝大多数的网络既不是完全规则,也不是完全随机的,于是提出了一些更符合实际的网络模型。此时,国际上有两项开创性工作掀起了一股不小的研究复杂网络的热潮,一是Wats和Strogata[2]在Nature杂志上发表文章,提出的小世界模型(WS 模型)。该模型既具有规则网络的高聚类性,又具有类似随机网络的小的平均路径长度。二是Barabás和Albert在Seience上发表文章,提出了无标度网络模型(BA模型)。他们认为现实世界中大多数的复杂系统是动态演化的,是开放自组织的,实际网络中的无标度现象来源于两个重要因素,即增长机制和优先连接机制。

目前,国内外学者复杂网络的研究主要集中在三个方面:大量的真实网络的实证研究,分析真实网络的统计特性;构建符合真实网络统计性质的网络演化模型,研究网络的形成机制和内在机理;研究社会关系复杂网络,对企业网络的生长模型进行分析。

在复杂网络的结构特征研究方面,张明科等从复杂网络动力学角度,对BA模型进行扩展,构建了网络化战争中的复杂网络拓扑模型。李一宁、汪小帆提出了一种基于较大规模的底层网络生成较小规模的映射网络模型的算法。Richard G. Cleg等利用幂律模型对复杂网络的拓扑生成由此实现网络性能的改善。Jean-Loup Guillaume等通过定性结果的分析方法对互联网的拓扑结构的大型分布式探索。杨博等[6]利用网络簇结构的复杂网络聚类方法对复杂网络拓扑结构分析理解其功能、发现其隐含模式、预测其行为。

在复杂网络的演化机理方面,BA模型很好地在科学研究中体现了从复杂现象中提取简单本质的特点。Andrade根据古希腊数学家提出的阿波罗填充问题,构造了更为完美的阿波罗无标度网络模型。由于无标度网络模型与现实世界更为贴近,很多学者都对其进行各种扩展,如广义无标度动态网络模型、局域世界演化模型、多局域世界演化模型等。BA模型应用统计分布规律来描述复杂网络性质,说明了网络无标度性的出现机制。国内学者,如杨阳、关沫等对复杂网络的演化模型和统计规律进行了研究。苏凯等(2009)提出了一种灵活的加权复杂网络演化模型,该模型可以灵活的调整网络演化过程中各种演化机制影响作用的大小,控制网络规模和平均节点强度,能够动态的变化节点和连接状态。

复杂网络在社会关系研究中也得到了应用。陈亮[9]提出了企业生长模型,将其仿真结果与员工关系网络的经验数据比较,拟合现实企业员工的关系网络,并对该网络的演化进行分析,发现企业鼓励员工跨部门沟通、团队内部沟通将影响企业员工的关系网络结构。杨莉莉[10]在对犯罪组织进行图形化构建的基础上,利用社会复杂网络方法对犯罪组织关系进行挖掘。Ozgur通过收集的3000篇路透社的新闻文章,建立复杂网络分析新闻报道中的社会关系,发现具有小世界性和幂律分布等特性。Mori通过分析文本信息,对类似的实体进行聚类,自动提取实体之间的关系,构建社会网络。在研究社会网络和社会网络政治实体中,该研究取得了较高的精度和召回度。

三、结束语

近年来,复杂网络已经成为了不同科学领域(包括物理、生物、系统控制、计算机、通信技术、社会、经济管理等)中的学者们的研究热点。随着研究的不断深入,复杂网络在诸多方面都取得了丰硕的成果,如在复杂网络动力学性质、网络建模与拓扑结构、网络演化、网络涌现行为、复杂网络的鲁棒性与脆弱性等方面。本文从复杂网络的统计特性、网络演化模型以及复杂网络社会关系三个方面简述了最近几年在国际学术界引起高度重视的复杂网络理论的相关研究成果。总之,面对复杂网络这一全新而富有前景的领域,我们应该审时度势,结合国民经济发展需要,在相关研究成果基础上将其深入进行下去,为推动我国社会和经济的持续发展做出应有的贡献。

参考文献:

[1]汪小帆,李翔,陈关荣.复杂网络理论及其应用[M]. 清华大学出版社,2005.

[2]Watts D J,Strogatz Steven H.Collective dynamics of ‘small-world’ networks.Nature,1998.

[3]Barabási A L,Albert R.Emergence of scaling in random networks[J].Science,1999.

[4]张明科,陈政,于长军,朱荣花,权太范.网络化战争中的复杂网络拓扑建模[J].航天控制,2007.

复杂网络分析第8篇

      现阶段,有很多的复杂网络,诸如,万维网、互联网以及生物通信网络等,在这些复杂网络中具有很多典型特征,本篇软件工程论文介绍其中主要表现在以下几个方面;第一,网络结构的复杂性,表现在大量的网络节点和网络结构的多样性。第二,网络的进化性,主要是表现在网络节点的产生性。第三,网络连接的多样性,主要表现在网络节点间的连接权重存在明显的差异性,并且,很有可能存在方向性,这些都是当前复杂网络的重要特征。 

1 复杂动力网络的意义分析 

诸多的软件工程专家都表示,复杂动力网络的研究具有划时代的意义,例如,复杂动力网络在解决如何提升大规模网络的传输效率,不断增加网络的可信度和稳定性,以及避免恶意袭击和随机错误给人们所带来的经济损失等方面,都有着非常重要的作用。而且 ,这些问题的解决必须要依据复杂网络的理论知识和技术上的发展。 

2 复杂动力网络的特征分析 

2.1 复杂动力网络的同步效应 

网络上的同步这是社会中广泛存在的一种非常重要的非线性现象。并且 在现实生活中,有着非常复杂网络在弱耦合情况喜爱可以在很大程度上展示同步的倾向性,而且,在对于全连接的网络中,无论是耦合强度大小,只要是网络进行充分连接,对于一个全局耦合的网络就一定要能够进行相应的同步,对于最近的邻居耦合网络,若一个局部耦合网络也不一定能够进行同步,在更为宽泛的意义上看,网络上的同步要分情况来看,有时是有优势,但是有的时候也会有害处。有益的网络同步可以更好地运用在软件工程中去,例如,可以更好地运用在保密通信和语言涌现和组织管理的协调上进行高效运行,如果是有害的同步,则很有可能会造成传输控制协议的增加,或者是出现网络信息堵塞的情况,从目前的情况来看,网络上的同步在核磁共振和激光设备中运用更加广泛和成熟。所以,对于有益的网络同步,我们一定要切实采取各种技术手段来保持网络系统上的同步性,但是,对于有害的网络同步,就必须要加以制止。 

2.2 复杂动力网络上的控制 

复杂动力网络由于具备大量的节点,以及相对复杂的拓扑结构,使得传统的控制手段已经不能完全地适应当前软件工程的运用。人们相继提出了自适应控制和线性反馈控制、切换控制以及牵制控制等方面。 

在当前复杂动力网络系统中,我们就不仅仅可以通过控制网络上的所有节点来实现一个既定的目标,而且,在大多数的情况下,就是希望能通过控制尽量少的节点来实现各种目标,这就是牵制控制。 

复杂网络的牵制控制方面,基本上有两种不同的控制策略,主要是可以分为,随机控制策略和目的性选择策略。总的来说,就是随机选择一些节点来进行牵制控制,但是,目的性的控制策略,就是严格按照一定规则来选择有效地节点进行控制,实际上,牵制控制所涉及的领域非常广,其中就包括网络结构和节点动力学,以及相应的网络耦合强度等一些方面,为此,对于牵制控制来说,如何来选择网络耦合强度和牵制控制器的数目就是当前牵制控制两个最为基本的问题,从具体上看,就是可以给定复杂网络系统和牵制控制策略和网络耦合强度,必须要对多个牵制控制器才能更好地实现网络上的稳定性,所以,这些问题都是需要我们面临的问题。 

3 复杂动力网络在软件工程中的有效运用 

在过去的几年当中,有很多的专家和学者都将复杂网络的理论和方法有效地运用在软件工程中去,例如,可以有效地运用复杂网络的工具分析,并进一步分析了软件网络各种统计特征和网络可视化的软件研究,并得到广泛的运用和发展。 

在网络化的软件运用过程中,网络软件从某种意义上是一种多结构和全方位的动态演化软件,具有很强的适应性和自组织性以及开放性。从另外一个角度上看,这是相对于传统的网络软件来说,网络式软件的组成单位显得更加主动,并且耦合度也非常松散,在规模上可以适当地进行收缩和拓展,而且网络化的软件可以切实通过发现和挖掘网络资源,从而可以实现资源的有效利用,为客户提供可持续性和安全上的交互与协调服务,更好地满足用户的各种需求。 

同时,软件系统的运用过程中,这是一种人工上的比较复杂的系统,从而可以导致了统计意义上出现规律上的附和,这就必然会造成软件设计方法和开发过程汇总的某些原则之间存在的关联性。 

尤其是在200年以来,复杂动力网络阐述了面向对象软件网络的结构与传播代价之间的内在关系,可以说,网络评价传播代价和软件网络之间存在紧密的联系。并且两者的相关系数可以随着网络中的边数结构的增加而减少,这样就能够充分说明在节点一定的情况下,随着边数的增加,可以在网络中形成很大的中枢节点,进而可能导致了平均最短路径长度的减少,同时,平均传播代价也随着减少,平均传播代价和出入度之间的范围都存在负相关,这也在一定程度上会造成网络环境上的异质化更高,其中的平均传播代价就越低,这就是为什么能够出现真实的软件网络,而且网络传播代价显得相对较小,而且,规则网络却使得平均传播代价更大,为此,这就必须要对具体的情况做出详细的分析,才能更好地推动复杂动力网络在软件工程中的应用。