网络诊断

✍ dations ◷ 2025-02-23 10:14:54 #网络,电气工程

网络诊断(Network Tomography)是近代发展的一种新的网络测量与推论方法,透过可收集到的有限资讯来推估无法观测的网络资讯,主要分成主动诊断(active tomography)与被动诊断(passive tomography)两类问题。被动诊断是资料从个别节点搜集,去寻找路径上的资讯,问题在估计起始节点至终端节点之流量矩阵。主动诊断是借由设置接收节点,向接收节点发送大量的封包,根据接收节点收集到的测量数据,分析网络内部有兴趣的参数或识别网络拓扑结构。而衍生出来的统计问题称为统计反向问题(Statistical Inverse Problem)。

网络诊断的概念最早由Vardi在1996年提出,现今的研究主要分为:

所谓网络起始节点至终端节点(SD)流量强度估计主要是想要估计网络内各条SD路径的封包流量。其主要概念为假设我们能观测到网络内各节点互相传送封包的路径,以下简称连结和各条连结的封包流量,由各条连结所观测到的结果来估计各条SD路径的网络流量。

主要问题架构与符号定义如下:假设网络模型内有 n {\displaystyle n} 个节点、 r {\displaystyle r} 条连结、 c {\displaystyle c} 条SD路径且定义A为 r {\displaystyle r} x c {\displaystyle c} 的路径矩阵。
举例来说,网络模型有4个节点(a,b,c,d)、7条连结、12条SD路径,如下方左图所示,且路径矩阵A可表达如下方右图所示。

X j ( k ) {\displaystyle X_{j}^{\left(k\right)}} 表示第 j {\displaystyle j} 条SD路径在第 k {\displaystyle k} 期的封包流量,在此假设 X j ( k ) P o i s s o n ( λ j ) , j = 1 , . . . , c , k = 1 , . . . , K {\displaystyle X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K}
因此连结的流量与SD路径的流量可以表示成下列的线性模型

其中,

我们希望利用观测到的Y向量去估计X向量中的参数值 λ = ( λ 1 , . . . , λ c ) {\displaystyle \mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'} } ,但通常X向量的维度远大于Y向量的维度,因此X可能会有无限多解,而目前发展出下列几种寻找最佳参数解的方法

假设网络模型有2条连结、3条SD路径、1期的SD流量,即 r = 2 , c = 3 , K = 1   {\displaystyle r=2,c=3,K=1\ }
X i P o i s s o n ( λ i ) , i = 1 , 2 , 3 {\displaystyle X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3} X 1 + X 2 = 1 , X 1 + X 3 = 2 {\displaystyle X_{1}+X_{2}=1,X_{1}+X_{3}=2}
如下图所示


则我们可以得到

因此模型可表示成


以最大概似法求最佳解为例,

先将所有可能的参数解找出。因为封包流量必须为正整数,因此只有以下两组解:

将可能的参数解代入概似函数

找出让概似函数最大的参数解,即为最佳参数解

因为

最佳解为

先将概似函数整理成期望值的型态

选定起始值 λ ( 0 ) {\displaystyle \lambda ^{\left(0\right)}} ,运用EM算法,进行递回运算,直到找出让期望值最大的参数解

利用EM算法求解的缺点是当网络模型较大时,在计算上比较复杂;即使当期数够多时,EM算法仅能提高估计上的准确性并无法解决计算上的复杂。


针对EM算法的缺点,Vardi在1996年提出一种较为可行的方法,即利用动差法来估计参数解。

假设当各条连结流量观测的期数够多时,根据中央极限定理

利用动差法,令样本平均数等于母体平均数,样本共变异数等于母体共变异数,即

由上述式子即可估计出参数解

因此Vardi提出动差法可解决计算上的困难,也可以利用产生动差等式解决参数解不唯一的情况。

所谓网络连结层级参数推估问题主要是想要推论网络连结的特性,例如节点传输之间资讯遗失率或延迟分配等。其主要概念为假设已知网络的形式,包含节点、路径等,一般常见为树状,以及假设已知网络特性的模型,搜集端点所测量的结果来找出有最大几率产生观察结果的网络参数。

若考虑封包遗失率下,其主要问题架构与符号定义如下:

假设有一个树状网络定义为

表示该网络有V个节点(包含起始节点0、终端节点R及中间节点I)、E条连结。令

其中 X k {\displaystyle X_{k}} 表示封包传送是否通过节点 k {\displaystyle k} ,即

此外,若 X i = 1 {\displaystyle X_{i}=1} X j = 1 {\displaystyle X_{j}=1} ,表示节点 i {\displaystyle i} j {\displaystyle j} 之间的连结有封包通过,此处以 α i {\displaystyle \alpha \,_{i}} 表示封包通过的几率。

举例来说,

上图为一个树状网络

数字表示节点,起始节点为0,中间节点为1、 2、 3,而终端节点为4、5、6、7, α i {\displaystyle \alpha \,_{i}} 表示连结 i {\displaystyle i} 的通过率。

令封包传送结果 X ( R ) = ( X k ) k R {\displaystyle X_{(R)}=(X_{k})_{k\in R}} ,则其几率分配表示为

并假设发送了 n {\displaystyle n} 个封包,令 n ( x ) {\displaystyle n(x)} 表示 x {\displaystyle x} 所获得的封包数,则 n {\displaystyle n} 个独立的观测值 x 1 {\displaystyle x^{1}} x 2 {\displaystyle x^{2}} x n {\displaystyle x^{n}} 的分配为

因此问题的目标即为估计 α {\displaystyle \alpha }

从起始节点传送封包,并观察终端节点封包通过情况。传送封包主要有两种情况,一种为一次只传送到一个接收的端点,称为单一传送;另一种为封包传送到特定的一些接收端点,称为多重传送。然而这两种传送方式较没有弹性,且无法使用不同的流量或不同时间下观察网域,因此Xi et al. (2006)及Lawrence et al. (2006)针对弹性传送(flexicast)封包的情况作探讨。

此种观察封包传送情况来对网络做推论产生了统计反向问题,即利用观察结果来诊断连结中的分配或特征。有许多统计方法可解决此类推论问题,Castro et al. (2004)提到像是降低复杂性的阶层统计模型(Complexity-Reducing Hierarchical Statistical Models)、动差或最大概似法为主的估计、EM及马可夫链蒙地卡罗(Markov Chain Monte Carlo, MCMC)演算方法等已被使用;且认为而使用统计方法来解决此问题的领域仍具有发展性,而未来应有更多现存的统计方法可加以应用。

以下兹列举一种问题情况:“针对多重传送为主的网络来推论该网络的封包遗失率”来说明网络连结参数中的遗失率推估问题。估计封包遗失率为Cáceres et al.(1999)首先研究,在假设连结遗失为独立的伯努利分配下,利用最大概似法来估计多重传送的树状网络中连结遗失率;他们亦证明此估计量具备强烈一致性,并透过最大概似估计量之渐近常态性来推导出这些估计的比率会收敛到真正的比率。

以最大概似法求估计之连结遗失率方法如下:首先计算对数概似函数,

α {\displaystyle \alpha } 的最大概似估计量

另外,Cáceres et al.(1999)亦利用终端节点接收封包几率来估计 α {\displaystyle \alpha } 。令 R ( k ) {\displaystyle R(k)} 为第 k {\displaystyle k} 个节点传送下来之终端节点所成集合, Ω ( k ) {\displaystyle \Omega (k)} R ( k ) {\displaystyle R(k)} 集合中至少有一个终端节点有收到封包之所有观测情况所成集合。假设 γ k = P {\displaystyle \gamma _{k}=P} ,则 γ k {\displaystyle \gamma _{k}} 估计量为 Σ {\displaystyle \Sigma \left} ,即观察到的比例总和。令 k = f ( j ) {\displaystyle k=f\,(j)} 表示节点 k {\displaystyle k} 为前一个节点 j {\displaystyle j} 所传下来的,
且定义 f n ( j ) = f ( f n 1 ( j ) ) {\displaystyle f\,^{n}\,(j)=f(f\,^{n-1}\,(j))} ,即前 n {\displaystyle n} 个节点传下来。并令 l ( k ) {\displaystyle l(k)} 表示第 k {\displaystyle k} 条连结所在从起始到终端节点的层级。定义

表示给定从第 k {\displaystyle k} 的节点传送的节点有通过下,其传送到的终端节点至少有一个有收到封包的几率。他们证明 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系为

即将通过第k条连结所在从起始到终端节点的所有 α k {\displaystyle \alpha _{k}} 相乘,在该篇文章中亦提供求 γ k {\displaystyle \gamma _{k}} 的演算程序。因此,利用观察到的样本结果,则可推估封包通过率,而封包遗失率则可求之。

以两层的树状网络为例:
Network 2level.JPG

令通过此网络终端节点的可能情况集合为

其中

可计算 γ i {\displaystyle \gamma _{i}} 值如下:


利用 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系式可得

EM算法为一种在具有无法观测的资料或是混合模型下计算最大概似估计量之一种有效率的反复程序,每次递回(iteration)包含下列两个步骤:

此步骤为在给定完全的资料及当下的参数估计值后,计算对数概似函数的条件期望值。

此步骤为在最大化E步骤中的条件期望值对数概似函数,即求最大概似估计量。

X {\displaystyle \mathbf {X} } 表示观察到的资料, Z {\displaystyle \mathbf {Z} } 表示遗失或无法观测的资料,及 θ {\displaystyle {\boldsymbol {\theta }}} 表示欲估计的参数。演算步骤如下:

相关

  • 拉br /伸br /纪拉伸纪(Tonian,符号NP1)又名青白口纪,是地质时代中的一个纪,开始于同位素年龄1000±0百万年(Ma),结束于720±0Ma。拉伸纪期间首次出现大型具刺疑源类,并形成臭氧层。拉伸纪属于前寒武
  • 诺福克岛诺福克岛(英语:Norfolk Island)是澳大利亚的一个岛屿(拉脱维亚语:Norfolka (sala)),与紧邻的菲利普岛和尼皮恩岛共同组成一个澳大利亚海外领地。面积约34.6平方公里。人口1748人(201
  • 马志明马志明(1948年1月25日-),生于四川成都,籍贯山西交城,中国数学家。1978年毕业于重庆师范学院数学系。1981年获中国科学院研究生院数学硕士学位。1984年获中国科学院应用数学研究所
  • 头罗曼头罗曼(?-517年)也作多罗摩那,拖拉曼那,是公元5世纪末至6世纪初嚈哒在印度的统治者。约465年,嚈哒占据犍陀罗,任该地“特勤”(即总督)。从470年开始,他以犍陀罗为中心,进攻笈多帝国,逐渐
  • 捕虫植物食肉植物(carnivorous plants),又名食虫植物(insectivorous plants),指能够诱捕昆虫或其他小动物,并能够分泌消化液将其消化以补充自身养分的植物。其典型的代表如猪笼草和捕蝇草等
  • 通婚异族通婚(英文:Interracial marriage)是指不同民族或种族个体间的婚姻,有混血儿的一系列现象。异族通婚的成因有很多,而大规模的异族通婚则成为种族混合(英语:Miscegenation),往往对
  • 1988年冬季奥林匹克运动会奖牌榜以下是1988年冬季奥林匹克运动会奖牌统计。国际奥林匹克委员会并非认同此奖牌榜中各国的奖牌排名,本表仅供参考之用。以背景色标示的是冬奥会举办国,最多奖牌数以粗体显示。
  • 坂口安吾坂口安吾(1906年10月20日-1955年2月17日),本名坂口炳五(因生于丙午年,又于家中排行第五),是日本著名的小说家,出生于日本新潟县新潟市。日本在第二次世界大战战败后,坂口安吾曾是一个
  • 双酚S双酚S(英语:Bisphenol S,缩写BPS)是一种芳香型有机化合物,化学式(HOC6H4)2SO2,和双酚A结构类似,同属于双酚系列,不过其中的次丙基基团(C(CH3)2)被替代为磺酰基基团(SO2),即磺酰基与苯
  • 米科拉斯·马尔蒂诺维奇·布罗基亚维丘斯米科拉斯·马尔蒂诺维奇·布罗基亚维丘斯(俄语:Ми́колас Ма́ртинович Бурокя́вичюс (Бурокявичус),立陶宛语:Mykolas Burokevičius