网络诊断

✍ dations ◷ 2024-12-23 01:54:20 #网络,电气工程

网络诊断(Network Tomography)是近代发展的一种新的网络测量与推论方法,透过可收集到的有限资讯来推估无法观测的网络资讯,主要分成主动诊断(active tomography)与被动诊断(passive tomography)两类问题。被动诊断是资料从个别节点搜集,去寻找路径上的资讯,问题在估计起始节点至终端节点之流量矩阵。主动诊断是借由设置接收节点,向接收节点发送大量的封包,根据接收节点收集到的测量数据,分析网络内部有兴趣的参数或识别网络拓扑结构。而衍生出来的统计问题称为统计反向问题(Statistical Inverse Problem)。

网络诊断的概念最早由Vardi在1996年提出,现今的研究主要分为:

所谓网络起始节点至终端节点(SD)流量强度估计主要是想要估计网络内各条SD路径的封包流量。其主要概念为假设我们能观测到网络内各节点互相传送封包的路径,以下简称连结和各条连结的封包流量,由各条连结所观测到的结果来估计各条SD路径的网络流量。

主要问题架构与符号定义如下:假设网络模型内有 n {\displaystyle n} 个节点、 r {\displaystyle r} 条连结、 c {\displaystyle c} 条SD路径且定义A为 r {\displaystyle r} x c {\displaystyle c} 的路径矩阵。
举例来说,网络模型有4个节点(a,b,c,d)、7条连结、12条SD路径,如下方左图所示,且路径矩阵A可表达如下方右图所示。

X j ( k ) {\displaystyle X_{j}^{\left(k\right)}} 表示第 j {\displaystyle j} 条SD路径在第 k {\displaystyle k} 期的封包流量,在此假设 X j ( k ) P o i s s o n ( λ j ) , j = 1 , . . . , c , k = 1 , . . . , K {\displaystyle X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K}
因此连结的流量与SD路径的流量可以表示成下列的线性模型

其中,

我们希望利用观测到的Y向量去估计X向量中的参数值 λ = ( λ 1 , . . . , λ c ) {\displaystyle \mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'} } ,但通常X向量的维度远大于Y向量的维度,因此X可能会有无限多解,而目前发展出下列几种寻找最佳参数解的方法

假设网络模型有2条连结、3条SD路径、1期的SD流量,即 r = 2 , c = 3 , K = 1   {\displaystyle r=2,c=3,K=1\ }
X i P o i s s o n ( λ i ) , i = 1 , 2 , 3 {\displaystyle X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3} X 1 + X 2 = 1 , X 1 + X 3 = 2 {\displaystyle X_{1}+X_{2}=1,X_{1}+X_{3}=2}
如下图所示


则我们可以得到

因此模型可表示成


以最大概似法求最佳解为例,

先将所有可能的参数解找出。因为封包流量必须为正整数,因此只有以下两组解:

将可能的参数解代入概似函数

找出让概似函数最大的参数解,即为最佳参数解

因为

最佳解为

先将概似函数整理成期望值的型态

选定起始值 λ ( 0 ) {\displaystyle \lambda ^{\left(0\right)}} ,运用EM算法,进行递回运算,直到找出让期望值最大的参数解

利用EM算法求解的缺点是当网络模型较大时,在计算上比较复杂;即使当期数够多时,EM算法仅能提高估计上的准确性并无法解决计算上的复杂。


针对EM算法的缺点,Vardi在1996年提出一种较为可行的方法,即利用动差法来估计参数解。

假设当各条连结流量观测的期数够多时,根据中央极限定理

利用动差法,令样本平均数等于母体平均数,样本共变异数等于母体共变异数,即

由上述式子即可估计出参数解

因此Vardi提出动差法可解决计算上的困难,也可以利用产生动差等式解决参数解不唯一的情况。

所谓网络连结层级参数推估问题主要是想要推论网络连结的特性,例如节点传输之间资讯遗失率或延迟分配等。其主要概念为假设已知网络的形式,包含节点、路径等,一般常见为树状,以及假设已知网络特性的模型,搜集端点所测量的结果来找出有最大几率产生观察结果的网络参数。

若考虑封包遗失率下,其主要问题架构与符号定义如下:

假设有一个树状网络定义为

表示该网络有V个节点(包含起始节点0、终端节点R及中间节点I)、E条连结。令

其中 X k {\displaystyle X_{k}} 表示封包传送是否通过节点 k {\displaystyle k} ,即

此外,若 X i = 1 {\displaystyle X_{i}=1} X j = 1 {\displaystyle X_{j}=1} ,表示节点 i {\displaystyle i} j {\displaystyle j} 之间的连结有封包通过,此处以 α i {\displaystyle \alpha \,_{i}} 表示封包通过的几率。

举例来说,

上图为一个树状网络

数字表示节点,起始节点为0,中间节点为1、 2、 3,而终端节点为4、5、6、7, α i {\displaystyle \alpha \,_{i}} 表示连结 i {\displaystyle i} 的通过率。

令封包传送结果 X ( R ) = ( X k ) k R {\displaystyle X_{(R)}=(X_{k})_{k\in R}} ,则其几率分配表示为

并假设发送了 n {\displaystyle n} 个封包,令 n ( x ) {\displaystyle n(x)} 表示 x {\displaystyle x} 所获得的封包数,则 n {\displaystyle n} 个独立的观测值 x 1 {\displaystyle x^{1}} x 2 {\displaystyle x^{2}} x n {\displaystyle x^{n}} 的分配为

因此问题的目标即为估计 α {\displaystyle \alpha }

从起始节点传送封包,并观察终端节点封包通过情况。传送封包主要有两种情况,一种为一次只传送到一个接收的端点,称为单一传送;另一种为封包传送到特定的一些接收端点,称为多重传送。然而这两种传送方式较没有弹性,且无法使用不同的流量或不同时间下观察网域,因此Xi et al. (2006)及Lawrence et al. (2006)针对弹性传送(flexicast)封包的情况作探讨。

此种观察封包传送情况来对网络做推论产生了统计反向问题,即利用观察结果来诊断连结中的分配或特征。有许多统计方法可解决此类推论问题,Castro et al. (2004)提到像是降低复杂性的阶层统计模型(Complexity-Reducing Hierarchical Statistical Models)、动差或最大概似法为主的估计、EM及马可夫链蒙地卡罗(Markov Chain Monte Carlo, MCMC)演算方法等已被使用;且认为而使用统计方法来解决此问题的领域仍具有发展性,而未来应有更多现存的统计方法可加以应用。

以下兹列举一种问题情况:“针对多重传送为主的网络来推论该网络的封包遗失率”来说明网络连结参数中的遗失率推估问题。估计封包遗失率为Cáceres et al.(1999)首先研究,在假设连结遗失为独立的伯努利分配下,利用最大概似法来估计多重传送的树状网络中连结遗失率;他们亦证明此估计量具备强烈一致性,并透过最大概似估计量之渐近常态性来推导出这些估计的比率会收敛到真正的比率。

以最大概似法求估计之连结遗失率方法如下:首先计算对数概似函数,

α {\displaystyle \alpha } 的最大概似估计量

另外,Cáceres et al.(1999)亦利用终端节点接收封包几率来估计 α {\displaystyle \alpha } 。令 R ( k ) {\displaystyle R(k)} 为第 k {\displaystyle k} 个节点传送下来之终端节点所成集合, Ω ( k ) {\displaystyle \Omega (k)} R ( k ) {\displaystyle R(k)} 集合中至少有一个终端节点有收到封包之所有观测情况所成集合。假设 γ k = P {\displaystyle \gamma _{k}=P} ,则 γ k {\displaystyle \gamma _{k}} 估计量为 Σ {\displaystyle \Sigma \left} ,即观察到的比例总和。令 k = f ( j ) {\displaystyle k=f\,(j)} 表示节点 k {\displaystyle k} 为前一个节点 j {\displaystyle j} 所传下来的,
且定义 f n ( j ) = f ( f n 1 ( j ) ) {\displaystyle f\,^{n}\,(j)=f(f\,^{n-1}\,(j))} ,即前 n {\displaystyle n} 个节点传下来。并令 l ( k ) {\displaystyle l(k)} 表示第 k {\displaystyle k} 条连结所在从起始到终端节点的层级。定义

表示给定从第 k {\displaystyle k} 的节点传送的节点有通过下,其传送到的终端节点至少有一个有收到封包的几率。他们证明 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系为

即将通过第k条连结所在从起始到终端节点的所有 α k {\displaystyle \alpha _{k}} 相乘,在该篇文章中亦提供求 γ k {\displaystyle \gamma _{k}} 的演算程序。因此,利用观察到的样本结果,则可推估封包通过率,而封包遗失率则可求之。

以两层的树状网络为例:
Network 2level.JPG

令通过此网络终端节点的可能情况集合为

其中

可计算 γ i {\displaystyle \gamma _{i}} 值如下:


利用 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系式可得

EM算法为一种在具有无法观测的资料或是混合模型下计算最大概似估计量之一种有效率的反复程序,每次递回(iteration)包含下列两个步骤:

此步骤为在给定完全的资料及当下的参数估计值后,计算对数概似函数的条件期望值。

此步骤为在最大化E步骤中的条件期望值对数概似函数,即求最大概似估计量。

X {\displaystyle \mathbf {X} } 表示观察到的资料, Z {\displaystyle \mathbf {Z} } 表示遗失或无法观测的资料,及 θ {\displaystyle {\boldsymbol {\theta }}} 表示欲估计的参数。演算步骤如下:

相关

  • 方式关系方式关系(英语:troponymy)指的是词位之间因“方式”的联系而存在的关系。这个概念由克里斯蒂安妮·费尔巴姆(英语:Christiane Fellbaum)和乔治·A·米勒首次提出。例如,咕哝、嘟囔
  • 突变突变(英语:Mutation,即基因突变)在生物学上的含义,是指细胞中的遗传基因(通常指存在于细胞核中的去氧核糖核酸)发生的改变。它包括单个碱基改变所引起的点突变,或多个碱基的缺失、重
  • 电镀电镀(英文:Electroplating)是利用电解的原理将导电体铺上一层金属的方法。除了导电体以外,电镀亦可用于经过特殊处理的塑胶上。电镀有分镀铬、镀锌、镀铜、镀镍等。电镀的主要
  • 去氧核糖核苷酸核苷酸(英语:Nucleotide)是核酸的基本组成单位。核苷酸以一个含氮碱基为核心,加上一个五碳糖和一个或者多个磷酸基团组成。含氮碱基有五种,分别是腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)、胸
  • 维蒂希格奥尔格·维蒂希(德语:Georg Wittig,1897年6月16日-1987年8月26日),德国化学家,1979年因将磷化合物用于有机合成之中而与赫伯特·布朗分享诺贝尔化学奖。1897年6月16日生于德意志
  • 宁波市体育中心坐标:29°52′16.89″N 121°34′53.66″E / 29.8713583°N 121.5815722°E / 29.8713583; 121.5815722宁波市体育中心始建于1993年,位于宁波市鄞州区中兴路360号,占地面积约36
  • 利穆赞利穆赞大区(法语:Limousin)是法国中部一个已撤消的大区名称。面积16,942km²,人口710,939。下辖科雷兹省、克勒兹省、上维埃纳省。2016年1月1日,利穆赞大区、阿基坦大区、普瓦图-
  • 2008年苏拉威西岛地震2008年苏拉威西岛地震是指2008年11月17日发生于印度尼西亚苏拉威西岛近海的强烈地震。该次地震震中位于北纬1.271度、东经112.091度,震级为MW 7.4级、Ms 7.1级,震源深度约为30
  • 明日的与一!DVD第一卷封面《明日的与一!》是源悠(みなもと悠)所作的漫画,也是他的首个连载作品。从2006年6月号开始连载于《月刊少年Champion》,2011年完结,单行本全15卷。电视动画于2009年1
  • 储在文储在文(?-?),字礼执,号理质,江南宜兴人。清朝翰林。储在文为进士储方庆之子。自幼聪慧,领悟经义,康熙四十七年(1708年)中举人,次年联捷二甲进士。改翰林院庶吉士。散馆,授编修。后被罢职。