网络诊断

✍ dations ◷ 2025-05-19 01:17:55 #网络,电气工程

网络诊断(Network Tomography)是近代发展的一种新的网络测量与推论方法,透过可收集到的有限资讯来推估无法观测的网络资讯,主要分成主动诊断(active tomography)与被动诊断(passive tomography)两类问题。被动诊断是资料从个别节点搜集,去寻找路径上的资讯,问题在估计起始节点至终端节点之流量矩阵。主动诊断是借由设置接收节点,向接收节点发送大量的封包,根据接收节点收集到的测量数据,分析网络内部有兴趣的参数或识别网络拓扑结构。而衍生出来的统计问题称为统计反向问题(Statistical Inverse Problem)。

网络诊断的概念最早由Vardi在1996年提出,现今的研究主要分为:

所谓网络起始节点至终端节点(SD)流量强度估计主要是想要估计网络内各条SD路径的封包流量。其主要概念为假设我们能观测到网络内各节点互相传送封包的路径,以下简称连结和各条连结的封包流量,由各条连结所观测到的结果来估计各条SD路径的网络流量。

主要问题架构与符号定义如下:假设网络模型内有 n {\displaystyle n} 个节点、 r {\displaystyle r} 条连结、 c {\displaystyle c} 条SD路径且定义A为 r {\displaystyle r} x c {\displaystyle c} 的路径矩阵。
举例来说,网络模型有4个节点(a,b,c,d)、7条连结、12条SD路径,如下方左图所示,且路径矩阵A可表达如下方右图所示。

X j ( k ) {\displaystyle X_{j}^{\left(k\right)}} 表示第 j {\displaystyle j} 条SD路径在第 k {\displaystyle k} 期的封包流量,在此假设 X j ( k ) P o i s s o n ( λ j ) , j = 1 , . . . , c , k = 1 , . . . , K {\displaystyle X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K}
因此连结的流量与SD路径的流量可以表示成下列的线性模型

其中,

我们希望利用观测到的Y向量去估计X向量中的参数值 λ = ( λ 1 , . . . , λ c ) {\displaystyle \mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'} } ,但通常X向量的维度远大于Y向量的维度,因此X可能会有无限多解,而目前发展出下列几种寻找最佳参数解的方法

假设网络模型有2条连结、3条SD路径、1期的SD流量,即 r = 2 , c = 3 , K = 1   {\displaystyle r=2,c=3,K=1\ }
X i P o i s s o n ( λ i ) , i = 1 , 2 , 3 {\displaystyle X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3} X 1 + X 2 = 1 , X 1 + X 3 = 2 {\displaystyle X_{1}+X_{2}=1,X_{1}+X_{3}=2}
如下图所示


则我们可以得到

因此模型可表示成


以最大概似法求最佳解为例,

先将所有可能的参数解找出。因为封包流量必须为正整数,因此只有以下两组解:

将可能的参数解代入概似函数

找出让概似函数最大的参数解,即为最佳参数解

因为

最佳解为

先将概似函数整理成期望值的型态

选定起始值 λ ( 0 ) {\displaystyle \lambda ^{\left(0\right)}} ,运用EM算法,进行递回运算,直到找出让期望值最大的参数解

利用EM算法求解的缺点是当网络模型较大时,在计算上比较复杂;即使当期数够多时,EM算法仅能提高估计上的准确性并无法解决计算上的复杂。


针对EM算法的缺点,Vardi在1996年提出一种较为可行的方法,即利用动差法来估计参数解。

假设当各条连结流量观测的期数够多时,根据中央极限定理

利用动差法,令样本平均数等于母体平均数,样本共变异数等于母体共变异数,即

由上述式子即可估计出参数解

因此Vardi提出动差法可解决计算上的困难,也可以利用产生动差等式解决参数解不唯一的情况。

所谓网络连结层级参数推估问题主要是想要推论网络连结的特性,例如节点传输之间资讯遗失率或延迟分配等。其主要概念为假设已知网络的形式,包含节点、路径等,一般常见为树状,以及假设已知网络特性的模型,搜集端点所测量的结果来找出有最大几率产生观察结果的网络参数。

若考虑封包遗失率下,其主要问题架构与符号定义如下:

假设有一个树状网络定义为

表示该网络有V个节点(包含起始节点0、终端节点R及中间节点I)、E条连结。令

其中 X k {\displaystyle X_{k}} 表示封包传送是否通过节点 k {\displaystyle k} ,即

此外,若 X i = 1 {\displaystyle X_{i}=1} X j = 1 {\displaystyle X_{j}=1} ,表示节点 i {\displaystyle i} j {\displaystyle j} 之间的连结有封包通过,此处以 α i {\displaystyle \alpha \,_{i}} 表示封包通过的几率。

举例来说,

上图为一个树状网络

数字表示节点,起始节点为0,中间节点为1、 2、 3,而终端节点为4、5、6、7, α i {\displaystyle \alpha \,_{i}} 表示连结 i {\displaystyle i} 的通过率。

令封包传送结果 X ( R ) = ( X k ) k R {\displaystyle X_{(R)}=(X_{k})_{k\in R}} ,则其几率分配表示为

并假设发送了 n {\displaystyle n} 个封包,令 n ( x ) {\displaystyle n(x)} 表示 x {\displaystyle x} 所获得的封包数,则 n {\displaystyle n} 个独立的观测值 x 1 {\displaystyle x^{1}} x 2 {\displaystyle x^{2}} x n {\displaystyle x^{n}} 的分配为

因此问题的目标即为估计 α {\displaystyle \alpha }

从起始节点传送封包,并观察终端节点封包通过情况。传送封包主要有两种情况,一种为一次只传送到一个接收的端点,称为单一传送;另一种为封包传送到特定的一些接收端点,称为多重传送。然而这两种传送方式较没有弹性,且无法使用不同的流量或不同时间下观察网域,因此Xi et al. (2006)及Lawrence et al. (2006)针对弹性传送(flexicast)封包的情况作探讨。

此种观察封包传送情况来对网络做推论产生了统计反向问题,即利用观察结果来诊断连结中的分配或特征。有许多统计方法可解决此类推论问题,Castro et al. (2004)提到像是降低复杂性的阶层统计模型(Complexity-Reducing Hierarchical Statistical Models)、动差或最大概似法为主的估计、EM及马可夫链蒙地卡罗(Markov Chain Monte Carlo, MCMC)演算方法等已被使用;且认为而使用统计方法来解决此问题的领域仍具有发展性,而未来应有更多现存的统计方法可加以应用。

以下兹列举一种问题情况:“针对多重传送为主的网络来推论该网络的封包遗失率”来说明网络连结参数中的遗失率推估问题。估计封包遗失率为Cáceres et al.(1999)首先研究,在假设连结遗失为独立的伯努利分配下,利用最大概似法来估计多重传送的树状网络中连结遗失率;他们亦证明此估计量具备强烈一致性,并透过最大概似估计量之渐近常态性来推导出这些估计的比率会收敛到真正的比率。

以最大概似法求估计之连结遗失率方法如下:首先计算对数概似函数,

α {\displaystyle \alpha } 的最大概似估计量

另外,Cáceres et al.(1999)亦利用终端节点接收封包几率来估计 α {\displaystyle \alpha } 。令 R ( k ) {\displaystyle R(k)} 为第 k {\displaystyle k} 个节点传送下来之终端节点所成集合, Ω ( k ) {\displaystyle \Omega (k)} R ( k ) {\displaystyle R(k)} 集合中至少有一个终端节点有收到封包之所有观测情况所成集合。假设 γ k = P {\displaystyle \gamma _{k}=P} ,则 γ k {\displaystyle \gamma _{k}} 估计量为 Σ {\displaystyle \Sigma \left} ,即观察到的比例总和。令 k = f ( j ) {\displaystyle k=f\,(j)} 表示节点 k {\displaystyle k} 为前一个节点 j {\displaystyle j} 所传下来的,
且定义 f n ( j ) = f ( f n 1 ( j ) ) {\displaystyle f\,^{n}\,(j)=f(f\,^{n-1}\,(j))} ,即前 n {\displaystyle n} 个节点传下来。并令 l ( k ) {\displaystyle l(k)} 表示第 k {\displaystyle k} 条连结所在从起始到终端节点的层级。定义

表示给定从第 k {\displaystyle k} 的节点传送的节点有通过下,其传送到的终端节点至少有一个有收到封包的几率。他们证明 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系为

即将通过第k条连结所在从起始到终端节点的所有 α k {\displaystyle \alpha _{k}} 相乘,在该篇文章中亦提供求 γ k {\displaystyle \gamma _{k}} 的演算程序。因此,利用观察到的样本结果,则可推估封包通过率,而封包遗失率则可求之。

以两层的树状网络为例:
Network 2level.JPG

令通过此网络终端节点的可能情况集合为

其中

可计算 γ i {\displaystyle \gamma _{i}} 值如下:


利用 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系式可得

EM算法为一种在具有无法观测的资料或是混合模型下计算最大概似估计量之一种有效率的反复程序,每次递回(iteration)包含下列两个步骤:

此步骤为在给定完全的资料及当下的参数估计值后,计算对数概似函数的条件期望值。

此步骤为在最大化E步骤中的条件期望值对数概似函数,即求最大概似估计量。

X {\displaystyle \mathbf {X} } 表示观察到的资料, Z {\displaystyle \mathbf {Z} } 表示遗失或无法观测的资料,及 θ {\displaystyle {\boldsymbol {\theta }}} 表示欲估计的参数。演算步骤如下:

相关

  • 里泽里泽是土耳其的城市,也是里泽省的首府,位于该国东北部黑海沿岸,海拔高度6米,受副热带湿润气候影响,每年平均降雨量2,233毫米,2008年人口91,904。
  • 日本城市列表日本的设市城市在法律上地位相同,但亦存在政令指定都市、中核市、特例市和普通市的区别,主要是行政和立法权限上的不同。
  • 轴子轴子(axion)是一种假想的亚原子粒子,大约是1970年代为了解决CP守恒问题所提出的一个假想粒子,1977年的皮塞-奎恩理论(英语:Peccei–Quinn theory)(Peccei–Quinn theory)首先提到这个
  • 古人类学古人类学(英语:paleoanthropology),是古生物学与体质人类学的交叉学科,主要以人类演化为研究内容。古人类学的研究对象以古人类和古猿类的化石遗骸为主。研究人员在演化理论的指
  • 丙子丙子为干支之一,顺序为第13个。前一位是乙亥,后一位是丁丑。论阴阳五行,天干之丙属阳之火,地支之子属阳之水,是水克火相克。中国传统纪年农历的干支纪年中一个循环的第13年称“丙
  • 一片石之战八旗睿亲王多尔衮 山海关明军总兵吴三桂 辅国公赖慕布 八旗正白旗都统赖塔 范文程 豫亲王多铎 贝勒豪格 闯王李自成 权将军刘宗敏 顾君恩 抚清之战 · 萨尔浒之战 · 开铁
  • 大艺术家 (消歧义)大艺术家可以指:
  • 人巨细胞病毒人巨细胞病毒(英语:Human cytomegalovirus,HCMV)或称人类疱疹病毒第五型(英语:Human betaherpesvirus 5,HHV-5),属于β疱疹病毒亚科,是巨细胞病毒(CMV)中以人类为宿主的一种DNA病毒。HCM
  • 中国下一代互联网示范工程中国下一代互联网示范工程(英语:China Next Generation Internet,简称CNGI)启动于2003年,是中国大陆的IPv6的启动工程,也是目前世界上最大的纯IPv6互联网。其核心网由中国教育网(CE
  • 大魔神魔神或大魔神可以指: