网络诊断

✍ dations ◷ 2024-07-03 05:51:30 #网络,电气工程

网络诊断(Network Tomography)是近代发展的一种新的网络测量与推论方法,透过可收集到的有限资讯来推估无法观测的网络资讯,主要分成主动诊断(active tomography)与被动诊断(passive tomography)两类问题。被动诊断是资料从个别节点搜集,去寻找路径上的资讯,问题在估计起始节点至终端节点之流量矩阵。主动诊断是借由设置接收节点,向接收节点发送大量的封包,根据接收节点收集到的测量数据,分析网络内部有兴趣的参数或识别网络拓扑结构。而衍生出来的统计问题称为统计反向问题(Statistical Inverse Problem)。

网络诊断的概念最早由Vardi在1996年提出,现今的研究主要分为:

所谓网络起始节点至终端节点(SD)流量强度估计主要是想要估计网络内各条SD路径的封包流量。其主要概念为假设我们能观测到网络内各节点互相传送封包的路径,以下简称连结和各条连结的封包流量,由各条连结所观测到的结果来估计各条SD路径的网络流量。

主要问题架构与符号定义如下:假设网络模型内有 n {\displaystyle n} 个节点、 r {\displaystyle r} 条连结、 c {\displaystyle c} 条SD路径且定义A为 r {\displaystyle r} x c {\displaystyle c} 的路径矩阵。
举例来说,网络模型有4个节点(a,b,c,d)、7条连结、12条SD路径,如下方左图所示,且路径矩阵A可表达如下方右图所示。

X j ( k ) {\displaystyle X_{j}^{\left(k\right)}} 表示第 j {\displaystyle j} 条SD路径在第 k {\displaystyle k} 期的封包流量,在此假设 X j ( k ) P o i s s o n ( λ j ) , j = 1 , . . . , c , k = 1 , . . . , K {\displaystyle X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K}
因此连结的流量与SD路径的流量可以表示成下列的线性模型

其中,

我们希望利用观测到的Y向量去估计X向量中的参数值 λ = ( λ 1 , . . . , λ c ) {\displaystyle \mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'} } ,但通常X向量的维度远大于Y向量的维度,因此X可能会有无限多解,而目前发展出下列几种寻找最佳参数解的方法

假设网络模型有2条连结、3条SD路径、1期的SD流量,即 r = 2 , c = 3 , K = 1   {\displaystyle r=2,c=3,K=1\ }
X i P o i s s o n ( λ i ) , i = 1 , 2 , 3 {\displaystyle X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3} X 1 + X 2 = 1 , X 1 + X 3 = 2 {\displaystyle X_{1}+X_{2}=1,X_{1}+X_{3}=2}
如下图所示


则我们可以得到

因此模型可表示成


以最大概似法求最佳解为例,

先将所有可能的参数解找出。因为封包流量必须为正整数,因此只有以下两组解:

将可能的参数解代入概似函数

找出让概似函数最大的参数解,即为最佳参数解

因为

最佳解为

先将概似函数整理成期望值的型态

选定起始值 λ ( 0 ) {\displaystyle \lambda ^{\left(0\right)}} ,运用EM算法,进行递回运算,直到找出让期望值最大的参数解

利用EM算法求解的缺点是当网络模型较大时,在计算上比较复杂;即使当期数够多时,EM算法仅能提高估计上的准确性并无法解决计算上的复杂。


针对EM算法的缺点,Vardi在1996年提出一种较为可行的方法,即利用动差法来估计参数解。

假设当各条连结流量观测的期数够多时,根据中央极限定理

利用动差法,令样本平均数等于母体平均数,样本共变异数等于母体共变异数,即

由上述式子即可估计出参数解

因此Vardi提出动差法可解决计算上的困难,也可以利用产生动差等式解决参数解不唯一的情况。

所谓网络连结层级参数推估问题主要是想要推论网络连结的特性,例如节点传输之间资讯遗失率或延迟分配等。其主要概念为假设已知网络的形式,包含节点、路径等,一般常见为树状,以及假设已知网络特性的模型,搜集端点所测量的结果来找出有最大几率产生观察结果的网络参数。

若考虑封包遗失率下,其主要问题架构与符号定义如下:

假设有一个树状网络定义为

表示该网络有V个节点(包含起始节点0、终端节点R及中间节点I)、E条连结。令

其中 X k {\displaystyle X_{k}} 表示封包传送是否通过节点 k {\displaystyle k} ,即

此外,若 X i = 1 {\displaystyle X_{i}=1} X j = 1 {\displaystyle X_{j}=1} ,表示节点 i {\displaystyle i} j {\displaystyle j} 之间的连结有封包通过,此处以 α i {\displaystyle \alpha \,_{i}} 表示封包通过的几率。

举例来说,

上图为一个树状网络

数字表示节点,起始节点为0,中间节点为1、 2、 3,而终端节点为4、5、6、7, α i {\displaystyle \alpha \,_{i}} 表示连结 i {\displaystyle i} 的通过率。

令封包传送结果 X ( R ) = ( X k ) k R {\displaystyle X_{(R)}=(X_{k})_{k\in R}} ,则其几率分配表示为

并假设发送了 n {\displaystyle n} 个封包,令 n ( x ) {\displaystyle n(x)} 表示 x {\displaystyle x} 所获得的封包数,则 n {\displaystyle n} 个独立的观测值 x 1 {\displaystyle x^{1}} x 2 {\displaystyle x^{2}} x n {\displaystyle x^{n}} 的分配为

因此问题的目标即为估计 α {\displaystyle \alpha }

从起始节点传送封包,并观察终端节点封包通过情况。传送封包主要有两种情况,一种为一次只传送到一个接收的端点,称为单一传送;另一种为封包传送到特定的一些接收端点,称为多重传送。然而这两种传送方式较没有弹性,且无法使用不同的流量或不同时间下观察网域,因此Xi et al. (2006)及Lawrence et al. (2006)针对弹性传送(flexicast)封包的情况作探讨。

此种观察封包传送情况来对网络做推论产生了统计反向问题,即利用观察结果来诊断连结中的分配或特征。有许多统计方法可解决此类推论问题,Castro et al. (2004)提到像是降低复杂性的阶层统计模型(Complexity-Reducing Hierarchical Statistical Models)、动差或最大概似法为主的估计、EM及马可夫链蒙地卡罗(Markov Chain Monte Carlo, MCMC)演算方法等已被使用;且认为而使用统计方法来解决此问题的领域仍具有发展性,而未来应有更多现存的统计方法可加以应用。

以下兹列举一种问题情况:“针对多重传送为主的网络来推论该网络的封包遗失率”来说明网络连结参数中的遗失率推估问题。估计封包遗失率为Cáceres et al.(1999)首先研究,在假设连结遗失为独立的伯努利分配下,利用最大概似法来估计多重传送的树状网络中连结遗失率;他们亦证明此估计量具备强烈一致性,并透过最大概似估计量之渐近常态性来推导出这些估计的比率会收敛到真正的比率。

以最大概似法求估计之连结遗失率方法如下:首先计算对数概似函数,

α {\displaystyle \alpha } 的最大概似估计量

另外,Cáceres et al.(1999)亦利用终端节点接收封包几率来估计 α {\displaystyle \alpha } 。令 R ( k ) {\displaystyle R(k)} 为第 k {\displaystyle k} 个节点传送下来之终端节点所成集合, Ω ( k ) {\displaystyle \Omega (k)} R ( k ) {\displaystyle R(k)} 集合中至少有一个终端节点有收到封包之所有观测情况所成集合。假设 γ k = P {\displaystyle \gamma _{k}=P} ,则 γ k {\displaystyle \gamma _{k}} 估计量为 Σ {\displaystyle \Sigma \left} ,即观察到的比例总和。令 k = f ( j ) {\displaystyle k=f\,(j)} 表示节点 k {\displaystyle k} 为前一个节点 j {\displaystyle j} 所传下来的,
且定义 f n ( j ) = f ( f n 1 ( j ) ) {\displaystyle f\,^{n}\,(j)=f(f\,^{n-1}\,(j))} ,即前 n {\displaystyle n} 个节点传下来。并令 l ( k ) {\displaystyle l(k)} 表示第 k {\displaystyle k} 条连结所在从起始到终端节点的层级。定义

表示给定从第 k {\displaystyle k} 的节点传送的节点有通过下,其传送到的终端节点至少有一个有收到封包的几率。他们证明 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系为

即将通过第k条连结所在从起始到终端节点的所有 α k {\displaystyle \alpha _{k}} 相乘,在该篇文章中亦提供求 γ k {\displaystyle \gamma _{k}} 的演算程序。因此,利用观察到的样本结果,则可推估封包通过率,而封包遗失率则可求之。

以两层的树状网络为例:
Network 2level.JPG

令通过此网络终端节点的可能情况集合为

其中

可计算 γ i {\displaystyle \gamma _{i}} 值如下:


利用 γ k {\displaystyle \gamma _{k}} α {\displaystyle \alpha } 的关系式可得

EM算法为一种在具有无法观测的资料或是混合模型下计算最大概似估计量之一种有效率的反复程序,每次递回(iteration)包含下列两个步骤:

此步骤为在给定完全的资料及当下的参数估计值后,计算对数概似函数的条件期望值。

此步骤为在最大化E步骤中的条件期望值对数概似函数,即求最大概似估计量。

X {\displaystyle \mathbf {X} } 表示观察到的资料, Z {\displaystyle \mathbf {Z} } 表示遗失或无法观测的资料,及 θ {\displaystyle {\boldsymbol {\theta }}} 表示欲估计的参数。演算步骤如下:

相关

  • 咯血咳血又称为咯血,是一种症状,指肺或气管中的出血,经由咳嗽而吐出。多半是因为所吐出的痰中带有血丝而被发现。最常见的原因就是支气管炎、肺炎、肺肿瘤、肺结核等疾病。或是使用
  • 刘嘉麒刘嘉麒(1941年5月29日-),中国火山地质与第四纪地质学家。出生于辽宁丹东。籍贯北宁。满族。1965年毕业于长春地质学院,1967年该院研究生毕业。1986年获中国科技大学研究生院理学
  • 尿液检查尿液分析,又称为尿常规,是针对尿液标本所进行的一组医学检验项目,是医学诊断过程中最为常用的方法之一。尿液分析是历史最为悠久的医学检验方法之一,可以反映肾脏和泌尿道等方面
  • 倒嚼反刍是指动物将胃内的食物倒流回口腔内再次咀嚼的行为,需要分为多个胃室的胃。在休息时将半消化的食浆重新咀嚼,然后将这样再次磨碎的食物咽下,通过微生物消化其他只有一个胃的
  • 巴西整合运动巴西整合运动(葡萄牙语:Ação Integralista Brasileira)是一个巴西极右翼党派,由普利尼奥·萨尔加多创建,并遵循普利尼奥·萨尔加多所创立之整合主义思想。巴西整合运动倡导巴西
  • 日托米尔日托米尔(乌克兰语:Жито́мир)是乌克兰西北部日托米尔州首府,人口约27万。是连接华沙、基辅、明斯克、伊斯梅尔等城镇的交通枢纽。
  • 玉津玉津(越南语:Ngọc Tân,1948年-)是越南歌唱家,出生在河内,祖籍海防。以歌曲《Chiều trên bến cảng》和关于河内的歌曲《Hà Nôi và tôi》,《Người Hà Nội》,《Hà Nội n
  • .mu.mu为毛里求斯国家及地区顶级域(ccTLD)的域名。此域名由毛里求斯网络资讯中心管理,授权特定注册商管理注册事宜。部分注册商的宣传资料认为此域名适合音乐(music)或博物馆(museum)
  • EA SportsEA Sports(又作EA SPORTS)是艺电旗下制造研发体育电子游戏的品牌。前身是艺电的一个行销噱头,他们将尝试仿造现实生活体育网络自称为“EA Sports Network”(EASN),并有着像是约翰
  • 赤金堡组赤金堡组是位于中国甘肃玉门及与内蒙古交界地区的下白垩世地层,1941年由王尚文命名。该地层以紫红、灰绿色砾岩、砂岩、砂质泥岩、灰黑色页岩为主,间夹煤层与泥灰岩。