网络诊断

✍ dations ◷ 2025-08-16 00:16:26 #网络,电气工程

网络诊断（Network Tomography）是近代发展的一种新的网络测量与推论方法，透过可收集到的有限资讯来推估无法观测的网络资讯，主要分成主动诊断(active tomography)与被动诊断(passive tomography)两类问题。被动诊断是资料从个别节点搜集，去寻找路径上的资讯，问题在估计起始节点至终端节点之流量矩阵。主动诊断是借由设置接收节点，向接收节点发送大量的封包，根据接收节点收集到的测量数据，分析网络内部有兴趣的参数或识别网络拓扑结构。而衍生出来的统计问题称为统计反向问题(Statistical Inverse Problem)。

网络诊断的概念最早由Vardi在1996年提出，现今的研究主要分为：

所谓网络起始节点至终端节点(SD)流量强度估计主要是想要估计网络内各条SD路径的封包流量。其主要概念为假设我们能观测到网络内各节点互相传送封包的路径，以下简称连结和各条连结的封包流量，由各条连结所观测到的结果来估计各条SD路径的网络流量。

主要问题架构与符号定义如下：假设网络模型内有 $n {\displaystyle n}$ $n$ 个节点、 $r {\displaystyle r}$ $r$ 条连结、 $c {\displaystyle c}$ $c$ 条SD路径且定义A为 $r {\displaystyle r}$ $r$ x $c {\displaystyle c}$ $c$ 的路径矩阵。
举例来说，网络模型有4个节点(a,b,c,d)、7条连结、12条SD路径，如下方左图所示，且路径矩阵A可表达如下方右图所示。

令 $X_{j}^{\left(k\right)}$ $X_{j}^{\left(k\right)}$ 表示第 $j {\displaystyle j}$ $j$ 条SD路径在第 $k {\displaystyle k}$ $k$ 期的封包流量，在此假设 $X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K$ $X_{j}^{\left(k\right)}\sim Poisson(\lambda _{j}),\;j=1,...,c,\;k=1,...,K$ 。
因此连结的流量与SD路径的流量可以表示成下列的线性模型

其中，

我们希望利用观测到的Y向量去估计X向量中的参数值 $\mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'}$ $\mathrm {\lambda =\left(\lambda _{1},...,\lambda _{c}\right)'}$ ，但通常X向量的维度远大于Y向量的维度，因此X可能会有无限多解，而目前发展出下列几种寻找最佳参数解的方法

假设网络模型有2条连结、3条SD路径、1期的SD流量，即 $r=2,c=3,K=1\$ $r=2,c=3,K=1\$
令 $X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3$ $X_{i}\sim Poisson(\lambda _{i}),\;i=1,2,3$ 且 $X_{1}+X_{2}=1,X_{1}+X_{3}=2$ $X_{1}+X_{2}=1,X_{1}+X_{3}=2$
如下图所示

则我们可以得到

因此模型可表示成

以最大概似法求最佳解为例，

先将所有可能的参数解找出。因为封包流量必须为正整数，因此只有以下两组解：

将可能的参数解代入概似函数

找出让概似函数最大的参数解，即为最佳参数解

因为

最佳解为

先将概似函数整理成期望值的型态

选定起始值 $\lambda ^{\left(0\right)}$ $\lambda ^{\left(0\right)}$ ，运用EM算法，进行递回运算，直到找出让期望值最大的参数解

利用EM算法求解的缺点是当网络模型较大时，在计算上比较复杂；即使当期数够多时，EM算法仅能提高估计上的准确性并无法解决计算上的复杂。

针对EM算法的缺点，Vardi在1996年提出一种较为可行的方法，即利用动差法来估计参数解。

假设当各条连结流量观测的期数够多时，根据中央极限定理

利用动差法，令样本平均数等于母体平均数，样本共变异数等于母体共变异数，即

由上述式子即可估计出参数解

因此Vardi提出动差法可解决计算上的困难，也可以利用产生动差等式解决参数解不唯一的情况。

所谓网络连结层级参数推估问题主要是想要推论网络连结的特性，例如节点传输之间资讯遗失率或延迟分配等。其主要概念为假设已知网络的形式，包含节点、路径等，一般常见为树状，以及假设已知网络特性的模型，搜集端点所测量的结果来找出有最大几率产生观察结果的网络参数。

若考虑封包遗失率下，其主要问题架构与符号定义如下：

假设有一个树状网络定义为

表示该网络有V个节点(包含起始节点0、终端节点R及中间节点I)、E条连结。令

其中 $X_{k}$ $X_k$ 表示封包传送是否通过节点 $k {\displaystyle k}$ $k$ ，即

此外，若 $X_{i}=1$ $X_{i}=1$ 且 $X_{j}=1$ $X_{j}=1$ ，表示节点 $i {\displaystyle i}$ $i$ 与 $j {\displaystyle j}$ $j$ 之间的连结有封包通过，此处以 $\alpha \,_{i}$ $\alpha \,_{i}$ 表示封包通过的几率。

举例来说，

上图为一个树状网络

数字表示节点，起始节点为0，中间节点为1、 2、 3，而终端节点为4、5、6、7， $\alpha \,_{i}$ $\alpha \,_{i}$ 表示连结 $i {\displaystyle i}$ $i$ 的通过率。

令封包传送结果 $X_{(R)}=(X_{k})_{k\in R}$ $X_{(R)}=(X_{k})_{k\in R}$ ，则其几率分配表示为

并假设发送了 $n {\displaystyle n}$ $n$ 个封包，令 $n(x)$ $n(x)$ 表示 $x {\displaystyle x}$ $x$ 所获得的封包数，则 $n {\displaystyle n}$ $n$ 个独立的观测值 $x^{1}$ $x^{1}$ 、 $x^{2}$ $x^{2}$ 到 $x^{n}$ $x^{n}$ 的分配为

因此问题的目标即为估计 $\alpha$ $\alpha$ 。

从起始节点传送封包，并观察终端节点封包通过情况。传送封包主要有两种情况，一种为一次只传送到一个接收的端点，称为单一传送；另一种为封包传送到特定的一些接收端点，称为多重传送。然而这两种传送方式较没有弹性，且无法使用不同的流量或不同时间下观察网域，因此Xi et al. (2006)及Lawrence et al. (2006)针对弹性传送(flexicast)封包的情况作探讨。

此种观察封包传送情况来对网络做推论产生了统计反向问题，即利用观察结果来诊断连结中的分配或特征。有许多统计方法可解决此类推论问题，Castro et al. (2004)提到像是降低复杂性的阶层统计模型(Complexity-Reducing Hierarchical Statistical Models)、动差或最大概似法为主的估计、EM及马可夫链蒙地卡罗(Markov Chain Monte Carlo, MCMC)演算方法等已被使用；且认为而使用统计方法来解决此问题的领域仍具有发展性，而未来应有更多现存的统计方法可加以应用。

以下兹列举一种问题情况：“针对多重传送为主的网络来推论该网络的封包遗失率”来说明网络连结参数中的遗失率推估问题。估计封包遗失率为Cáceres et al.(1999)首先研究，在假设连结遗失为独立的伯努利分配下，利用最大概似法来估计多重传送的树状网络中连结遗失率；他们亦证明此估计量具备强烈一致性，并透过最大概似估计量之渐近常态性来推导出这些估计的比率会收敛到真正的比率。

以最大概似法求估计之连结遗失率方法如下：首先计算对数概似函数，

则 $\alpha$ $\alpha$ 的最大概似估计量

另外，Cáceres et al.(1999)亦利用终端节点接收封包几率来估计 $\alpha$ $\alpha$ 。令 $R(k)$ $R(k)$ 为第 $k {\displaystyle k}$ $k$ 个节点传送下来之终端节点所成集合， $\Omega (k)$ $\Omega (k)$ 为 $R(k)$ $R(k)$ 集合中至少有一个终端节点有收到封包之所有观测情况所成集合。假设 $\gamma _{k}=P$ $\gamma _{k}=P$ ，则 $\gamma _{k}$ $\gamma _{k}$ 估计量为 $\Sigma \left$ $\Sigma \left$ ，即观察到的比例总和。令 $k=f\,(j)$ $k=f\,(j)$ 表示节点 $k {\displaystyle k}$ $k$ 为前一个节点 $j {\displaystyle j}$ $j$ 所传下来的，
且定义 $f\,^{n}\,(j)=f(f\,^{n-1}\,(j))$ $f\,^{n}\,(j)=f(f\,^{n-1}\,(j))$ ，即前 $n {\displaystyle n}$ $n$ 个节点传下来。并令 $l(k)$ $l(k)$ 表示第 $k {\displaystyle k}$ $k$ 条连结所在从起始到终端节点的层级。定义

表示给定从第 $k {\displaystyle k}$ $k$ 的节点传送的节点有通过下，其传送到的终端节点至少有一个有收到封包的几率。他们证明 $\gamma _{k}$ $\gamma _{k}$ 跟 $\alpha$ $\alpha$ 的关系为

即将通过第k条连结所在从起始到终端节点的所有 $\alpha _{k}$ $\alpha _{k}$ 相乘，在该篇文章中亦提供求 $\gamma _{k}$ $\gamma _{k}$ 的演算程序。因此，利用观察到的样本结果，则可推估封包通过率，而封包遗失率则可求之。

以两层的树状网络为例：
Network 2level.JPG

令通过此网络终端节点的可能情况集合为

其中

可计算 $\gamma _{i}$ $\gamma _{i}$ 值如下：

则

利用 $\gamma _{k}$ $\gamma _{k}$ 跟 $\alpha$ $\alpha$ 的关系式可得

EM算法为一种在具有无法观测的资料或是混合模型下计算最大概似估计量之一种有效率的反复程序，每次递回(iteration)包含下列两个步骤：

此步骤为在给定完全的资料及当下的参数估计值后，计算对数概似函数的条件期望值。

此步骤为在最大化E步骤中的条件期望值对数概似函数，即求最大概似估计量。

令 $\mathbf {X}$ $\mathbf{X}$ 表示观察到的资料， $\mathbf {Z}$ $\mathbf{Z}$ 表示遗失或无法观测的资料，及 ${\boldsymbol {\theta }}$ ${\boldsymbol {\theta }}$ 表示欲估计的参数。演算步骤如下：

相关

不等鞭毛门 (Heterokonta)不等鞭毛总门（学名：Heterokonta）旧为不等鞭毛门，是真核生物的主要演化支之一，已知的下辖物种超过10万个物种，当中大多数属于藻类，从多细胞的大型藻类海带，到单细胞的各种浮游硅藻，这
美国 (消歧义)美国是美利坚合众国的简称。也可以是︰
玛丽安娜玛丽安娜（法语：Marianne），是法兰西共和国的国家象征。就其外延意义而言，她还是自由与理性的拟人表现。与代表法兰西民族及其历史、国土与文化的“高卢雄鸡”相对，玛丽安娜代表了作
TPD伸缩像素显示器（英语：Telescopic pixel display，简称TDP）是一种新型显示技术，介于液晶显示器（LCD）和数字微镜设备（英语：Digital micromirror device）（DMD）（基于数字光处理投影仪）之间，同时
江宏恩江宏恩（英文名：Nic Chiang，1970年10月30日－），为台湾知名男演员、男歌手。弟弟是知名主厨江振诚。江宏恩出生于台湾桃园大溪，读小学时搬至台北。在高职就读时，即被星探相中拍了包含可
陈　霖陈霖（1945年11月6日－），祖籍福建福州，出生于四川成都，认知科学和实验心理学家，中国科学院院士。拓扑性质初期知觉理论的提出者。陈霖于1970年毕业于中国科学技术大学，此后留校任教。1
女性荷尔蒙女性荷尔蒙，又称女性激素，包括数种在女性身上比较多的荷尔蒙。某些女性荷尔蒙在男性身上也有，不过比较少。卵巢分泌两大类女性荷尔蒙：雌激素（英语：estrogen，又称动情素）和孕激素（prog
露兜树林投（学名：Pandanus tectorius），古作菻荼，别称露兜树、野菠萝、假菠萝等，为露兜树科露兜树属下的一个物种，原产于马来界，澳大利亚东部及太平洋三大岛群。林投具耐风、耐盐的特质，且繁
百威啤酒百威啤酒（Budweiser），简称百威，英文常简称为Bud，是安海斯-布希啤酒厂的主要啤酒品牌。百威啤酒在1876年起开始酿制，时至今日已成为美国人熟识的品牌。其瓶装啤酒的设计，自1876年至
奥克森特·沃奈绍奥克森特·沃奈绍（匈牙利语：Axente Vanessa，1995年11月19日－），匈牙利超级名模。她是高级时装品牌：Calvin Klein、Prada、Chanel的代言人。瓦妮莎上过Interview及Vogue Italia等杂志