耦合 (概率)

✍ dations ◷ 2025-04-26 13:15:02 #概率论,多变量统计

关联结构(英语:Copula),处理统计中随机变量相关性问题的一种方法,由一组随机变量的边际分布来确定它们的联合分布。通过关联结构来确定一个联合分布的方法是基于如下思想,一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成。这样,一个关联结构(dependence structure)就可以表达为一个基于上述所得平均分布之上的联合分布,而关联结构(copula)即是边缘均匀随机变量之上的一个联合分布。在实际应用中,上述的转换可能被设置为每个边缘变量的初始化步骤,或者上述转换的参数可能根据具体关联结构的对应参数设置。

按照所表达的关联关系的不同,关联结构被分为很多不同类别。典型情况下,一个种类的关联结构有多个参数用来表达不同的关联强度和关联类型。下面将大概描述一些有代表性的关联结构。关联结构的一个典型应用是,通过选择某一种类的关联结构来定义某一适合特定样本数据分布的联合分布,当然关联结构也可以来自于任何相应的给定联合分布。

考察两个随机变量,,分别具有连续累积分布函数。通过分别在两个随机变量上应用概率积分转换,得到 = () 和 = ()。因此和都是具有连续均匀分布的变量,相关性通常取决于和是否是相关(自然,如果和是不相关的,那么和也是不相关的)。因为这个转换是可逆的,可以定义和之间的相关性等于和之间的相关性。因为和是均匀分布的随机变量,所以问题被简化为定义一个在两个均匀分布之上的二项分布,这就是关联结构。所以,这一基本思想就是,通过把边缘变量转化为均匀分布变量而不再需要考察很多不同的边缘分布以简化问题,然后再把相关性定义为一个在均匀分布之上的联合分布。

一个 关联结构是一个定义在维单位立方体上的多元联合分布,其每个边缘分布都是在区间上的均匀分布。

特别的, C : n {\displaystyle C:^{n}\to } 维关联结构,有

其中 N ( z ) = card { k z k = x k } {\displaystyle N(\mathbf {z} )=\operatorname {card} \{k\mid z_{k}=x_{k}\}} -体积(volume)。

由Sklar提出的这条定理是大多数关联结构的应用的基础。Sklar定理指出,一个给定的个变量的联合分布函数,, ,,...为其边缘分布函数,必存在这样一个关联结构使 = (, ,,...

以二项分布为例,Sklar定理应用如下。对任一二项分布函数(, ),令() = (, ∞) 而() = (∞, ) 为其单变量边缘概率分布函数。那么存在关联结构以使

(此处已知分布和它的累积分布函数)。此外,如果边缘分布() 和()连续,那么关联结构函数是唯一的。否则,关联结构在边缘分布的值域上是唯一确定的。

最小(反单调)关联结构:是所有关联结构的下边界。仅在二项分布中,变量间表现为完全负相关。

对-元关联结构,下边界为

最大 (共单调 ) 关联结构:是所有关联结构的上边界。其在二项分布中,变量间表现为完全正相关:

对-元关联结构,上边界为

结论:对所有关联结构(, ),

对于多元关联的情况为

在金融建模中常用到的一个关联结构是正态关联结构,正态关联结构是根据Sklar定理由二元正态分布构成。设 Φ ρ {\displaystyle \Phi _{\rho }} ,则正态关联结构函数为

其中, u , v {\displaystyle u,v\in } 微分得出关联结构的密度函数:

其中

是皮尔逊矩相关系数为标准二元正态分布的概率密度函数,其标准正态密度为 φ {\displaystyle \varphi }

相关

  • 心血管造影血管摄影,或称动脉摄影、血管造影,是一种医学影像技术,用x光照射人体内部,观察血管分布的情形,包括动脉、静脉或心房室。 葡萄牙籍医师兼神经学家Egas Moniz(1949年诺贝尔奖的得主
  • 复制起点复制起点或复制原点(英语:origin of replication 或 replication origin)是在基因组上复制(replication)起始的一段序列。其中复制可以是在生命体中(如真核生物或者原核生物)的DNA
  • American Scientist《美国科学家》(英语:American Scientist)(非正式的缩写是AmSci)是美国发行的一本关于科学和技术的双月刊杂志。自1913年由Sigma Xi科学研究学会出版。每期都包括著名科学家和工
  • 贝叶斯网络贝叶斯网络(Bayesian network),又称信念网络(belief network)或是有向无环图模型(directed acyclic graphical model),是一种概率图型模型,借由有向无环图(directed acyclic graphs, o
  • 江淮官话江淮官话,又称宁白、下江官话、下江话、江淮话、江北话、淮语,南方官话的重要组成部分。江淮话在词汇、音韵、语法等方面与北方官话相比都具有较大差异,最大特色就是江淮官话完
  • 2014年亚洲运动会羽毛球女子双打比赛2014年亚洲运动会羽毛球比赛为第十七届亚洲运动会的其中一项竞赛项目,共产生七面金牌;赛事将于2014年9月20日至9月29日在桂阳体育馆举行。本条目为女子双打项目的比赛结果。大
  • 剥制剥制(Taxidermy;源于古希腊语,意思是“皮肤的排列”)是一种将已死亡的动物(特别是脊椎动物) 透过泡制、剥皮、填充及上架等步骤来保存并展览的标本制作技术。被保存的可能是狩猎的
  • 塞缪尔·诺亚·克莱默塞缪尔·诺亚·克莱默(Samuel Noah Kramer,1897年-1990年)是著名的历史学家,专长于苏美尔历史问题研究。克莱默1897年生于乌克兰扎什基夫,1905年随父母移民到美国的费城,1929年获得
  • 枪口初速枪口初速(muzzle velocity)指的是枪炮发射的抛射物(弹头或炮弹)在飞离身管出口时瞬间的运动速度,单位通常以米/秒(m/s)或英尺/秒(ft/s或fps)来表示。枪口初速可以结合弹头质量来计算
  • 玛丽·卡尔金斯玛丽·卡尔金斯(Mary Whiton Calkins,1863年3月30日-1930年2月27日)是一位美国哲学家、心理学家,第一位当选为美国心理学会主席的女性。 1863年3月30日,玛丽·卡尔金斯出生在美国