耦合 (概率)

✍ dations ◷ 2025-11-26 10:26:38 #概率论,多变量统计

关联结构(英语:Copula),处理统计中随机变量相关性问题的一种方法,由一组随机变量的边际分布来确定它们的联合分布。通过关联结构来确定一个联合分布的方法是基于如下思想,一个简单转换可以通过分别将每个边缘分布都转换为平均分布的转换组成。这样,一个关联结构(dependence structure)就可以表达为一个基于上述所得平均分布之上的联合分布,而关联结构(copula)即是边缘均匀随机变量之上的一个联合分布。在实际应用中,上述的转换可能被设置为每个边缘变量的初始化步骤,或者上述转换的参数可能根据具体关联结构的对应参数设置。

按照所表达的关联关系的不同,关联结构被分为很多不同类别。典型情况下,一个种类的关联结构有多个参数用来表达不同的关联强度和关联类型。下面将大概描述一些有代表性的关联结构。关联结构的一个典型应用是,通过选择某一种类的关联结构来定义某一适合特定样本数据分布的联合分布,当然关联结构也可以来自于任何相应的给定联合分布。

考察两个随机变量,,分别具有连续累积分布函数。通过分别在两个随机变量上应用概率积分转换,得到 = () 和 = ()。因此和都是具有连续均匀分布的变量,相关性通常取决于和是否是相关(自然,如果和是不相关的,那么和也是不相关的)。因为这个转换是可逆的,可以定义和之间的相关性等于和之间的相关性。因为和是均匀分布的随机变量,所以问题被简化为定义一个在两个均匀分布之上的二项分布,这就是关联结构。所以,这一基本思想就是,通过把边缘变量转化为均匀分布变量而不再需要考察很多不同的边缘分布以简化问题,然后再把相关性定义为一个在均匀分布之上的联合分布。

一个 关联结构是一个定义在维单位立方体上的多元联合分布,其每个边缘分布都是在区间上的均匀分布。

特别的, C : n {\displaystyle C:^{n}\to } 维关联结构,有

其中 N ( z ) = card { k z k = x k } {\displaystyle N(\mathbf {z} )=\operatorname {card} \{k\mid z_{k}=x_{k}\}} -体积(volume)。

由Sklar提出的这条定理是大多数关联结构的应用的基础。Sklar定理指出,一个给定的个变量的联合分布函数,, ,,...为其边缘分布函数,必存在这样一个关联结构使 = (, ,,...

以二项分布为例,Sklar定理应用如下。对任一二项分布函数(, ),令() = (, ∞) 而() = (∞, ) 为其单变量边缘概率分布函数。那么存在关联结构以使

(此处已知分布和它的累积分布函数)。此外,如果边缘分布() 和()连续,那么关联结构函数是唯一的。否则,关联结构在边缘分布的值域上是唯一确定的。

最小(反单调)关联结构:是所有关联结构的下边界。仅在二项分布中,变量间表现为完全负相关。

对-元关联结构,下边界为

最大 (共单调 ) 关联结构:是所有关联结构的上边界。其在二项分布中,变量间表现为完全正相关:

对-元关联结构,上边界为

结论:对所有关联结构(, ),

对于多元关联的情况为

在金融建模中常用到的一个关联结构是正态关联结构,正态关联结构是根据Sklar定理由二元正态分布构成。设 Φ ρ {\displaystyle \Phi _{\rho }} ,则正态关联结构函数为

其中, u , v {\displaystyle u,v\in } 微分得出关联结构的密度函数:

其中

是皮尔逊矩相关系数为标准二元正态分布的概率密度函数,其标准正态密度为 φ {\displaystyle \varphi }

相关

  • 病菌放线菌门 Actinobacteria(高G+C) 厚壁菌门 Firmicutes(低G+C) 无壁菌门 (无细胞壁)产水菌门 Aquificae 异常球菌-栖热菌门 Deinococcus-Thermus 纤维杆菌门-绿菌门/拟杆菌门 Fibro
  • 蓝起司蓝乳酪(Blue cheese)又称蓝纹干酪、蓝芝士、蓝起司,是干酪的一种,特点是以青霉菌发酵而成,使其表面有一些蓝色的斑纹。蓝干酪可以用牛奶或羊奶制成。较著名的蓝干酪种类包括法
  • 菖蒲菖蒲(学名:Acorus calamus),也叫做白菖蒲、藏菖蒲,古名蒖、䒢,是一种菖蒲科的水生草本植物。菖蒲分布很广,整个温带基本都能找到它,中国各地也都有分布。菖蒲可以提取芳香油;端午节有
  • 脱脂牛奶牛乳,俗称牛奶,是最古老的天然饮料之一。顾名思义,牛乳是牛的乳汁。在不同国家,牛乳也分有不同的等级,目前最普遍的是全脂、高钙低脂及脱脂牛乳。美国将牛乳按照脂肪含量分为五类
  • 伊拉克复兴党阿拉伯复兴社会党(阿拉伯语:حزب البعث العربي الاشتراكي‎),简称复兴党(另可音译为巴斯党),成立于1947年,是一个激进、世俗的阿拉伯民族主义政党。作为一个
  • 沂山沂山,又称“海岳”,“海岱”,“东镇”,位于中国山东省临朐县境内,在县城以南45公里。是沂蒙山的组成部分。主峰玉皇顶海拔1032米。沂山别称“东泰山”,居中国五大镇山之首,素有“泰
  • 佟宝存佟宝存(1933年-),河北乐亭人,中国人民解放军将领、中国人民解放军中将。1991年,授予中国人民解放军中将,曾任沈阳军区副司令员。
  • 鹿山 (台湾)鹿山为台湾玉山山脉中的一座高山,座落于高雄市桃源区梅山里,靠近南投县信义乡交界,标高2,981米,是台湾百岳名峰之中唯二高度未及3,000米者(另一座为六顺山),位于玉山南峰东侧偏北,辖
  • 阿诺·图尔南阿诺·图尔南(法语:Arnaud Tournant,1978年4月5日-),生于鲁贝,是一名法国男子自行车运动员。他曾参加2000年、2004年和2008年三届奥运,共收获一枚金牌、两枚银牌和一枚铜牌。
  • 范易谋埃马纽埃尔·法贝尔 (法语:Emmanuel Faber, 1964年1月22日-),中文名范易谋,是一位法国企业家,达能集团首席执行官。1964年出生于法国格勒诺布尔,1980年代拿到法国业士文凭,1986年毕业