Davis-Kahan定理

✍ dations ◷ 2025-02-25 23:23:27 #Davis-Kahan定理

Davis-Kahan定理(Davis-Kahan theorem)是随机矩阵分析中的一个重要的基础性定理。它的基本内容是,如果两个矩阵在某种合适的模之下相近,且有足够的特征裂隙,那么它们相应的特征向量子空间也相似。

考虑两个单位列正交矩阵 V , V ^ R n × d {displaystyle V,{hat {V}}in mathbb {R} ^{ntimes d}} (“单位列正交”意为:其满足 V T V = V ^ T V ^ = I d {displaystyle V^{T}V={hat {V}}^{T}{hat {V}}=I_{d}} ) 之列向量分别张成的线性子空间,那么这两个子空间的张角,是由一个矩阵所表示的(显然这是如下熟知的特殊情形之概念上的拓展: d = 1 {displaystyle d=1} 时,通常用一个数值表示两个向量之间的张角),式子如下:

上式中,“ Θ {displaystyle Theta } ”是一个数学运算,表示线性空间之间的张角。

有了线性空间之间张角的定义,便可以开始陈述定理内容。设 Σ , Σ ^ R p × p {displaystyle Sigma ,{hat {Sigma }}in mathbb {R} ^{ptimes p}} 是两个对称的随机矩阵,其特征值记为 λ 1 λ p {displaystyle lambda _{1}geq cdots geq lambda _{p}} λ ^ 1 λ ^ p {displaystyle {hat {lambda }}_{1}geq cdots geq {hat {lambda }}_{p}} 。对任何 ( r , s ) : 1 r s p {displaystyle (r,s):1leq rleq sleq p} ,考虑第 { λ r , , λ s } {displaystyle {lambda _{r},ldots ,lambda _{s}}} 这总共 s r + 1 {displaystyle s-r+1} 个特征值之对应的特征向量所张成的线性子空间,将它记为 V {displaystyle V} ,类似地定义 V ^ {displaystyle {hat {V}}}

下面定义定理中最重要的量,即特征裂隙 δ {displaystyle delta }

定理的结论是,如果 δ > 0 {displaystyle delta >0} ,那么有如下不等式:

其中 F {displaystyle |cdot |_{F}} 表示Frobenius范数,即将矩阵的所有元素平方求和后,再开根号。

Davis-Kahan定理的经典版本有一些可改进之处,主要在于正特征裂隙假设,是一个同时牵涉两个矩阵的特征值 λ {displaystyle lambda } λ ^ {displaystyle {hat {lambda }}} 的条件,这对其应用的方便性造成负面影响。余怡、王腾耀和Richard Samworth于2014年发现如下变体,其最大特色是其只需其中一个矩阵满足正特征裂隙条件。

沿用上面经典版本定理的记号,另记 d = s r + 1 {displaystyle d=s-r+1} ,并用如下的特征裂隙条件代替原定理中的 δ > 0 {displaystyle delta >0}

Yu-Wang-Samworth定理的结论,按经典版的 sin Θ {displaystyle sin Theta } 语言,陈述如下:

其中, {displaystyle |cdot |} 表示矩阵的谱范数,即其最大奇异值。

进一步,按矩阵论语言,有如下更显式的结论:存在一个正交矩阵 O ^ R d × d {displaystyle {hat {O}}in mathbb {R} ^{dtimes d}} (“正交”是指其满足 O T O = I d {displaystyle O^{T}O=I_{d}} ),使得:

虽然Davis-Kahan定理大多数的应用是套用到随机矩阵上,但要注意定理本身并不局限于随机矩阵,无论定理内容中出现的矩阵是常数矩阵还是随机矩阵(抑或是一个确定一个随机),只要假设条件满足,定理的结论都成立(而非仅以大概率成立或渐近成立)。

Davis-Kahan定理拥有广泛的应用,是谱聚类方法的理论基础,在统计学习和统计网络分析的很多涉及聚类问题的研究中,占据重要地位。

特征裂隙

相关

  • 侏罗纪侏罗纪(Jurassic,符号J)是一个地质年代,界于三叠纪和白垩纪之间,约2亿零130万年前(误差值为60万年)到1亿4500万年前(误差值为400万年)。侏罗纪是中生代的第二个纪,开始于三叠纪-侏罗纪
  • 水生植物水生植物的定义至今仍有争议,一般是指能够长期或周期性在水中或水分饱和土壤中正常生长的植物,如苔藓、蕨类、大型藻类及部分种子植物等;于园艺与水族造景,常见的种类大多为种子
  • 蒂尔堡大学坐标:51°33′46″N 05°02′31″E / 51.56278°N 5.04194°E / 51.56278; 5.04194蒂尔堡大学(荷兰语:Universiteit van Tilburg)亦以“提堡大学”、“提尔堡大学”、“堤堡大学
  • 丹尼尔·布拉德利丹尼尔·布拉德利(英语:Daniel W. Bradley,1941年7月13日-),美国病毒学家,以对肝炎病毒的研究而闻名。布拉德利1964年在圣何塞州立大学获学士学位,并于1970年在亚利桑那大学获博士学
  • 马里-夏尔·西奥多德·达穆瓦索马里-夏尔·西奥多德·达穆瓦索·德·蒙特福特(Marie-Charles-Théodore de Damoiseau de Montfort)男爵是一位法国天文学家。1768年4月6日生于贝桑松,1846年8月6日在伊西雷穆
  • 麦克·布雷克麦克·布雷克(英语:Michael Brecker,1949年3月29日-2007年1月13日)是美国爵士|萨克斯风表演者和作曲家。他在21岁加入融合爵士乐队梦(Dreams)并开始了音乐表演生涯。随后和胞兄兰迪
  • 波特托雷波特托雷(Pottore),是印度喀拉拉邦Thrissur县的一个城镇。总人口8210(2001年)。该地2001年总人口8210人,其中男性4023人,女性4187人;0—6岁人口835人,其中男425人,女410人;识字率84.82%
  • 陶冬陶冬(英语:Tao, Dong 1963-)是一位中国经济学家。毕业于北京外国语大学学士,美国犹他大学经济学硕士及博士。。对亚洲经济分析敏锐独到,曾对1997年的亚洲金融风暴和于2004年对中国经济政策发表前瞻性分析,现任瑞士信贷集团董事总经理,亚洲区首席经济分析师。台湾《 今周刊》开一经济分析专栏。
  • 道格拉斯DC-8道格拉斯DC-8,或称麦克唐纳·道格拉斯DC-8,是美国道格拉斯公司研制的四发动机大型喷气式客机,1955年6月开始设计,1958年开始生产。DC-8于1972年停产,被更大的DC-10所取代。现时仅有的DC-8,多数都被改为货机。DC-8是1950年代波音707的最大竞争对手。由于DC-8可运载的货物量较波音707稍多,仍有极少数更换引擎后的DC-8在部分第三世界国家使用,而大多数国家的DC-8与波音707都因为高耗油和重污染等问题于2000年左右宣布停飞。首架DC-8-10型在1958年出厂,DC-8
  • 佐野研二郎佐野研二郎(日语:佐野 研二郎,1972年7月29日-),日本设计师,东京都出身。佐野毕业于多摩美术大学设计科,之后进入大型广告公司博报堂。2008年成立公司MR_DESIGN。2015年,其设计之2020年东京奥运会徽因涉嫌抄袭而在国际上引发极大争议,而在会徽风波之后,佐野再度被揭露其他抄袭争议。佐野研二郎所设计的2020年夏季奥林匹克运动会及2020年夏季残疾人奥林匹克运动会2个会徽是从104件应征作品当中雀屏中选,于2015年7月24日公布。起先是被指与2年前比利时设计师奥利维·德比(Olivier