概率模型

✍ dations ◷ 2025-11-28 11:53:08 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 伯罗奔尼撒伯罗奔尼撒(希腊语:Πελοπόννησος,转写:Peloponnisos)是希腊南部的一个半岛。行政区划而言,半岛东南部是伯罗奔尼撒大区,西北部是西希腊大区。面积15491平方公里,人口632
  • 巴黎唐人街巴黎的主要唐人街(Quartier chinois de Paris),称为舒瓦西三角(Triangle de Choisy)或小亚洲(Petite Asie),位于巴黎十三区东南,这一带有许多高层公寓。1970年代,来自前法国殖民地法属
  • 空难列表空难列表可以指:
  • 亚实基拿亚实基拿(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Taamey
  • 军屯军屯是指驻屯的军队,利用驻屯军队就地耕种土地。军屯是“寓兵于农”的政策。郑成功论军屯为:“夫定国之术,在于强兵足食,秦人以急农兼天下,孝武以屯田定西域,此先代之良式也”。汉
  • 傣那德宏傣语,又称傣纳语、傣那语,是德宏傣族人的语言,主要分布于中国云南省的德宏傣族景颇族自治州、普洱市、临沧市和保山市,缅甸、老挝也有分布。属于侗台语系台语支,和泰语有亲属
  • 顾崇廉顾崇廉(1931年6月6日-2007年1月15日),中华民国海军二级上将、政治人物,生于江苏无锡,亲民党籍,毕业于海军官校43年班、美国海军战争学院66年班,曾任海军官校校长、海军总司令、副参
  • 深夜访谈节目晚间娱乐节目(英文:Late night television或Late Show,有时称为:晚间秀)为于晚间播出的幽默谈话类或单人节目。一般播出时间为周末或周日的晚上9点以后。晚间娱乐节目一般为熬夜
  • 胞果胞果是被子植物的一种果实类型,和瘦果类似,是单果类干果中的一种闭果,其成熟果实的果皮发育成薄膜状,干燥且不开裂,果皮与种皮分离。例如部分苋科(包括传统藜科,该科在APG系统中已
  • 美国西岸美洲西岸(West Coast、Western Seaboard或Pacific Seaboard)指美国西部的州,位于太平洋海岸,一般包括阿拉斯加、华盛顿州、俄勒冈州和加利福尼亚州。虽然内华达州和亚利桑那州是