概率模型

✍ dations ◷ 2025-02-23 14:18:45 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 配位化学配位化合物(英语:coordination complex),简称配合物,又称为络合物、络鹽、复合物,包含由中心原子或离子与几个配体分子或离子以配位键相结合而形成的复杂分子或离子,通常称为“配位
  • 核子物理学原子核物理学(简称核物理学,核物理或核子物理)是研究原子核成分和相互作用的物理学领域。它主要有三大领域:研究各类亚原子粒子与它们之间的关系、分类与分析原子核的结构并带动
  • 传导电子电传导(英语:electrical conduction)是指介质内,载电荷的粒子的运动。称这些粒子为电荷载子。它们的运动形成了电流。这运动可能是因为感受到电场的作用而产生的,或是因为载子分
  • 郎君郎君可以指:
  • 蒋介石政府蒋中正政府是指在蒋中正担任中华民国总统和中国国民党总裁期间的中华民国政府,承继于之前蒋中正担任国民政府军事委员会委员长及国民政府主席的国民政府,在此时期内的政府各部
  • 卡利特瓦河卡利特瓦河是俄罗斯的河流,由罗斯托夫州负责管辖,属于北顿涅茨河的左支流,河道全长308公里,流域面积10,600平方公里,河水主要来自融雪,支流有博利沙亚河。
  • 不见不散不见不散可以指:
  • 王浚王浚(252年-314年),字彭祖,太原晋阳人。西晋骠骑将军王沈之子,自己亦是西晋重要将领,都督幽州诸军事,长驻北方疆土并与北方边族交往频繁。但永嘉之乱后生不臣之心,亦与段部鲜卑交恶,最
  • 乙烯二酮乙烯二酮也称为“二氧化二碳”,是一种早于1913年被提出,但直到2015年才被证实存在的碳氧化物。乙烯二酮的分子式为C2O2, 结构式为O=C=C=O。C2O2可以看作是CO的二聚体或乙醛酸的
  • 自环在图论中,自环(Loop)是一条顶点与自身连接的边。简单图中不包含自环。根据上下文的不同,一个图或者多重图可能被定义为允许或不允许拥有自环(通常与允许或不允许拥有重边一致):在只