概率模型

✍ dations ◷ 2025-05-18 07:37:57 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 载脂蛋白结构 / ECOD载脂蛋白(英语:Apolipoproteins)是指一种会与脂类(脂溶性物质,如脂肪与胆固醇)结合的蛋白质,以形成脂蛋白。脂蛋白借着穿梭于淋巴系统与循环系统以转运脂质。脂蛋白的脂
  • 大气光气辉(有时也称为夜辉)是在行星大气层中非常弱的发射光。在地球的大气层,这种光学现象导致在背向太阳的夜空即使在排除了星光和扩散的阳光,也不会完全黑暗。气辉现象是瑞典科学家
  • 康拉德·格斯纳康拉德·格斯纳(德语:Conrad Gesner,1516年3月26日-1565年12月13日),瑞士博物学家、目录学家。他的五卷本巨著《动物史》涵盖广泛,且配有精确的插图,被认为是动物学研究的起源之作。
  • 布兰克特姐妹勃朗特三姊妹(英语:Brontë family or The Brontës),是三位英国著名文学女作家,并且是亲生三姊妹,分别是:1847年,夏洛蒂的《简·爱》,艾米莉的《呼啸山庄》,安妮的《荒野庄园的房客》
  • iEcoRIEcoRI(“I”是“1”的意思)是一种核酸酶,来自某些特定品系的大肠杆菌(E. coli,也是其名称由来),是此种细菌体内参与限制修饰系统的酵素。在分子生物学或其他分子层次的生物学研究上
  • C01CA·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码C01(心脏病治疗药)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Collab
  • 多媒体机台互动式资讯服务站(英语:Interactive kiosk,简称:Kiosk)是一部电脑终端机,以特定规格的硬件与软件来制作,用来提供通讯、商业、娱乐或是教育的资讯与应用服务。早期的互动式资讯服务
  • 银钱银钱可以指:
  • 肺鱼肺鱼亚纲(学名:Dipnomorpha)是硬骨鱼类的一个类群的鱼,出现在距今约4亿年前,是现存最古老的鱼类之一。肺鱼颌为自接式,平时用鳃呼吸,在干涸时可以用鳔当作肺呼吸,膘在食道处有一开口
  • 马尔代夫总统马尔代夫共和国总统是马尔代夫的国家元首和政府首脑,并且是马尔代夫的第一公民和武装部队的最高指挥官。马尔代夫原为英国的保护地,直到1965年7月25日为止。1953年曾经成立过