概率模型

✍ dations ◷ 2025-12-09 13:27:43 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 医院信息系统医院信息系统,亦称医院管理信息系统,是指利用计算机软硬件技术、网络通信技术等现代化手段,对医院及其所属各部门的人流、物流、财流进行综合管理,对在医疗、诊断活动各阶段产生
  • 表演艺术音乐 · 舞蹈 · 戏剧 (戏曲 · 话剧 · 歌剧 · 音乐剧 · 芭蕾舞剧)曲艺  · 杂技 · 魔术 · 木偶戏 · 默剧 · 公共演说戏剧 · 悲剧 · 喜剧
  • 执行功能异常心理学 行为遗传学 生物心理学 心理药物学 认知心理学 比较心理学 跨文化心理学 文化心理学 差异心理学(英语:Differential psychology) 发展心理学 演化心理学 实验心理学
  • 清德宗清朝第11位皇帝光绪帝(1871年8月14日-1908年11月14日),名载湉(满语:ᡯᠠᡳ ᡨᡳᠶᠠᠨ,穆麟德:Dzai Tiyan,太清:Zai Tiyan),爱新觉罗氏,是清朝第11位,也是自入关以来的第九位皇帝,同时是中
  • 海山街道海山街道位于中国广东省深圳市盐田区,下辖四个社区:
  • 老挝保护国老挝保护国,正式名称为老挝法国保护国(法语:Protectorat français du Laos),或称法属老挝,是法兰西殖民帝国印度支那殖民地的一部分。其建立标志着老挝历史上的分裂时期和暹罗、
  • 坎伯兰县坎伯兰县(英语:Cumberland County)是美国缅因州西南部的一个县。面积3,152平方公里。根据美国2000年人口普查,共有人口265,612。县治波特兰(Portland)。成立于1760年5月28日,县名来
  • 尼皮辛湖坐标:46°17′N 80°00′W / 46.283°N 80.000°W / 46.283; -80.000尼皮辛湖是加拿大的湖泊,由安大略省负责管辖,长65公里、宽25公里,面积873平方公里,集水区面积12,173平方公里
  • 乔治·威斯汀豪斯小乔治·威斯汀豪斯(英语:George Westinghouse, Jr.,1846年10月6日-1914年3月12日),是美国宾州的实业家、发明家、工程师及西屋电气创始人。他发明了火车的空气轫机系统,并且是电力
  • 库特内河库特内河(英语:Kootenay或Kootenai,也被称作Flatbow)是哥伦比亚河的一条重要支流,流经加拿大卑诗省的东南部和美国西北部的爱达荷州与蒙大拿州,全长781千米(485英里),起源于加拿大落