概率模型

✍ dations ◷ 2025-04-03 17:01:46 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 核糖核酸内切酶核糖核酸内切酶(英语:Endoribonuclease)是一种RNA酶,对核糖核酸内一定碱基序列中某一定位置发生作用(可以是单链,也可以是双链),把这位置的链切开,再由核糖核酸外切酶进行分解剪切。
  • 氧的同素异形体人们对氧的同素异形体有着各种认知。其中最熟悉的是双氧(O2),大量存在于地球大气层,也被称为分子氧或三线态氧。另一个是高活性的臭氧(O3)。其他包括:原子氧有非常高的活性,很难长时
  • 万华夜市坐标:25°02′19″N 121°29′55″E / 25.0385873°N 121.4985012°E / 25.0385873; 121.4985012艋舺夜市位于中华民国台北市万华区广州街,或称为万华夜市,范围包括广州街、梧
  • 休伯特·帕里第一代从男爵·查尔斯·休伯特·哈斯廷斯·帕里爵士(英语:Sir Charles Hubert Hastings Parry,1848年2月27日-1918年10月7日),英国作曲家,音乐教育家,音乐学家。帕里的父亲是一位富
  • 数码摄影数字摄影,是指使用数字成像组件(CCD,CMOS)替代传统菲林来记录影像的技术。配备数字成像组件的相机统称为数字相机。对于数码摄影来说,光学影像的捕获依然运用小孔成像原理,但其将
  • 格林尼治半岛坐标:51°29′53″N 0°00′23″E / 51.498131°N 0.006317°E / 51.498131; 0.006317格林威治半岛(Greenwich Peninsula)是英格兰伦敦东南部的一个地区,位于皇家格林威治伦敦自
  • 蜜蜂属蜜蜂(Apis)是一种会飞行的真社会性昆虫,采食花粉和花蜜并酿造和储存蜂蜜,利用蜂蜡来建造长期居住的群体巢穴。在21世纪早期,被认可的蜜蜂种类仅有7种,44个亚种,尽管历史上被认可的
  • 2006年夏威夷地震2006年夏威夷地震是指当地时间2006年10月15日早上7时07分49秒发生于美国夏威夷州夏威夷岛(大岛,Hawai'i)普阿口(Puakō)西南方10千米处的离岸地震,地震震级达到里氏震级6.7级,造成
  • 荷属马六甲荷属马六甲(1641年-1824年),是马来西亚马六甲州被外国势力控制最长的时期。荷兰人统治前后达183年,包括拿破仑战争(1795年-1818年)期间英国人的占领。这段期间除了发生几次小型的严
  • 男排联赛中国男子排球超级联赛(英语:China Volleyball League,简称CVL及排超,前称中国男子排球联赛),创建于1996年,由中国排球协会组织,并由体育之窗文化产业有限公司(体育之窗)负责营运及推广