概率模型

✍ dations ◷ 2025-07-15 05:02:25 #机器学习

几率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的几率关系。从数学上讲,该模型通常被表达为 ( Y , P ) {\displaystyle (Y,P)} ,其中 Y {\displaystyle Y} 是观测集合用来描述可能的观测结果, P {\displaystyle P} Y {\displaystyle Y} 对应的几率分布函数集合。若使用几率模型,一般而言需假设存在一个确定的分布 P {\displaystyle P} 生成观测数据 Y {\displaystyle Y} 。因此通常使用统计推断的办法确定集合 P {\displaystyle P} 中谁是数据产生的原因。

大多数统计检验都可以被理解为一种几率模型。例如,一个比较两组数据均值的学生t检验可以被认为是对该几率模型参数是否为0的检测。此外,检验与模型的另一个共同点则是两者都需要提出假设并且误差在模型中常被假设为正态分布。

概率模型 P {\displaystyle {\mathcal {P}}} 是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。

参数模型是一组由有限维参数构成的分布集合 P = { P θ : θ Θ } {\displaystyle {\mathcal {P}}=\{\mathbb {P} _{\theta }:\theta \in \Theta \}} 。其中 θ {\displaystyle \theta } 是参数,而 Θ R d {\displaystyle \Theta \subseteq \mathbb {R} ^{d}} 是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为 P = { P ( x ; μ , σ ) = 1 2 π σ exp { 1 2 σ 2 ( x μ ) 2 } : μ R , σ > 0 } {\displaystyle {\mathcal {P}}=\{\mathbb {P} (x;\mu ,\sigma )={\frac {1}{{\sqrt {2\pi }}\sigma }}\exp \left\{-{\frac {1}{2\sigma ^{2}}}(x-\mu )^{2}\right\}:\mu \in \mathbb {R} ,\sigma >0\}}

无参数模型则是一组由无限维参数构成的概率分布函数集合,可被表示为 P = { all distributions } {\displaystyle {\mathcal {P}}=\{{\text{all distributions}}\}}

相比于无参数模型和参数模型,半参数模型也由无限维参数构成,但其在分布函数空间内并不紧密。例如,一组混叠的高斯模型。确切的说,如果 d {\displaystyle d} 是参数的维度, n {\displaystyle n} 是数据点的大小,如果随着 d {\displaystyle d\rightarrow \infty } n {\displaystyle n\rightarrow \infty } d / n 0 {\displaystyle d/n\rightarrow 0} ,则我们称之为半参数模型。

相关

  • 领鞭毛虫纲领鞭毛虫纲(学名:Choanoflagellate)是一种原生生物,是单细胞或群体。拥有一根鞭毛,形态类似于淡水海绵的群体,表面的酪氨酸激酶受体也类似于海绵,被认为是动物的姐妹群。领鞭毛虫的
  • 韩国菜汤饭馔韩国料理(韩语:한국 요리),又称韩餐、韩食、韩国菜/朝鲜菜、朝鲜料理(韩语:조선료리)等,泛指朝鲜民族的饮食文化。韩国料理以清淡为主,少油腻,多有辣。韩国料理有着阴阳五行的思
  • 价值论价值论 (来自古希腊语 ἀξίᾱ, axiā, "价值"; 以及-λόγος, 理性) 价值观的哲学研究。价值论 同时可以用在伦理学以及美学上—亦即高度重视价值观念的哲学领域—或者
  • 曼托瓦曼托瓦(意大利语:Màntova),是意大利伦巴第大区曼托瓦省省会。公元前70年,古罗马诗人维吉尔出生于曼托瓦附近。1341年,曼托瓦城邦向巴伐利亚公国宫廷派遣大使,被认为是现代意义上的
  • 总族/超族族(拉丁文Tribus;英语Tribe)是生物分类法中的一个次要等级,介于亚科和属之间,用于一些科的动物和植物的详细分类。一个族里包含相互之间较其它属于同科的属更加接近的属。在动物
  • 标准蛋白氨基酸列表标准氨基酸(英语:Standard amino acids)或称蛋白氨基酸(proteinogenic amino acids),是生物细胞中用来合成蛋白质的共20种氨基酸。本列表主要描述其名称、标示方法、结构与性质。
  • 日本职业棒球联赛棒球在日本占有非常重要的位置,于20世纪初开始盛行,1950年开始确立了现代的职棒制度,现时不少日本球员效力美国职棒大联盟的球队。此外,每年两次在兵库县西宫市举行的高中甲子园
  • 梭形纺锤形(Fusiform;源于希腊文的fusu,即纺锤(英语:Spindle (textiles))的意思),又译作梭形,是一种两端尖细、中间宽阔膨凸的形状。这种形状常于形容细胞、腹足纲软体动物的螺壳、又或鱼
  • 军事需求局中国人民解放军军徽国务院中央军委测绘机构中央军委联合参谋部军事需求局,位于北京市,是中央军委联合参谋部下属局,负责军事需求工作。在深化国防和军队改革中,2016年1月撤销中
  • U-2击坠事件1960年U-2击坠事件发生在冷战期间的1960年5月1日,一架美国洛克希德U-2侦察机在苏联领空遭击落。最初以美国总统德怀特·艾森豪威尔为首的美国政府否认该机制造目的以及该趟任