降维

✍ dations ◷ 2025-11-09 15:38:48 #降维
在机器学习和统计学领域,降维是指在某些限定条件下,降低随机变量个数,得到一组“不相关”主变量的过程。 降维可进一步细分为变量选择和特征提取两大方法。变量选择假定数据中包含大量冗余或无关变量(或称特征、属性、指标等),旨在从原有变量中找出主要变量。现代统计学中对变量选择的研究文献,大多集中于高维回归分析(英语:High-dimensional_statistics),其中最具代表性的方法包括:特征提取可以看作变量选择方法的一般化:变量选择假设在原始数据中,变量数目浩繁,但只有少数几个真正起作用;而特征提取则认为在所有变量可能的函数(比如这些变量各种可能的线性组合)中,只有少数几个真正起作用。有代表性的方法包括:

相关

  • 非裔美国人非裔美国人 42,020,743其他美国黑人列表(英语:Afro-American peoples of the Americas) 美洲裔利比里亚人 · 塞拉利昂克里奥尔人 Black Nova Scotians(英语:Black Nova Scotia
  • 印度南部印度南部是指在今日印度共和国南部的安得拉邦、卡纳塔克邦、喀拉拉邦、泰米尔纳德邦四个邦以及拉克沙群岛和本地治里两个联邦属地组成的范围,共占整个印度的面积达19.31%。在
  • 邱奇阿隆佐·邱奇(Alonzo Church,1903年6月14日-1995年8月11日)是美国数学家,1936年发表可计算函数的第一份精确定义,对算法理论的系统发展做出巨大贡献。邱奇在普林斯顿大学受教并工
  • 苏黎世苏黎世(德语:Zürich .mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium
  • 马尔凯马尔凯(意大利语:Marche,意大利语发音:)是意大利中部的一个大区,北界与艾米利亚-罗马涅大区相邻,托斯卡纳大区位于马尔凯西北,西邻翁布里亚,南邻阿布鲁佐和拉齐奥,而东面则有亚得里亚
  • 岩石循环岩石循环是指不同岩石互相转化的过程。循环的开端是岩浆,经冷却和结晶成为火成岩。岩石经风化、侵蚀分解,再由搬运、分选、沉积成沉积物。后者再岩化成沉积岩。岩石可经压力、
  • 凝结核云凝结核(英语:Cloud condensation nuclei),又称凝结核,是使水蒸气凝结为液态时,作为凝结核心的颗粒。在纯粹只有气态水分子和其他气体存在的空间中,水分子间的相互作用较小,些微的
  • 莫宣学莫宣学(1938年12月-),籍贯广西融水。中国科学院院士,中国地质大学 (北京)教授,博士生导师,中国著名的岩石学家。1960年毕业于北京地质学院地质测量及找矿系并留校任教。1981年-1983
  • 长江三角洲长江三角洲是中国长江入海之前的冲积平原。北起通扬运河,西至南京,南抵钱塘江,东到上海市,江苏省南部和浙江省的杭嘉湖平原,面积约5万平方千米,是一片坦荡的大平原,只有少数小山丘
  • 邻里咖啡店邻里咖啡店或传统咖啡店(马来语:Kopitiam)是一种结合传统早餐和咖啡店的东南亚流行饮食文化,Kopitiam一词是结合马来语中的咖啡(kopi)和福建话中的店(白话字:tiàm)而成的混合词。典