降维

✍ dations ◷ 2025-12-05 07:08:52 #降维
在机器学习和统计学领域,降维是指在某些限定条件下,降低随机变量个数,得到一组“不相关”主变量的过程。 降维可进一步细分为变量选择和特征提取两大方法。变量选择假定数据中包含大量冗余或无关变量(或称特征、属性、指标等),旨在从原有变量中找出主要变量。现代统计学中对变量选择的研究文献,大多集中于高维回归分析(英语:High-dimensional_statistics),其中最具代表性的方法包括:特征提取可以看作变量选择方法的一般化:变量选择假设在原始数据中,变量数目浩繁,但只有少数几个真正起作用;而特征提取则认为在所有变量可能的函数(比如这些变量各种可能的线性组合)中,只有少数几个真正起作用。有代表性的方法包括:

相关

  • 产物在原子核物理学中,衰变产物(也称至子同位素)是一个元素经过辐射衰变后剩下来的核素。辐射衰变通常涉及很多过程(衰变链)。例如,铀238(U-238)衰变至钍234(Th-234),钍234(Th-234)
  • 麦芽麦芽(英语:Malt)是将谷物浸泡在水中,促使其发芽,利用其发芽产生的酶,将谷粒中的淀粉转化为麦芽糖,然后再迅速地加热干燥,所产生的产品。,食品工业中一般多用大麦,也有用其他谷物的。麦
  • 铁圈铁圈又称铁环在实验室中用于安装在铁架台上来支撑烧瓶或烧杯等仪器。有的铁圈包括了一个夹子,用以连接铁架台,若铁圈自身不含夹子,则需要使用十字夹作为连接工具。
  • 训名训名,又称学名。有一些家庭的儿童,入学受教育时或会由父亲、老师或其他长辈,取一个“训名”,供老师称呼,有别于小名、表字。如《红楼梦》:“这薛公子学名薛蟠,表字文起。”《宋史》
  • 秦岭秦岭是横贯中国中部的一座褶皱山脉,西起甘肃临洮,东到河南省的崤山、熊耳山-嵩山和伏牛山地区,主体位于陕西省中南部,是陕西省关中地区与陕南地区的分界线,呈东西走向,长1600公里
  • DNA dependent DNA聚合酶DNA聚合酶(DNA Polymerase,EC编号2.7.7.7)是一种参与DNA复制的酶。它主要是以模板的形式,催化脱氧核糖核苷酸的聚合。聚合后的分子将会组成模板链并再进一步参与配对。DNA聚合酶
  • 回归谬误回归谬误(regression fallacy)是一种非形式谬误,系因未考虑统计学上随机起落的回归现象,造成不恰当的因果推论。小明前天发烧,今天吃了退烧药,小明烧退是退烧药的效果。发烧二天后
  • 视蛋白视蛋白(英语:Opsins)是一类在视网膜感光细胞上发现的35–55千道尔顿的跨膜G蛋白偶联受体,具有感光作用,是retinylidene protein家族的一员。共有五类经典的视蛋白与视觉有关,参与
  • 兰德纸草书莱因德数学纸草书(又译作林德数学手卷;Rhind Mathematical Papyrus),也称阿姆士(Ahmose)纸草书,或者大英博物馆10057和10058号纸草书,是古埃及第二中间期时代(约前1650年)由僧侣阿姆士
  • 溴化铵溴化铵(Ammonium bromide), 外观为无色或白色立方结晶粉末,可通过氨与溴化氢反应制取。可溶于水、醇,丙酮,微溶于乙醚。用于医药镇静剂、照相感光剂等。对全身中毒作用微弱,但要防