首页 >
聚类分析
✍ dations ◷ 2025-06-28 07:30:05 #聚类分析
聚类分析(英语:Cluster analysis)亦称为群集分析,是对于统计数据分析的一门技术,在许多领域受到广泛应用,包括机器学习,数据挖掘,模式识别,图像分析以及生物信息。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。一般把数据聚类归纳为一种非监督式学习。数据聚类算法可以分为结构性或者分散性。结构性算法利用以前成功使用过的聚类器进行分类,而分散型算法则是一次确定所有分类。结构性算法可以从上至下或者从下至上双向进行计算。从下至上算法从每个对象作为单独分类开始,不断融合其中相近的对象。而从上至下算法则是把所有对象作为一个整体分类,然后逐渐分小。分布式聚类算法,是一次性确定要产生的类别,这种算法也已应用于从下至上聚类算法。基于密度的聚类算法,是为了挖掘有任意形状特性的类别而发明的。此算法把一个类别视为数据集中大于某阈值的一个区域。DBSCAN和OPTICS是两个典型的算法。许多聚类算法在执行之前,需要指定从输入数据集中产生的分类个数。除非事先准备好一个合适的值,否则必须决定一个大概值,关于这个问题已经有一些现成的技术。在结构性聚类中,关键性的一步就是要选择测量的距离。一个简单的测量就是使用曼哈顿距离,它相当于每个变量的绝对差值之和。该名字的由来起源于在纽约市区测量街道之间的距离就是由人步行的步数来确定的。一个更为常见的测量是欧式空间距离,他的算法是找到一个空间,来计算每个空间中点到原点的距离,然后对所有距离进行换算。常用的几个距离计算方法:在已经得到距离值之后,元素间可以被联系起来。通过分离和融合可以构建一个结构。传统上,表示的方法是树形数据结构,
然后对该结构进行修剪。树的根节点表示一个包含所有项目的类别,树叶表示与个别的项目相关的类别。层次聚类算法,要么是自底向上聚集型的,即从叶子节点开始,最终汇聚到根节点;要么是自顶向下分裂型的,即从根节点开始,递归的向下分裂。任意非负值的函数都可以用于衡量一对观测值之间的相似度。决定一个类别是否分裂或者合并的是一个连动的标准,它是两两观测值之间距离的函数。在一个指定高度上切割此树,可以得到一个相应精度的分类。它的层次聚类树如下图K-均值算法表示以空间中k个点为中心进行聚类,对最靠近他们的对象归类。算法归纳为(J. MacQueen, 1967):该算法的最大优势在于简洁和快速。劣势在于对于一些结果并不能够满足需要,因为结果往往需要随机点的选择非常巧合。For spectral clustering :For estimating number of clusters:For discussion of the elbow criterion:
相关
- 认知行为疗法认知行为治疗(英语:Cognitive Behavioral Therapy,简称 CBT)是一种心理治疗的取向、一种谈话治疗,以目标导向与系统化的程序,解决丧失功能的情绪、行为与认知问题。不同的治疗方式
- 频尿症频尿症(英文:Frequent urination)。是指一个人在特定时间内的排尿次数比正常人高。一般正常的成年人,一天排尿次数大约5至7次,夜间0至1次,女性通常会较少。因此排尿10次以上一般都
- 妊娠毒血症子痫前症(拉丁语:pre-eclampsia, preeclampsia,缩写为PE),又称前兆子痫,早前也称为妊娠毒血症(英语:toxemia),为怀孕期间发生的疾病,其特征为高血压与蛋白尿。该疾病通常发生于第三孕期
- 挪威语挪威语(norsk),中文也称挪威文,是日耳曼语族的一个分支,普遍通用于挪威,也是挪威的官方语言。挪威语与瑞典语和丹麦语十分相似,所以这三种语言的人可以互相沟通。由于丹麦语从十六
- 顾客顾客或客户可以指用金钱或某种有价值的物品来换取接受财产、服务、产品或某种创意的自然人或公司 。是商业服务或产品的采购者,他们可能是最终的消费者、代理人或供应链内的
- 水星水星(拉丁语:Mercurius;英语:Mercury),中国古称辰星;到西汉时期,《史记‧天官书》作者天文学家司马迁从实际观测发现辰星呈灰色,与“五行”学说联系在一起,以黑色配水星,因此正式把它命
- 单胺类神经递质单胺神经递质(英语:monoamine neurotransmitter)是含有芳乙胺结构的神经递质和神经调质,所有单胺类都是从芳香族氨基酸(苯丙氨酸、酪氨酸、色氨酸)和甲状腺激素衍生而来,经芳香族L-
- 丙酮酸羧化酶结构 / ECOD丙酮酸羧化酶,属于连接酶类的酶,催化(根据不同的物种)丙酮酸的可逆羧基化,形成草酰乙酸。丙酮酸草酰乙酸EC 1.1/2/3/4/5/6/7/8/9/10/11/12/13/14/15/16/17/18/19/20/2
- 方守贤方守贤(1932年10月28日-2020年1月19日),安徽太平人,生于上海,中国加速器物理学家,中国科学院高能物理研究所研究员、前所长,北京正负电子对撞机国家实验室主任,中国科学院数学物理学
- Cu(PhCOO)sub2/sub苯甲酸铜是一种无机化合物,化学式为Cu(C6H5CO2)2。该化合物有时会用作烟火中的蓝光源。实验室里,苯甲酸铜可以由苯甲酸钾和硫酸铜反应得到:苯甲酸铜有至少两种结构,其结构取决于