层次聚类

✍ dations ◷ 2025-11-10 16:46:45 #层次聚类

在数据挖掘和统计学中，层次聚类（英语：Hierarchical clustering）是一种旨在建立聚类的层次结构的聚类分析方法。层次聚类的策略通常有两种：

凝聚和分离的操作通常用贪心算法实现，结果通常用树状图展示。

标准的凝聚层次聚类（Hierarchical agglomerative clustering，HAC）算法的时间复杂度为 ${displaystyle {mathcal {O}}(n^{3})}$ 和的合并后，形成的集群为：{}、{, }、{}、{} 、{}，对其进行进一步的合并需要度量集群{a}和{b, c}之间的距离（即两个集群间的距离）。通常将集群 ${displaystyle {mathcal {A}}}$ ${mathcal {A}}$ 和 ${displaystyle {mathcal {B}}}$ $mathcal{B}$ 之间的距离定义为：

当若干对组合具有同样的距离且为最小时，可以随机选取一对形成集群（生成不同的树状图）；也可以同时形成不同的集群（生成唯一的树状图）。

聚类算法的停止准则可以取决于数量（当形成足够少的集群时停止）；也可以取决于距离（当两个集群之间的距离足够远，以至于不能形成新集群时停止）。

DIANA（DIvisive ANAlysis Clustering）是分裂层次聚类的基础算法。首先，所有元素归属同一个集群，然后分裂集群，直到所有元素都独立成群。由于存在 ${displaystyle O(2^{n})}$ $O(2^{n})$ 种方法进行分裂，因此需要启发式（Heuristics）算法实现。DIANA选择平均异同度（Average dissimilarity）最大的元素，然后将所有与新集群相似度高于其余集群的元素划分到该集群。

相关

普埃布罗市普韦布洛（英文：Pueblo），是美国科罗拉多州普韦布洛县下属的一座城市。建市于1885年11月15日，面积大约为54.427平方英里（140.964平方公里）。根据2010年美国人口普查，该市有人口106,595
玉蟾山玉蟾山（英文：Jade-Toad-Mountain）景区位于四川泸县县城旁，泸州市区以北35公里处，从隆纳高速公路驾驶9公里即到。为国家AAA级旅游区，省级风景名胜区，省级森林公园。山下有九曲河、赖
八通关草原八通关草原，台湾八通关一处草原，位于玉山山脉与中央山脉之间鞍部上，其行政区属南投县信义乡东埔村。八通关草原由玉山箭竹与高山芒形成当地的植物社会中优势物种，面积约100公顷，
任盈盈任盈盈，金庸武侠小说《笑傲江湖》女主角，于第十三回“学琴”登场。日月神教教主任我行独女，东方不败夺权后尊为“圣姑”。盈盈是个复杂的女子。她乖戾狠辣却又腼腆温婉。倾心痴
贾里德·波利斯贾里德·波利斯（Jared Polis；1975年5月12日－）是美国的一位政治人物、企业家和慈善家。是美国民主党党员，自2009年开始成为科罗拉多州第2选举区选出的美国众议院议员，是美国国会第
托马斯·汤森，第一代悉尼子爵第一代悉尼子爵托马斯·汤森（英语：Thomas Townshend, 1st Viscount Sydney，1733年2月24日－1800年6月30日），英国18世纪政治家。位于加拿大新斯科舍省的悉尼（英语：Sydney, Nova Scotia
葛底斯堡演说《葛底斯堡演说》（英语：Gettysburg Address）是第16任美国总统亚伯拉罕·林肯最著名的演说，也是美国历史上为人引用最多之政治性演说。1863年11月19日，也就是美国内战中葛底斯堡战役结束的四个半月后，林肯在宾夕法尼亚州葛底斯堡的葛底斯堡国家公墓（Gettysburg National Cemetery）揭幕式中发表此次演说，哀悼在长达五个半月的葛底斯堡之役中阵亡的将士。林肯的演讲于当天第二顺位发表，修辞细腻周密，其后成为美国历史上最伟大的演说之一。以不足三百字的字数，两到三分钟的时间，林
安娜·莎特安娜·莎特（英语：Anna C. Salter），美国心理学家及神秘小说家。1968年，莎特在北卡罗来纳大学获得英语和哲学学士学位。她于1973年获得塔夫茨大学的儿童发展硕士学位，她于1977获得哈佛大学临床心理学和公共实践博士学位。她特别强调于性犯罪，她治疗了需多受到性犯罪侵害的受害者，也研究其性犯罪者。她出版了几本关于性犯罪的书籍和相关的文章，并多次受邀以性犯罪者及其受害者为题发表演讲，地点遍及美国四十五州与八个国家。现居威斯康辛州麦迪逊地区，并担任威斯康辛州犯罪矫治署（英语：Wisconsin De
上海街道赛道2010年的赛道上海街道赛道是上海市浦东新区的一条街道赛道（英语：Street circuit），2004年时长度为2.840公里。2004年7月18日，德国房车大师赛在上海街道赛道上举行。梅赛德斯-AMG所属的加里·帕费特（英语：Gary Paffett）最终赢得冠军。2010年时，上海街道赛道缩短至2.465公里。主要位于丁香路-锦绣路-迎春路-合欢路等区域。赛道一侧为看台，另一侧为跑道。同年11月28日，德国房车大师赛再度在上海街道赛道上举行。最终HWA车队的加里·帕费特（英语：Gary Paffe
李立言李立言（1994年3月10日－），加拿大华裔围棋棋手，美国围棋协会职业三段。2017年在第三届“MLILY梦百合杯”世界围棋公开赛本赛上连胜程宏昊和陈耀烨九段后，在16强战中负于李轩豪。多伦多大学本科毕业后，现在耶鲁大学攻读大气物理学博士。妻子是美国职业棋手殷明明初段。