BIRCH

✍ dations ◷ 2025-09-10 11:10:30 #数据挖掘,聚类分析,机器学习

BIRCH(英文全称:balanced iterative reducing and clustering using hierarchies,中文:利用层次方法的平衡迭代规约和聚类)是一个非监督式分层聚类算法,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。

算法利用构建聚类特征树进行计算,树上的节点称作聚类特征(CF)。聚类特征为一个三维向量(n,LS,SS),n表示子类中节点的数目,LS表示n个点的线性和,SS表示n个点的平方和。

相关

  • 汉藏语系汉藏语系(英语:Sino-Tibetan languages),或称泛喜马拉雅语系、藏缅语系,是语言学家按照谱系分类法划分的一组语群,但是划分的形式很多。这个语系至少包含汉语族和藏缅语族,共计约40
  • 周卫健周卫健(1953年3月23日-),出生于贵州贵阳,籍贯河南南乐,中国第四纪地质学家。出生于贵州贵阳,籍贯河南南乐。中国科学院地球环境研究所黄土与第四纪地质国家重点实验室主任。1976年
  • 梅沙街道梅沙街道位于中国广东省深圳市盐田区,名称取自古地名——梅沙(分为大梅沙和小梅沙)。下辖三个社区:
  • 南奔府南奔府(泰语:จังหวัดลำพูน,皇家转写:Changwat Lamphun,泰语发音:),一译喃奔府,是泰国北部的一个府,府治为南奔市。该府首府为泰北最古老的城市,建于公元663年,原名为“立甫
  • 北约扩张北约扩张指的是北大西洋公约组织(下称北约)自1949年成立以来增加成员国的过程,从1949年成立时的12个创始国,目前已扩张至30个成员国,其中多数是冷战结束后加入的中东欧国家。身为
  • 全联盟列宁主义青年共产主义联盟全联盟列宁主义青年共产主义联盟(俄语:Всесоюзный Ленинский Коммунистический Союз Молодёжи (ВЛКСМ) 的徽章苏联列宁
  • 硫酸铀(III)硫酸铀(III)是三价铀的硫酸盐,化学式为U2(SO4)3,具有放射性。它是第一个被发现的水合的三价铀盐。硫酸铀(III)于1967年被R. Barnard等人报道,通过硫酸铀酰的电化学还原法制备,向
  • 诺曼·艾布拉姆森诺曼·艾布拉姆森(英语:Norman Abramson,1932年4月1日-),生于麻塞诸塞州波士顿,美国计算机科学家,开发出ALOHAnet无线通讯系统。1953年,在哈佛大学取得物理学学士。1955年,于洛杉矶加
  • 机车轴式在铁路技术上,机车轴式,或称机车轮式,是指用英文字母和阿拉伯数字的组合来表达铁路机车走行部车轴排列结构和特点的系统化分类方式。世界上各地使用的机车轴式表达系统主要有三
  • 阿里雷扎·萨利希·内贾德阿里雷扎·萨利希内贾德(Alireza Salehi Nejad)是一名伊朗-土耳其籍的社会科学家及多学科研究者,目前隶属于德黑兰大学世界研究学院。他也是总部位于马来西亚吉隆坡的商业资讯