BIRCH

✍ dations ◷ 2024-12-23 00:32:53 #数据挖掘,聚类分析,机器学习

BIRCH(英文全称:balanced iterative reducing and clustering using hierarchies,中文:利用层次方法的平衡迭代规约和聚类)是一个非监督式分层聚类算法,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。

算法利用构建聚类特征树进行计算,树上的节点称作聚类特征(CF)。聚类特征为一个三维向量(n,LS,SS),n表示子类中节点的数目,LS表示n个点的线性和,SS表示n个点的平方和。

相关

  • 胃肠学胃肠学(英语:Gastroenterology,又称为肠胃病学)是医学的一个分枝,专门研究消化系统(从口腔到肛门的消化道)及相关疾病。
  • 路易·波拿巴路易·波拿巴(Louis Napoléon Bonaparte,1778年9月2日-1846年7月25日),任荷兰国王时称路德维克一世,法国皇帝拿破仑一世的弟弟。妻子是拿破仑的继女,约瑟芬和前夫博阿尔内所生的女
  • 乌拉尔斯克西哈萨克斯坦州(哈萨克语:Батыс Қазақстан облысы)是哈萨克斯坦的一个州份,位于欧洲。北为俄罗斯,乌拉尔河在中部流过。面积151,300平方公里。人口606,700(20
  • 说文《说文解字》简称《说文》,是中国东汉时期由学者许慎编著的一部文字工具书,全书共分540个(俄语:Список ключей Шовэнь цзецзы)部首,收字9,353个,另有“重
  • 乌克兰大饥荒乌克兰大饥荒(乌克兰语:Голодомор,拉丁字转写:Holodomor;意为“以饥饿灭绝”,出自“морити голодом”,意为“以饥饿杀死”),是1932年至1933年发生在苏联乌克兰
  • 6d1 7s2 2, 8, 18, 32, 18, 9, 2第一:499 kJ·mol−1 主条目:锕的同位素 锕是一种放射性金属元素,符号为Ac,原子序为89。锕在1899年被发现,是首个得到分离的非原始核素(non-prim
  • 伊丽莎白王太后伊丽莎白·安吉拉·玛格丽特·鲍斯-里昂(Elizabeth Angela Marguerite Bowes-Lyon,1900年8月4日-2002年3月30日),被称为伊丽莎白王后(Queen Elizabeth),为英王乔治六世王后、末代爱
  • 大卫·洛克菲勒大卫·洛克菲勒(英语:David Rockefeller,1915年6月12日-2017年3月20日)是一位美国企业家。生于纽约市,是美国洛克菲勒家族第三代成员,其爷爷约翰·戴维森·洛克菲勒曾创办标准石油
  • 查理·亚历山大 (洛林)夏尔·亚历山大,(Charles-Alexandre de Lorraine ,1712年12月12日-1780年7月4日),又名卡尔·亚历山大,洛林公爵利奥波德·约瑟夫(英语:Leopold, Duke of Lorraine)之子, 弗朗茨一世之弟
  • 乐浪国乐浪国(韩语:낙랑국),是存在于公元前1世纪至1世纪的古代朝鲜半岛北部部落国家。乐浪国在乐浪郡附近,原为西汉乐浪东部都尉沃沮之地。新朝末年,自立为国。37年,高句丽大武神王高无恤