BIRCH

✍ dations ◷ 2025-02-23 14:24:13 #数据挖掘,聚类分析,机器学习

BIRCH(英文全称:balanced iterative reducing and clustering using hierarchies,中文:利用层次方法的平衡迭代规约和聚类)是一个非监督式分层聚类算法,于1996年由 Tian Zhang 提出。算法的优势在于能够利用有限的内存资源完成对大数据集的高质量的聚类。该算法通过构建聚类特征树(Clustering Feature Tree,简称CF Tree),在接下来的聚类过程中,直接对聚类特征进行聚类,而无需对原始数据集进行聚类。因此在多数情况下只需要扫描一次数据库即可进行聚类,IO成本与数据集尺寸呈线性关系。

算法利用构建聚类特征树进行计算,树上的节点称作聚类特征(CF)。聚类特征为一个三维向量(n,LS,SS),n表示子类中节点的数目,LS表示n个点的线性和,SS表示n个点的平方和。

相关

  • 酶催化酶促反应(又称酶催化)是指由一类被称为酶的特殊蛋白质所催化的化学反应。因为非催化反应的速率特别慢,故细胞中生物化学反应的催化作用就显得极重要。酶促反应的机制与其他类型
  • 彭实戈中国科学院院士(数学物理学部,2005年)彭实戈(1947年12月8日-),广东省海丰县人,生于山东省滨县。生父、外祖父和舅舅是革命烈士。山东大学数学研究所所长,金融研究院院长,泰山学堂院长,
  • 汤川秀树汤川秀树(日语:湯川 秀樹/ゆかわ ひでき Yukawa Hideki ?,1907年1月23日-1981年9月8日),FRS,日本理论物理学家,理学博士。历任京都大学、大阪大学名誉教授。京都市荣誉市民。勋一等
  • 驾驶驾驶,指的是人类在操纵交通工具或一些机械设备时的行为,可分为机动车驾驶、船舶驾驶、列车驾驶、航空器驾驶、其它驾驶,这些一般都属于真实驾驶,可采用手动驾驶或自动驾驶的方式
  • 沙宝·伊斯特凡沙宝·伊斯特凡(Szabó István)是匈牙利电影导演,柏林影展最佳导演和奥斯卡最佳外语片得主。沙宝·伊斯特凡的双亲是Szabó Mária与István,父亲是一位医生。
  • 摩西·阿伦斯摩西·阿伦斯(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Ta
  • 瓦伦马特山坐标:47°17′03″N 7°29′07″E / 47.28417°N 7.48528°E / 47.28417; 7.48528瓦伦马特山(Walenmatt),是瑞士的山峰,位于该国西部,由伯恩州和索洛图恩州负责管辖,属于汝拉山的一
  • 派西·肯塞特派西·肯塞特(英语:Patsy Kensit,1968年3月4日-)全名派崔西亚·犹大·法兰西斯·肯塞特,是一名英格兰演员、歌手与模特儿,曾经是童星与第八奇迹乐团的主唱,演出多部电视剧与电影,包括
  • 鄂氏麂羚鄂氏麂羚(),又名奥氏小羚羊或奥吉碧遁羚,是分布在塞拉里昂、利比里亚、加纳、尼日利亚东南部、赤道畿内亚的比奥科岛及加蓬的麂羚。其下已知有两个亚种:第三个亚种的现已被认为是
  • 河口乡 (顺平县)河口乡,是中华人民共和国河北省保定市顺平县下辖的一个乡镇级行政单位。河口乡下辖以下地区:东河口村、西河口村、北下邑村、中下邑村、南下邑村、康各庄村、马各庄村、北李各