轮廓 (聚类)

✍ dations ◷ 2025-12-04 10:09:57 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 伊利泽-威德曼炸弹测试问题在量子力学里,伊利泽-威德曼炸弹测试问题(Elitzur-Vaidman bomb testing problem)是由阿舍朗·伊利泽(Avshalom Elitzur)与列夫·威德曼(Lev Vaidman)于1993年提出的思想实验,其使用
  • 落基山国家公园洛矶山国家公园是美国的一个国家公园,位于科罗拉多州的中北部。落矶山国家公园特色为壮丽的山脉风景、多样的生物与多样的气候及天然环境(从森林到高山冻土层)。
  • 埃及第二十九王朝第 八第 十埃及第二十九王朝是古埃及历史上的一个王朝,其统治者为埃及本土人。第二十九王朝与第二十六王朝、第二十七王朝、第二十八王朝、第三十王朝和第三十一王朝统称古埃
  • 伊朗总统伊朗总统是伊朗伊斯兰共和国的国家元首和政府首脑,一般也被视为伊朗政策的实际决策者,但任职终身的伊朗最高领袖在伊朗国内乃至整个伊斯兰什叶派世界有着更高的地位和更强的号
  • 博查甘杰乌帕齐拉博查甘杰乌帕齐拉(孟加拉语:বোচাগঞ্জ,英语:Bochaganj Upazila)是孟加拉国迪纳杰布尔县的一个乌帕齐拉,位于朗布尔专区的迪纳杰布尔县。。据1991年孟加拉国人口普查(英语:199
  • 基尔·拉杰·雷格米基尔·拉杰·雷格米(尼泊尔语:खिलराज रेग्मी,英语:Khil Raj Regmi,OGDB,OTSP,1949年5月31日-)生于尼泊尔的帕尔帕县(现属西部发展区蓝毗尼专区),是尼泊尔政治人物,现任尼泊尔
  • 创圣的亚库艾里翁EVOL创圣的亚库艾里翁EVOL为日本动画《创圣的亚库艾里翁EVOL》及其外传登场的角色。
  • 鲍尔斯堂鲍尔斯堂(Bowles Hall)是柏克莱加州大学的一座男生宿舍,以其专有的独特的传统和仪式,传奇的聚会和情谊世界闻名。这座宿舍是校园内的第一座宿舍,加州的第一座国有宿舍,1929年投入
  • 乔治·埃布尔乔治·埃布尔(英语:George Abel,1916年2月23日-1996年4月16日),加拿大男子冰球运动员,场上位置是前锋。他曾代表加拿大参加1952年冬季奥林匹克运动会冰球比赛,获得一枚金牌。
  • 约翰·哈钦森约翰·哈钦森(John Hutchinson,1825年-1865年3月14日),英国化学家及实业家,1847年在英格兰兰开夏郡威德尼斯建立了当地的第一家化工厂。在这家工厂中,他通过勒布朗制碱法制造碱。1859年他在附近开设了第二家碱厂。