轮廓 (聚类)

✍ dations ◷ 2025-11-23 13:34:24 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • RD以下为各国用于研究与开发(R & D)以美元计价费用的列表。研究开发开销低于一亿美元的国家未记在内;2010年全球用于研究开发的总费用大约为一万亿美元。
  • 尤文图斯足球俱乐部尤文图斯足球俱乐部(Juventus Football Club S.p.A)简称尤文(Juve),是一家位于意大利皮埃蒙特大区都灵市的足球俱乐部。尤文图斯传统上的主场球衣是黑白相间的上衣配上黑色或白色
  • 铁布卡维利维利坐标:8°28′S 179°05′E / 8.467°S 179.083°E / -8.467; 179.083铁布卡维利维利(英语:Tepuka Vili Vili),或称铁布卡塞维利维利(Tepuka Sevili Vili),是一个位于图瓦卢首都富纳
  • 凯旋进行曲《凯旋进行曲》(意大利语:Marcia trionfale)是教宗及梵蒂冈城国的第二首颂歌,取代了《童贞玛利亚,我们要天主》。它于1857年由奥地利作曲家维克托林·哈尔迈尔作曲。该曲第一次演
  • 李莎 (消歧义)李莎可以指:
  • 沈福儒沈福儒(1942年8月22日-),天津人,中国足球运动员、足球教练、足球解说员,毕业于天津体育学院,原中国国家足球队队员,第二届全运会足球比赛冠军。沈福儒近年来在天津电视台体育频道担
  • 函数发生器函数发生器是一种用于产生波形等函数信号的电子测试设备,是一种重要的信号源。部分函数发生器还具有调制的功能,可以对输出的信号进行调幅、调频等附加功能。函数发生器被广泛
  • 吴波 (政治人物)吴波(1906年-2005年2月21日),男,安徽泾县人,中华人民共和国政治人物,曾任中华人民共和国财政部部长。1906年出生于安徽。1936年参与抗日战争。1949年出任财政部副部长、党组副书记
  • 黑龙江省森林植物园黑龙江省森林植物园位于黑龙江省哈尔滨市市区南部香坊区哈平路105号,占地面积136公顷,是中国寒温带森林植物种质资源的迁地保护、保存、引种驯化基地,中国东北地区重要的林业科
  • 我与亲爱哥哥的日常《就算是哥哥,有爱就没问题了,对吧》(日语:お兄ちゃんだけど愛さえあれば関係ないよねっ),简称哥哥有爱(おにあい),是MF文库J出版的轻小说系列,作者铃木大辅,插图闰月戈。日本于2010年12月由MF文库J(Media Factory)出版发售,2019年1月正式完结,全12卷;中文正体版由东立出版社代理;简体版由天闻角川代理发行、湖南美术出版社出版,因应中国大陆出版审查,译名另定为《我与亲爱哥哥的日常》(但在爱好者间常使用原名“就算是哥哥,只要有爱就没问题了,对吧”)。2018年7月20日晚,bilib