轮廓 (聚类)

✍ dations ◷ 2025-11-28 07:08:24 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 芦 苇芦苇(学名:Phragmites communis),又称普通芦苇(common reed),是生长于沼泽、河沿、海滩等湿地的一种禾本科植物,遍布于全世界温带和热带地区,芦苇属的植物大约有10种,有的分类学家认为
  • 国际民用航空组织国际民用航空组织,简称国际民航组织(法语:Organisation de l'Aviation Civile Internationale,缩写:OACI;英语:International Civil Aviation Organization,缩写:ICAO)是联合国属下专
  • 技术奇点技术奇点(英语:Technological Singularity),出自奇点理论;根据技术发展史总结出的观点,认为人类正在接近一个使得现有技术被完全抛弃或者人类文明被完全颠覆的事件点,在这个事件点
  • 以科学家命名的非国际单位列表以科学家命名的非国际单位列表列出在物理单位上,以突出贡献科学家的名字命名的单位,这些单位不是国际单位,但是奈培与贝尔两非国际单位可用于国际单位制上。这些单位虽然是非国
  • 异氢氰酸异氢氰酸或异氰化氢,是一种无机化合物,化学式为HNC。它是氢氰酸(HCN)的互变异构体,在互变平衡处于劣势。它在天体化学中的重要性在于它广泛存在于星际物质中。
  • 玛丽亚·卡齐米埃拉·达尔昆玛丽亚·卡齐米埃拉·达尔昆(波兰语:Maria Kazimiera d’Arquien,1641年6月28日-1716年1月30日),波兰王后(英语:List of Polish consorts),1674年至1696年在位。1665年,玛丽亚·卡齐米
  • 戴多禄一世教宗戴多禄一世(拉丁语:Theodorus PP. I;?-649年5月14日)是于642年11月24日至649年5月14日在位的教宗。他可能是一个在耶路撒冷出生的希腊人。640年他被教宗若望四世提升为总主教
  • 土生芋螺土生芋螺(学名:)为芋螺科芋螺属下的一个种。
  • 刘光筼刘光筼(1872年-?年),字竹君,号兰村,四川省叙州府富顺县人,光绪三十年进士,戊戌六君子之一刘光第从弟。
  • 张曦文张曦文(1980年3月7日-),出生于哈尔滨,中国大陆女演员、歌手。毕业于中央戏剧学院表演系,曾为花样滑冰冰上舞蹈运动员,后转型为演员,曾参演抗战剧《战旗》和《一个人战争》。