轮廓 (聚类)

✍ dations ◷ 2025-11-28 02:04:45 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 批评对佛教的批判,更像是一般对宗教的批判,可以从反对者或质疑断言、信仰、许多佛教派别的其他因素中发现。一些佛教教派、许多佛教国家和独立的佛教领导人已经以一种或其他方式批
  • 细胞应答交叉科学中心南开大学细胞应答交叉科学中心,2020年1月12日在天津市南开大学成立,中国工程院院士、南开大学校长曹雪涛,中国科学院院士、天津市科协主席、南开大学原校长饶子和共同揭牌。南
  • 诸志祥诸志祥(1941年-2015年9月8日),笔名浩谷,浙江绍兴人,中国大陆作家,主要作品有《八戒回乡》、《黑猫警长》、《黑猫警长与外星人》,其中《黑猫警长》被改编为动画并播出。1987年6月,诸
  • 朱香晚朱香晚(1871年-1946年),字湘帆,江苏省宜兴市宜城人。中华人民共和国文学家、音韵学和训诂学家。早年曾受业于拔贡程肖琴。清朝光绪年间以学行俱优,被选为优贡。他精通音韵学和训诂
  • 耶德吉尔耶德吉尔(Yadgir),是印度卡纳塔克邦Gulbarga县的一个城镇。总人口58802(2001年)。该地2001年总人口58802人,其中男性29962人,女性28840人;0—6岁人口8745人,其中男4556人,女4189人;识字
  • 丁希孔丁希孔(?-?),字颜学,山东登州府招远县人,民籍,明朝政治人物。嘉靖二十五年,山东乡试第六十名举人。嘉靖二十九年(1550年)中式庚戌科会试第五十九名,登第三甲第一百九十七名进士。历户部郎
  • 宋达能宋达能男爵,KT,FRSE,FBA,FKC(英语:Stewart Sutherland, Baron Sutherland of Houndwood,1941年2月25日-2018年1月29日),苏格兰宗教学者、公务员和教育家。早年就读于阿伯丁的罗伯特戈
  • 和淳宗室和淳(?-1855年),名和湻,又名宗室和湻,爱新觉罗氏,清朝皇族,政治人物、进士出身。道光十六年,登进士,授翰林院庶吉士。道光十八年,任翰林院编修、詹事府右春坊右中允、文渊阁校理。道
  • 804年
  • 多维尔多维尔(法语:Deauville,法语:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium Alternative","TITUS Cyberbit Basic","Arial Unicode MS","IPAPANNEW","Chrysanthi Unicode","Gent