轮廓 (聚类)

✍ dations ◷ 2025-12-01 02:47:57 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 职业危害职业灾害是指在工作场所发生的危害造成工作者疾病、伤害、失能或死亡,依其灾害性可以分为许多不同的种类,包括化学危害(英语:chemical hazard)、生物性危害、社会心理危害(英语:psy
  • 理想气体常数气体常数(又称理想气体常数、普适气体常数,符号为 R {\displaystyle R} )是一个在物态方程中连系各个热力学函数的物理常数。理想
  • 拉蒂默拉蒂默县(Latimer County, Oklahoma)是美国奥克拉荷马州东南部的一个县。面积1,888平方公里。根据美国2000年人口普查,共有人口10,692人。县治威尔伯顿(Wilberton)。成立于1907年
  • 乌氏乌氏,是由先秦华夏人群分裂出来的先秦西戎部落一支,在春秋时是西戎八国之一。在今宁夏固原东南胭脂川一带。秦穆公得由余,西戎八国服于秦,岐、梁山、泾、漆之北有义渠、大荔、乌
  • 夜神月夜神月(夜神.mw-parser-output ruby>rt,.mw-parser-output ruby>rtc{font-feature-settings:"ruby"1}.mw-parser-output ruby.large{font-size:250%}.mw-parser-output ruby.
  • 埃里克·华多尔埃里克·华多尔(Erik Watndal,1979年8月27日-)生于挪威奥斯陆,是一名挪威射击运动员,主攻定向飞靶项目,曾获得2018年世界射击锦标赛男子定向飞靶亚军。
  • 黑泽朋世黑泽朋世(1996年4月10日-),是日本埼玉县出身的女性演员、声优、歌手,事务所为Mausu Promotion。3岁就开始学习演技,2000年时作为东京儿童剧团的儿童演员开始参与电视剧、CM、舞台
  • 1999年铁路此条目列出1999年发生有关铁路运输的事件。
  • 邳洪河邳洪河位于中国江苏省北部,为中运河右岸支流,系1958年结合中运河复堤人工开挖的排泄中运河西部地区内涝的河道,因原计划北起邳县(今邳州市),南至泗洪县入洪泽湖,故名“邳洪河”,后因
  • 新英格兰黑琴鸡新英格兰黑琴鸡(),又名新英格兰草原松鸡、北美松鸡或石南鸡,是大草原榛鸡的一个亚种,有可能是一个独立的物种。新英格兰黑琴鸡分布在新英格兰海岸,由新罕布什尔州南部至维吉尼亚州北部,史前南至佛罗里达州。它们栖息在石楠丛林之内。新英格兰黑琴鸡在殖民地时期数量很丰富,但被大量猎杀为食物。到了18世纪末,它们因供应太多而成为穷人的食粮,甚至在波士顿公园亦可以见到它们。新英格兰黑琴鸡外观像大草原榛鸡,但较为细小。它们长约43厘米,重约900克。亚历山大·伟臣(Alexander Wilson)指其中一个标本重达1.3