轮廓 (聚类)

✍ dations ◷ 2025-12-01 14:54:14 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 爱尔兰咖啡爱尔兰咖啡(爱尔兰语:Caifé Gaelach,英语:Irish coffee)是一种鸡尾酒,以热咖啡、爱尔兰威士忌、糖混合搅拌而成,最后加上一层奶油,于Joseph Sheridan在1940年代发明。始创的处方并
  • 巴戟天巴戟天(学名:Morinda officinalis),别名密梗巴戟天、鸡肠风、鸡眼藤、三角藤。为茜草科巴戟天属的植物。生长于山谷林下,分布于中国南方等地。常绿攀援状灌木;肉质根状茎,不定位肠
  • 山上花园水道博物馆坐标:23°06′05″N 120°21′34″E / 23.1014350°N 120.3594043°E / 23.1014350; 120.3594043原台南水道,为日治时期大正元年(1912年)兴建的自来水供应设施,提供台南市街、安
  • 卡尔·瓦伊诺卡尔·瓦伊诺(爱沙尼亚语:Karl Vaino;俄语:Карл Ге́нрихович Ва́йно;1923年5月28日-),苏共中央委员,爱沙尼亚政治家,爱沙尼亚共产党中央委员会第一书记。退休后,
  • 林正峰梁凯晴可以指:
  • ON and ON《ON and ON》是韩国男团TEMPEST的第三张迷你专辑,于2022年11月22日发行,有GREEN及BLUE两个版本。2010 | 2011 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023
  • 数据约束模型数据约束模型(英语:Data-constrained modelling,DCM)是由澳大利亚联邦科学与工业研究组织的杨玉双博士提出并领头开发的一种材料三维微观结构表征和模拟方法。
  • 恽彦彬恽彦彬(1838年-1920年),字次远、号樗园、次园,江苏省阳湖县(今江苏省常州市)人,清朝政治人物、进士出身。恽光宸之子。同治十年(1871年)辛未科进士,改庶吉士。光绪八年,任司经局洗马,后升任左春坊左庶子、日讲起居注官。光绪十八年,任詹事府詹事。光绪十二年,任内阁学士。光绪二十年,任广东学政。光绪二十一年,任工部右侍郎。【注1】恽绍恩留居孟河,子孙称北恽。 【注2】恽继恩移居上店,子孙称南恽。    【注3】恽福为恽文五世孙。【注4】恽世杰为恽章五世孙。     【注5】昌绪无嗣,以堂弟肇镛三子棨
  • 平林尚三平林尚三(日语:平林 尚三,1937年8月23日-2004年10月3日),日本男性配音员、演员。出身于岐阜县。身高169cm。本名平林章三(与艺名的日文读音相同)。岐阜县立岐阜商业高等学校毕业。九Production社长。创办以前经历东京艺术座(日语:東京芸術座)、六艺社、太阳Promotion、JK Planing、同人舎Production(日语:同人舎プロダクション)、剧团新人会(日语:劇団朋友)电影放送部。2004年10月3日病逝,享寿67岁。配音遗作是《歇洛克·福尔摩斯》的日语追加录音内容。此外
  • 2013年台北周末电影票房冠军列表下列为2013年台北周末电影票房冠军列表,数据为开眼电影网的周末三日票房,票房数字以新台币为单位。