轮廓 (聚类)

✍ dations ◷ 2025-11-30 19:32:59 #轮廓 (聚类)

在机器学习与数据挖掘领域,轮廓指的是一种反映数据聚类结果一致性的方法,可以用于评估聚类后簇与簇之间的离散程度。轮廓的取值范围为,如果某一样本的轮廓接近1,则说明样本聚类结果合理;如果接近-1,则说明其更应该分类到其他的簇;如果轮廓近似为0,则说明该样本在两个簇的边界上。所有样本轮廓的均值称为聚类结果的轮廓系数(Silhouette Coefficiency),是该聚类是否合理、有效的度量。

假设某一数据集使用如k-means等聚类方法分成了 k {displaystyle k} )的概念——在某个数据集的有限种聚类方法中,平均 s ( i ) {displaystyle s(i)} 的最大值:

上式中 s ~ ( k ) {displaystyle {tilde {s}}left(kright)} 代表被分为 k {displaystyle k} 个簇后该数据集的平均 s ( i ) {displaystyle s(i)}


轮廓系数一般不能用于横向评价多种聚类方法。凸簇(如经由DBSCAN方法得出的簇)的轮廓系数一般高于其他类型的簇。

相关

  • 墨鱼墨鱼科又名乌贼科(学名:Sepiidae),属于软体动物门头足纲墨鱼目的一科,其中的动物又称乌贼、花枝、银丝,本科的所有物种都具有的特点是拥有十只看似一样长短触手,脑袋的比例极其巨大
  • 雅可比Paul Albert Gordan卡尔·古斯塔夫·雅各布·雅可比(德语:Carl Gustav Jacob Jacobi,1804年12月10日-1851年2月18日)是一位普鲁士数学家,被广泛的认为是历史上最杰出的数学家之一
  • 马克斯·泰格马克马克斯·埃里克·泰格马克(英语:Max Erik Tegmark,1967年5月5日-),宇宙学家,拥有美国与瑞典双重国籍。他现为麻省理工学院教授、基础问题研究所(英语:Foundational Questions Institu
  • 3橘之恋《3橘之恋》(英文:The Love of Three Oranges)是台湾导演鸿鸿执导的第一部电影,演员则找来小剧场演员担纲,于1998年夏天拍摄,并在上映前于诚品书店、皇冠小剧场等地试映。一般认为
  • Cardiola见内文是双壳纲隐齿亚纲已绝灭的一属咸水蛤蜊。本属物种于志留纪到中泥盆世期间生活于今日的非洲、欧洲和北美洲,并未有在亚洲分布。
  • 耶鲁医学院耶鲁医学院(英语:Yale School of Medicine)是隶属于耶鲁大学的医学院。18世纪美国行医不需要医师执照,在医学院成立前一直都是学徒制,后来耶鲁大学校长提议创建医学院,也是耶鲁
  • 天然林天然林(Ancient woodland)又称自然林,是指靠天然能力形成的森林。包括天然形成的森林(原始森林)和人工促进天然更新或萌生所形成的森林(次生林)。
  • 朗县 (佐治亚州)朗县(英语:Long County)是美国乔治亚州东部的一个县。面积1,045平方公里。根据美国2000年人口普查,共有人口10,304人。县治卢多维西(Ludowici)。成立
  • 藤村富美男藤村富美男(1916年8月14日-1992年5月28日)为日本的棒球选手,出生于广岛县吴市。他曾效力于日本职棒阪神虎等队伍,于1958年退休,生涯通算224支本垒打。
  • 甄兰芳甄兰芳(1970年10月-),云南昭阳人,回族,无党派人士。中华人民共和国政治人物、第十三届全国人民代表大会云南省代表。2018年,甄兰芳被选为云南省出席第十三届全国人民代表大会代表。