首页 >
异常检测
✍ dations ◷ 2025-06-07 12:55:09 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。
相关
- 细胞激素细胞因子(英语:cytokine,又称细胞介素、细胞激素、细胞素、细胞活素),是一组蛋白质及多肽,在生物中用作信号蛋白。这些类似激素或神经递质的蛋白用作细胞间沟通的信号。细胞因子多
- 求职求职,指一个人寻求工作和职位。找工作的人称为求职方,提供工作的机构称为招聘方。求职是绝大多数人一生中都会遇到和面对的重要事情。从招聘单位的角度看,求职者一般分为两类:应
- 芳基在有机化学中,芳基指任何从简单芳香环衍生出的官能团或取代基。虽然更特殊的名称如苯基,被用来描述未被取代的芳基,但出于概括和简练的原因芳基仍然被使用。最简单的芳基是苯基
- 贾科莫·普契尼贾科莫·安东尼奥·多米尼科·米凯莱·塞孔多·马利亚·普契尼(意大利语:Giacomo Antonio Domenico Michele Secondo María Puccini,1858年12月22日-1924年11月29日),意大利作曲
- 醌醌是含有共轭环己二烯二酮或环己二烯二亚甲基结构的一类有机化合物的总称。大部分的醌都是α,β-不饱和酮,且为非芳香、有颜色的化合物。最简单的醌是苯醌,包括对苯醌(1,4-苯醌
- 时代华纳坐标:40°46′06″N 73°58′58″W / 40.7682536°N 73.9826691°W / 40.7682536; -73.9826691华纳媒体(英语:WarnerMedia),前称时代华纳股份有限公司(英语:Time Warner, Inc.)是AT&
- 黏度黏度(英语:Viscosity),是黏性的程度,是材料的首要功能,也称动力粘度、粘(滞)性系数、内摩擦系数。不同物质的黏度不同,例如在室温(25℃)及常压(1巴)下,空气的黏度为18.5μPa·s,大约比在相
- 雅典股票交易所雅典股票交易所(希腊语: Χρηματιστήριο Αθηνών,缩写ΧΑ) ,为希腊首都雅典市的一个股票交易所。该股票交易所位于Kavalas大街。交易时间为周一到周五的上
- 罗兰弗兰克·舍伍德·罗兰(英语:Frank Sherwood Rowland,1927年6月28日-2012年3月10日),美国化学家,因“他们对大气化学的研究工作,特别是臭氧的形成与分解”,与马里奥·莫利纳、保罗·克
- 大学城大学城一般指在城市或城市郊区的一处大学聚集区域。大学城也可以指: