异常检测

✍ dations ◷ 2025-07-18 23:14:21 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • 苯唑西林苯唑西林钠(英语:Oxacillin sodium)是由必成公司研发的一种青霉素类窄谱β-内酰胺抗生素。苯唑西林是一种抗青霉素酶的β-内酰胺类药物,它与甲氧西林类似,在临床应用中已取代甲氧
  • 亚历山大大帝马其顿的亚历山大三世(古希腊语:Ἀλέξανδρος Γ' ὁ Μακεδών,其名字亚历山大意为“人类的(.mw-parser-output .Polytonic{font-family:"SBL BibLit","SBL Greek
  • 方差分析方差分析或变方分析(Analysis of variance,简称ANOVA)为数据分析中常见的统计模型,主要为探讨连续型(Continuous)资料型态之因变量(Dependent variable)与类别型资料型态之自变量(Ind
  • 感官感官(sense)是泛指能接受外界刺激的特化器官与分布在部分身体上的感官神经(Sensory nerve),其运作依全有全无律,是生物体得到外界资讯的通道。就人类而言其包括眼睛的视觉、耳朵的
  • 烧瓶烧瓶是实验室中使用的有颈玻璃器皿,用来盛液体物质。因可以耐一定的热而被称作烧瓶。 在化学实验中,试剂量较大而又有液体物质参加反应时使用的容器。烧瓶都可用于装配气体发
  • 波焦·布拉乔利尼波焦‧布拉乔利尼(Gian Francesco Poggio Bracciolini 或 Poggio Bracciolini,1380年2月11日-1459年10月30日),意大利知名的学者、文学家、哲学家,文艺复兴时期人文主义者,政治家,于
  • RNA聚合酶IIIRNA聚合酶III(又称Pol III)是真核细胞中通过转录DNA来合成核糖体5S rRNA、tRNA等小RNA的酶。由RNA Pol III转录的基因属于“管家”基因。因为这些基因需要在所有类型的细胞和
  • 辅肌动蛋白辅肌动蛋白(英语:Actinin)是一种微丝蛋白。α-辅肌动蛋白1(英语:ACTN1)是骨骼肌细胞中肌动蛋白附着于Z线所必须的,也是其在平滑肌中附于电子致密部分所需。起功能的辅肌动蛋白是反
  • 迈克尔·沃特曼迈克尔·斯宾塞·沃特曼(英语:Michael Spencer Waterman,1942年6月28日-),美国生物信息学家,南加州大学数学与计算机科学学院联合主任。此前,他曾在洛斯阿拉莫斯国家实验室和爱达荷
  • 针经《灵枢经》,与《素问》合称《黄帝内经》,是现存最早的中医理论著作,约成书于战国时期,又称《灵枢》、《针经》、《九针》。因其共有九卷又称作《九卷》,在唐朝王冰之前又被称作《