异常检测

✍ dations ◷ 2025-04-25 19:12:47 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • 咽后脓肿咽后脓肿(retropharyngeal abscess (RPA))是位于喉咙后部之咽后壁(咽后间隙(英语:Retropharyngeal space))组织中的脓肿。由于咽后脓肿通常发生在深部组织中,因此仅通过身体检查是难
  • 硼中子俘获治疗(BNCT)中子俘获疗法(NCT)是用于治疗局部侵入性恶性肿瘤如原发性脑肿瘤和复发性头颈部癌的一种非侵入性治疗方法。NCT分两个步骤进行,首先是给病人注射一种含有对慢中子具有俘获倾向性
  • 根冠根冠(英语:root cap, calyptra)是植物根尖端的数层细胞。根冠的功能包括保护植物根尖的生长点、分泌黏质(英语:Mucilage)以利根部在土壤中的穿透伸展,并可能参与与土壤微生物的讯息
  • 大米草大米草(学名:Sporobolus anglicus),禾本科鼠尾粟属,多年生草本植物。被国际自然保护联盟物种存续委员会的入侵物种专家小组(ISSG)列入世界百大外来入侵种。大米草具有根状茎,秆高达1
  • 9目前的元素周期表中有七个周期,并以118号元素鿫(Og)终结。如果有更高原子序数的元素被发现,则它将会被置于第八周期、甚至第九周期。这额外的周期预期将会比第七周期容纳更多的
  • 施莱县施莱县(Schley County, Georgia)是美国乔治亚州西部的一个县。面积435平方公里。根据美国2000年人口普查,共有人口3,766人。县治艾拉维 (Ellaville)。成立于1857年12月22日。县
  • 酯化酯化反应一般是指醇和酸作用,生成酯和水的一种有机化学反应。普通的脂肪就是一种酯,酯可以经水解再分解为醇和酸。一般的脂肪是三酸甘油酯,是由甘油(丙三醇)和脂肪酸(具有4-28个碳
  • 李应红李应红(1963年1月5日-)是一位中国航空推进理论与工程专家,空军工程大学教授。1963年出生于重庆奉节,1983年毕业于空军工程学院航空机械工程系,1989年获华东工学院硕士学位。
  • 默克索引《默克索引》(英语:Merck Index)是由美国默克公司出版的记录化学品、药物和生理性物质的综合性百科全书,收录超过一万多条有关个别的物质和其相关化合物的专题文章。本书亦于附
  • 海因里希·布吕宁海因里希·阿洛伊修斯·马利亚·以利沙伯·布吕宁(德语:Heinrich Aloysius Maria Elisabeth Brüning, 1885年11月26日-1970年3月30日),为德国的政治家。在魏玛共和国末期的1930