异常检测

✍ dations ◷ 2025-09-27 21:18:53 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • 免疫能力贫弱免疫缺陷(英语:immunodeficiency)是指免疫系统抵抗传染病的能力失常或欠缺。免疫缺陷还可能降低肿瘤免疫监视功能。免疫缺陷多为继发性(secondary)免疫缺陷,不过也有些人生来就有
  • 整合医学整合医学,在英国又称整合健康,又称替代医学。支持者认为整体医学的研究对象是“整个人体”,以人的健康而不是疾病治疗为中心,强调医患关系的重要性。但是,整合医学也因无效的替代
  • 犬部,为汉字索引中的部首之一,康熙字典214个部首中的第九十四个(四划的则为第三十四个)。就繁体和简体中文中,犬部归于四划部首。犬部通常是从下、左、右方均可为部字。当左为部
  • 衣藻属正文衣藻属(学名:Chlamydomonas)是绿藻门下一个包括约325个物种的属。他们都是带有鞭毛的单细胞生物。有纤维素壁,营养细胞有两根等长鞭毛,叶绿体杯状,叶绿体前端或侧面有一红色
  • 黑格艾伦·杰伊·黑格(英语:Alan Jay Heeger,1936年1月22日-),美国物理学家、化学家,诺贝尔化学奖获得者。黑格出生于衣阿华州苏城。1957年在内布拉斯加大学林肯分校获得物理及数学学士
  • 正感知链(英语:Sense,也称股)在分子生物学中指一段核酸分子(如RNA与DNA)及其互补序列在指定氨基酸序列中的作用性质。例如,若RNA可以直接合成蛋白质,则该段RNA为正链;反之,若RNA需要先进行转
  • 罗彻斯特大学罗彻斯特大学(英文:University of Rochester,缩写U of R 或 UR)是一所美国私立、无宗派的研究型大学,座落在美国纽约州的罗彻斯特市。该校授予大学学士、研究生硕士、博士以及职
  • 渐进变态半变态,又称不完全变态,是昆虫发育的一种类型。此类型的昆虫发育包括三个阶段:卵、稚虫和成虫。三个阶段之间的是逐渐变化的,没有蛹这个阶段。稚虫通常与成虫外表相似,但其生态异
  • 激光焊接激光焊是一种以聚焦的激光束作为能源轰击焊件所产生的热量进行焊接的方法。由于激光具有折射、聚焦等光学性质,使得激光焊非常适合于微型零件和可达性很差的部位的焊接。激光
  • PDE5抑制剂第五型磷酸二酯酶抑制剂(phosphodiesterase type 5 inhibitor)也称为PDE5抑制剂,是一种抑制第五型环磷酸鸟苷特异性磷酸二酯酶(英语:cGMP-specific_phosphodiesterase_type_5)对血