异常检测

✍ dations ◷ 2025-09-02 10:30:23 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • 枇杷枇杷(学名:Eriobotrya japonica),中文古名芦橘,又名金丸、芦枝、琵琶果,是蔷薇科中的枇杷属的一种植物。枇杷原产中国东南部,因果子形状似琵琶乐器而名。常绿小乔木;树冠呈圆状,树干
  • 蓝精灵 (消歧义)蓝精灵可指:
  • 意大利社会共和国意大利社会共和国(意大利语:Repubblica Sociale Italiana),由于其中央政府位于萨罗,又称萨罗共和国(Repubblica di Salò),是第二次世界大战末期贝尼托·墨索里尼在阿道夫·希特勒的
  • 居世界第五本表统计各国或地区铁路之里程数,资料包含为载客营运的铁路路线。欧洲的铁路总长度最长,其铁路密度居世界之冠。本表包括已建设完成及建设中的铁路。
  • 乌克兰危机持久的乌克兰危机在2013年11月21日展开序幕,当时时任总统亚努科维奇冻结为实现与欧盟签署联系国协定(英语:Ukraine–European Union Association Agreement)的准备工作。这个决
  • 四大满贯可以指:
  • 大不列颠王国大不列颠王国(英语:Kingdom of Great Britain),曾经为英国历史上的正式国名,位于西欧大不列颠岛及其附属岛屿,存在于1707年—1800年。是根据《1707年联合法案》,由英格兰王国与苏格
  • 白以龙白以龙(1940年12月22日-),云南祥云人,祖籍浙江镇海,力学家,中国科学院院士,主要从事爆炸力学、固体力学和非线性力学的研究。白以龙1963年毕业于中国科学技术大学力学系,1966年毕业于
  • 普珥节普珥节(希伯来语:.mw-parser-output .script-hebrew,.mw-parser-output .script-Hebr{font-size:1.15em;font-family:"Ezra SIL","Ezra SIL SR","Keter Aram Tsova","Taamey A
  • 赛尔曼·瓦克斯曼赛尔曼·A·瓦克斯曼(英语:Selman A. Waksman,1888年7月22日-1973年8月16日),乌克兰裔美国生物化学家和微生物学家。瓦克斯曼发现了链霉素和其他抗生素。瓦克斯曼首先将链霉素用于