异常检测

✍ dations ◷ 2025-02-23 14:27:39 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • 神经眼科学人体解剖学 - 人体生理学 组织学 - 胚胎学 人体寄生虫学 - 免疫学 病理学 - 病理生理学 细胞学 - 营养学 流行病学 - 药理学 - 毒理学神经眼科学(英语:Neuro-ophthalmology)
  • 顺势疗法下面是以同治同疗法的介绍,于中文顺势二字无太多相关性,建议移除此条目。 同质疗法、同种疗法(英语:Homeopathy i/ˌhoʊmiˈɒpəθi/)为一
  • 母乳喂养母乳哺育(Breastfeeding),亦称哺乳、授乳或母乳喂养,指的是女性以乳房喂食婴儿母乳的行为。婴儿有吮吸反射,因此可以吮吸乳房并吞咽母乳,专家建议在出生后一小时即可哺喂母乳,之后
  • 新冠肺炎新型冠状病毒肺炎(英语:Novel coronavirus pneumonia),简称新冠肺炎,即由新型冠状病毒所引起的肺炎。可以指:
  • 盐桥盐桥 (Salt bridge) 在化学上是指一种实验装置,用以连接贾凡尼电池(伏打电池,一种电化电池)的氧化半电池和还原半电池。盐桥通常分为两类:玻璃管型和滤纸型。此型盐桥由U型管和填
  • 权力意志权力意志(德语:Der Wille zur Macht),德国哲学家尼采提出的一种哲学概念,作为他用来进行价值判断的依据。 刘昌元先生建议译为力量意志,陈鼓应先生则建议译为冲创意志。权力意志是
  • 巴克琳达·布朗·巴克(英语:Linda Brown Buck,1947年1月29日-),美国生物学家,她由于在嗅觉受器方面的卓越研究与理查德·阿克塞尔一起获得2004年诺贝尔生理学或医学奖。巴克生于西雅图,1
  • 古生菌古菌(拉丁语:Archaea,来自古希腊语:ἀρχαῖα,意为“古代的东西”)又称古细菌、古生菌或太古生物、古核生物,是单细胞微生物,构成生物分类的一个域,或一个界。这些微生物1970年前
  • 换质不换位换质不换位或不当的换质换位(improper transposition)是一种形式谬误,系将一假言命题之前件与后件进行否定操作所致。换质不换位之形式如下:范例:正确的操作是换质换位:范例:
  • cope在心理学上, 因应(英语:Coping)有意识的努力,去解决个人和人际关系问题,来控制、减少或容忍压力和衡突的。心理应对机制是通常被称为 应对策略 或 应对技巧 (英语:coping strategies