首页 >
异常检测
✍ dations ◷ 2025-04-04 08:23:34 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。
相关
- 5-羟色胺、去甲肾上腺素和多巴胺再摄取抑制剂5-羟色胺、去甲肾上腺素和多巴胺再摄取抑制剂(英语:serotonin–norepinephrine–dopamine reuptake inhibitor,SNDRI),也称作三重再摄取抑制剂(TRI),是多种单胺类神经递质的再摄取抑
- 荧光显微镜荧光显微镜是一种使用荧光或磷光物质的光学显微镜,或除此之外使用反射和吸收用于研究的有机或无机物质的特性。“荧光显微镜”是指使用荧光来产生一个图像的任何显微镜,无论是
- 地球化学地球化学是使用化学原理和工具来解释主要地质系统,如地壳及其海洋背后机制的科学。地球化学领域扩展到了地球以外,涵盖整个太阳系,并且对于一些过程的理解做出了重要贡献,包括地
- .it.it为意大利国家和地区顶级域(ccTLD)的域名。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax .az B .ba .bb .bd .be .bf .bg .bh .bi .bj .bm .b
- 蹄蹄是某些哺乳动物四肢前端的角质器官。
- 莫莱-明托改革莫莱-明托改革(Morley-Minto Reforms, Government of India Act 1909)即“1909年印度政府法案”,因由当时印度事务大臣、自由党(Liberal Party)政治家兼作家约翰·莫莱和时任总督
- 苏联民航3352号班机事故苏联民航3352号班机是一班由苏联克拉斯诺达尔飞往新西伯利亚,中停鄂木斯克的国内航班。1984年10月11日,一架编号为CCCP-85243的图-154客机执行由克拉斯诺达尔至鄂木斯克航段时
- 迷网细脉网,又称迷网或异网,是一个牵涉到混合血管和动脉的复杂系统,而大蓝鳍鲔(一种比较发达的鲔鱼)正是其中拥有这系统的,法国博物学家与动物学家乔治·居维叶(Georges Cuvier)称这系统
- 腔室心脏(英语:heart),常简称心,是一种在人类和其他动物都有的肌造器官,它的功用是推动循环系统中血管的血液。血液提供身体氧气以及养分,同时也协助身体移除代谢废弃物(英语:metabolic w
- 微分几何微分几何研究微分流形的几何性质,是现代数学中一主流;是广义相对论的基础,与拓扑学、代数几何及理论物理关系密切。古典微分几何起源于微积分,主要内容为曲线论和曲面论。欧拉、