首页 >
异常检测
✍ dations ◷ 2025-11-09 04:24:30 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。
相关
- 负链RNA病毒核糖核酸病毒(英语:RNA virus),又称RNA病毒,其遗传物质为RNA,这些核糖核酸通常是单链RNA(ssRNA),但是也可能是双链RNA(dsRNA)。由RNA病毒感染造成的著名人类疾病包括艾滋病(AIDS)、埃博
- 媒体美国拥有世界上最发达的传播媒介系统。美国媒体涵盖了所有主要的形式,包括电视、广播、电影、报纸、杂志和互联网。美国的音乐产业也很发达。大多数媒体都从属于商业化的媒体
- 同一性在逻辑中,同一(identity)关系通常被定义为只在一个事物和它自身之间成立的关系。就是说同一是两元谓词"=",使得对于所有x和y,"x = y"为真,当且仅当x和y是同一个事物。同一是传递
- 性传染疾病性感染疾病(英语:Sexually transmitted infections, STI),又称性病(英语:Venereal Disease, VD)或花柳病,描述因性行为(指阴道性行为、肛交和口交)而传播的疾病。大多数的性感染疾病一
- 伍兹霍尔海洋研究所伍兹霍尔海洋研究所(英文:Woods Hole Oceanographic Institution)是专注于海洋科学与海洋工程的非盈利私人研究和教学机构,成立于1930年,是美国最大的独立海洋学研究所,拥有教职员
- 诺氏疟原虫诺氏疟原虫(Plasmodium knowlesi,可缩写为P. knowlesi)又称猴疟虫,是一种常见于东南亚的灵长类疟原虫。它能在食蟹猴体内引起疟疾,但它也可能自然或人为地感染人类。由于卵形疟原
- 双酚A双酚A(Bisphenol A,缩写为BPA),台灣多稱之為酚甲烷。一种化工原料,是已知的内分泌干扰素(环境荷尔蒙)。它是一种有机化合物,具有两个酚官能团。双酚A被用于合成聚碳酸酯塑料和环氧树
- SNPSNP可能指:
- 合成材料合成材料是塑料、合成橡胶和合成纤维的总称。硅橡胶、 聚甲基丙烯酸甲酯、 丙烯酸酯水凝胶、 α-氰基丙烯酸酯、 聚酸胺、 饱和聚酯、 聚氯乙烯、 聚乙烯、 聚丙烯、 聚四氟
- 查尔斯·多默里查尔斯·多默里(英语:Charles Domery),又名查尔斯·多默兹(Charles Domerz),出生于1778年,逝世时间和地点不详,是一位以异常大的胃口而知名的波兰军人。于对抗法国期间在普鲁士皇家陆
