首页 >
异常检测
✍ dations ◷ 2025-05-16 00:47:20 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。
相关
- 软骨钙质沉积病软骨钙质沉积病(英语:chondrocalcinosis)又称为软件钙化是指透明软骨和/或纤维软骨的钙化(钙盐沉积)。可以在放射线摄影术(英语:radiography)或 X 光检查时发现。一般人群中约有 50%
- B3怀孕分级(英语:Pregnancy category)是药物学中用来评估女性在怀孕期间服用药物对胎儿可能造成伤害的危险程度,但是在母乳中出现药物或是出现药物代谢物所可能造成的伤害则不包括
- 弧状云弧状云(arcus cloud),是一种罕见的云层。通常会形成于冷锋之前缘,一旦寒冷的气流扩展开来,会推升前方的暖空气,气流有时会沿着水平轴方向流动。弧状云又可分为卷轴云(Roll clouds)和
- 荷马荷马(Ὅμηρος,约前9世纪-前8世纪),相传为古希腊的吟游诗人,生于小亚细亚,失明,创作了史诗《伊利亚特》和《奥德赛》,两者统称《荷马史诗》。目前没有确切证据证明荷马的存在,所以
- 查士丁尼大瘟疫查士丁尼大瘟疫是公元541至542年发生在拜占庭帝国的一场大瘟疫。当时包括首都君士坦丁堡在内多地受到影响。关于是次瘟疫的具体疾病,最广为接受的说法是鼠疫。大瘟疫分为五次
- 二氧化钛二氧化钛,化学式为TiO2,俗称钛白粉,分子大小是奈米级为光触媒,能靠紫外线消毒及杀菌,已经有一些产品问世。 亦可用于化妆品中。 二氧化钛是水反应生成氢气和氧气的催化剂, 二氧化
- 出血 (印刷)出血是印刷品预计会被裁切掉的边缘部分。出血是印刷专有名词,为印前排版作业之一。出血尺寸因印刷/输出成品类型及尺寸需要,再加上裁切设备的精度与专业人员的训练素质,而有不
- 湿生湿生(梵语:saṃsveda-ja),佛教术语,又作寒热和合生、因缘生,谓如蚊虫类般在湿润处由湿气受生,为四生(四种众生出生的方式)之一。湿生,谓在湿润处由湿气受生,不同于卵生(从卵中孵化生出)、
- 第三中间期第八第十第三中间时期,即古埃及自法老拉美西斯十一世于公元前1070年代死后,至普萨美提克一世于前664年驱逐第二十五王朝的努比亚统治者、创立第二十六王朝之前的一段时期。这
- 白益王朝白益王朝(波斯语:آل بویه Āl-e Buye,或译布韦希王朝、布耶王朝)是945年至1055年间统治伊朗西部及伊拉克的一个王朝,由里海南岸(吉兰省)的德莱木人建立。王朝名称来自创建