异常检测

✍ dations ◷ 2025-08-08 02:41:08 #异常检测
在数据挖掘中,异常检测(英语:anomaly detection)对不符合预期模式或数据集(英语:dataset)中其他项目的项目、事件或观测值的识别。 通常异常项目会转变成银行欺诈(英语:bank fraud)、结构缺陷、医疗问题、文本错误等类型的问题。异常也被称为离群值、新奇、噪声、偏差和例外。特别是在检测滥用与网络入侵时,有趣性对象往往不是罕见对象,但却是超出预料的突发活动。这种模式不遵循通常统计定义中把异常点看作是罕见对象,于是许多异常检测方法(特别是无监督的方法)将对此类数据失效,除非进行了合适的聚集。相反,聚类分析算法可能可以检测出这些模式形成的微聚类。有三大类异常检测方法。 在假设数据集中大多数实例都是正常的前提下,无监督异常检测方法能通过寻找与其他数据最不匹配的实例来检测出未标记测试数据的异常。监督式异常检测方法需要一个已经被标记“正常”与“异常”的数据集,并涉及到训练分类器(与许多其他的统计分类问题的关键区别是异常检测的内在不均衡性)。半监督式异常检测方法根据一个给定的正常训练数据集创建一个表示正常行为的模型,然后检测由学习模型生成的测试实例的可能性。异常检测技术用于各种领域,如入侵检测、欺诈检测、故障检测、系统健康监测、传感器网络事件检测和生态系统干扰检测等。它通常用于在预处理中删除从数据集的异常数据。在监督式学习中,去除异常数据的数据集往往会在统计上显著提升准确性。文献中提出了几种异常检测方法。一些热门方法有:不同方法的性能在很大程度上取决于数据集和参数,比较许多数据集和参数时,各种方法与其他方法相比的系统优势不大。多萝西·丹宁(英语:Dorothy E. Denning)教授在1986年提出了入侵检测系统(IDS)的异常检测方法。入侵检测系统的异常检测通常是通过阈值和统计完成的,但也可以用软计算和归纳学习。 在1999年提出的统计类型包括检测用户、工作站、网络、远程主机与用户组的配置文件,以及基于频率、均值、方差、协方差和标准差的程序。 在入侵检测系统中,与异常检测模式相对应的还有误用检测(英语:misuse detection)模式。

相关

  • tRNA转运核糖核酸(Transfer RNA),又称传送核糖核酸、转移核糖核酸,通常简称为tRNA,是一种由76-90个核苷酸所组成的RNA,其3'端可以在氨酰-tRNA合成酶催化之下,接附特定种类的氨基酸。转
  • 土壤生态学土壤学是研究土壤及其生成的学科,是自然地理学的分支。它对研究植物的生长,繁殖以至分布都起着重要影响。 从农业角度来看,土壤是指陆地上能够让植物生长的疏松表层。英语pedo
  • 4f14 5d10 6s2 6p52, 8, 18, 32, 18, 7蒸气压主条目:砹的同位素砹(Astatine,台湾译作砈,旧讹作“鈪”、“銰”)是一种具有极高放射性的化学元素,符号为At,原子序为85。地球上所有的
  • 掺假混淆品(英语:adulterant,或称搀假货)指在食品、肥料、燃料或其它产品中添加掺杂非法、违规、行骗、或不道德的化学物质。掺假成分可以是故意被制造商添加的化学成分,通常用于减轻
  • 米歇尔·福柯前苏格拉底 · 古代 中世纪 · 文艺复兴 17世纪 · 18世纪 · 19世纪 · 20世纪 后现代 · 当代米歇尔·福柯(法语:Michel Foucault,1926年10月15日-1984年6月25日),
  • 东南丘陵东南丘陵,是北至长江,南至南海,西至云贵高原的大片低山和丘陵的总称。它包括安徽省、江苏省、江西省、浙江省、湖南省、福建省,广东省、广西壮族自治区的部分或全部。海拔多在20
  • 程时杰程时杰(1945年7月-),中国电力系统学家。华中科技大学教授。1945年生于湖北武汉,原籍湖北通山。1967年毕业于西安交通大学,1981年和1986年分别在华中工学院和加拿大卡尔加里大学获
  • 越南共产党中央委员会总书记政治主题越南共产党中央委员会总书记(越南语:Tổng Bí thư Ban Chấp hành Trung ương Đảng Cộng sản Việt Nam),1951年至1976年称第一书记(越南语:Bí thư Thứ nhất
  • 捷孚凯捷孚凯(德语:Gesellschaft für Konsumforschung,即“消费者调查公司”),是一家德国市场研究公司。前身是1934年由后来的德国经济部长路德维希·艾哈德等人成立于德国纽伦堡的市
  • 最小二乘法最小二乘法(英语:least squares method),又称最小平方法,是一种数学优化方法。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便的求得未知的数据,并使得