贝叶斯垃圾邮件过滤

✍ dations ◷ 2025-05-18 04:19:19 #垃圾邮件过滤

贝叶斯垃圾邮件过滤是一种电子邮件过滤的统计学技术。它使用贝叶斯分类来进行垃圾邮件的判别。

贝叶斯分类的运作是借着使用标记(一般是字词,有时候是其他)与垃圾邮件、非垃圾邮件的关连,然后搭配贝叶斯推断来计算一封邮件为垃圾邮件的可能性。

贝叶斯垃圾邮件过滤是非常有威力的技术,可以修改自己以符合个别使用者的需要,并且给予较低的垃圾邮件侦测率,让使用者可接受。

第一个已知使用贝叶斯分类的邮件过滤是Jason Rennie的iFile,在1996年释出。这个程式可以排序邮件并放到目录。第一个关于贝叶斯垃圾邮件过滤的学术出版是由Sahami et al.在1998年所写。之后很快就被应用到商用的垃圾邮件过滤器上。然而,在2002年,Paul Graham大大地加强了假阳性的几率,所以它可以作为一个简单的垃圾过滤器来使用。

根植于此技术的变种技术相继在许多的研究工作与商业产品上被实作出来。许多流行的邮件客户端都实作了贝叶斯垃圾邮件过滤。使用者也可以安装其他的邮件过滤程式。服务器端的邮件过滤器,像DSPAM、SpamAssassin、SpamBayes、Bogofilter与ASSP也都利用了贝叶斯邮件过滤技术,有时候这个功能直接内建在邮件服务器软件上。

贝叶斯过滤被广泛地使用来鉴别垃圾邮件,但这项技术其实可以用来分类(或丛集)几乎任何种类的资料。它被使用在科学、医学与工程方面。例如普遍用来分类的程式:AutoClass,它可以根据可能非常微小到难以察觉的光谱特征来分类星星。最近甚至有人推测大脑可能也使用贝叶斯方法来为知觉刺激做分类并决定行为回应。

相关

  • 斯通波利岛斯特龙博利岛(英语:Stromboli),是位于意大利半岛西边第勒尼安海的一座火山岛,属于意大利三大活跃火山中的一座。它与西西里岛北部的埃奥利群岛形成一火山岛弧,此区域为全球地震最
  • 烟碱尼古丁(英语:Nicotine),俗称烟碱,是一种发现于茄科植物的强效拟副交感神经生物碱,是香烟的主要化学成分和主要致瘾成分,属于兴奋剂的一种。尼古丁是一种烟碱型乙酰胆碱受体(英语:Nico
  • 公平委员会委员加利福尼亚州公平委员会(California State Board of Equalization,BOE,常被简称为“加州平税局”)是美国加利福尼亚州一个专门监督税赋的政府机构。公平委员会有权管理州销售税
  • 字体光栅化字体光栅化是将文字从一个向量表示(比如一个TrueType字体)转化到光栅或者位图表示的过程。在这个过程中往往涉及一些抗锯齿技术来使得屏幕上的字体更加平滑易读。这也经常会涉
  • 玛家乡坐标:22°42′31″N 120°38′58″E / 22.7086763°N 120.6494041°E / 22.7086763; 120.6494041玛家乡(排湾语:Makazayazaya)位于台湾屏东县东北方,北临三地门乡,东侧和北侧连雾
  • 手套箱 (汽车)手套箱(英语:Glove compartment,Glovebox或Glovie),是汽车驾驶舱内集成在仪表板上的一个储物空间,多位于副驾驶的腿部位置。早期专供驾驶人放置手套因而得名。手套箱在面包车通常
  • 400米赛跑400米赛跑是一种常见的田径短跑项目。通常它是短跑中距离最长的。在标准的室外跑道上,400米正好是绕跑道一圈的长度。运动员从错列的的起跑线出发,并在全程中都分道赛跑。目前
  • 泛神论之争泛神论之争 (德语:Pantheismusstreit)指的是德国思想史上发生于1785-1789年的著名事件,并在整个欧洲产生了影响。
  • 阿布拉罕-劳仑兹-狄拉克力阿布拉罕-劳仑兹-狄拉克力(Abraham-Lorentz-Dirac force)是阿布拉罕-劳仑兹力的改版,跟阿布拉罕-劳仑兹力一样,是描述当加速带电粒子因为粒子放射出电磁辐射而所受到的平均力,只
  • 兔儿爷兔儿爷是老北京民间的传统玩具,最早源于明末的祭月泥偶,到了清代,逐渐转变成了儿童的玩具。一般认为,兔儿爷的形象源自月中的玉兔,一个流传较广的传说故事是这样说的:有一年,北京城