贝叶斯垃圾邮件过滤

✍ dations ◷ 2025-06-28 22:29:06 #垃圾邮件过滤

贝叶斯垃圾邮件过滤是一种电子邮件过滤的统计学技术。它使用贝叶斯分类来进行垃圾邮件的判别。

贝叶斯分类的运作是借着使用标记(一般是字词,有时候是其他)与垃圾邮件、非垃圾邮件的关连,然后搭配贝叶斯推断来计算一封邮件为垃圾邮件的可能性。

贝叶斯垃圾邮件过滤是非常有威力的技术,可以修改自己以符合个别使用者的需要,并且给予较低的垃圾邮件侦测率,让使用者可接受。

第一个已知使用贝叶斯分类的邮件过滤是Jason Rennie的iFile,在1996年释出。这个程式可以排序邮件并放到目录。第一个关于贝叶斯垃圾邮件过滤的学术出版是由Sahami et al.在1998年所写。之后很快就被应用到商用的垃圾邮件过滤器上。然而,在2002年,Paul Graham大大地加强了假阳性的几率,所以它可以作为一个简单的垃圾过滤器来使用。

根植于此技术的变种技术相继在许多的研究工作与商业产品上被实作出来。许多流行的邮件客户端都实作了贝叶斯垃圾邮件过滤。使用者也可以安装其他的邮件过滤程式。服务器端的邮件过滤器,像DSPAM、SpamAssassin、SpamBayes、Bogofilter与ASSP也都利用了贝叶斯邮件过滤技术,有时候这个功能直接内建在邮件服务器软件上。

贝叶斯过滤被广泛地使用来鉴别垃圾邮件,但这项技术其实可以用来分类(或丛集)几乎任何种类的资料。它被使用在科学、医学与工程方面。例如普遍用来分类的程式:AutoClass,它可以根据可能非常微小到难以察觉的光谱特征来分类星星。最近甚至有人推测大脑可能也使用贝叶斯方法来为知觉刺激做分类并决定行为回应。

相关

  • 新发传染病新兴传染病一般定义是近二十年以来,新出现在人类身上的传染病,而该疾病的发生率除了有快速增加的趋势,且在地理分布上有扩张的情况,甚至发展出新的抗药性机制等 ,都可以算是新兴
  • 思想家思想家,是指对各层面的学术都有广泛研究或其思想足以建立出一个思想体系的人(如, 中国:老子、孔子、孟子、荀子、王充、王守仁、李贽、朱熹、顾炎武、龚自珍、魏源、康有为、鲁
  • 大卡卡路里(Calorie,缩写为cal),简称卡,是一物理学能量单位,其定义为将1克水在1大气压(101.325kPa)下提升1摄氏度所需要的热量。由于科学家发现水在不同温度下的比热容不同,所以衍生了以
  • 布莱恩布莱恩县(Blaine County, Oklahoma)是美国奥克拉荷马州中西部的一个县。面积2,432平方公里。根据美国2000年人口普查,共有人口11,976人。县治沃通加 (Watonga)。成立于1892年4
  • 揭黑幕者吹哨人(英语:Whistleblower,中文译名有告密者、告密人、吹哨者、举报者、揭黑幕者、揭弊者、扒粪者、弊端揭发人等,粤语称㧻魁)指的是揭露一个组织(无论其是私有还是公共的)内部非
  • 高棉人高棉人(高棉语:ខ្មែរ)是柬埔寨的主要民族,占柬埔寨1480万人口的80%左右。一些高棉人生活在相邻的泰国和越南。高棉人是越南54个民族之一,人口1055174人(1999年统计),该民族也分
  • 虎钳虎钳,又称万力、台钳,是一个将工作物夹住方便加工的工具,工作物本身在加工时还可以改变施加的压力和固定。虎钳应用的是螺旋机制。水平式虎钳,固定在工作桌上,无法随时取下,用螺栓
  • 海洋怪声海洋怪声(英语:the Bloop)是美国国家海洋及大气管理局(NOAA)于1997年夏天在南太平洋侦测到的超低频深海声音讯号。研究者认为这个声音可能来源于生物,由于其为相距数千英里的几个
  • 行波管行波管(英语:TWT, Traveling-wave tube)是一种利用电子流与沿慢波系统行进的电磁波间的连续相互作用而放大超高频电磁波(微波)的电子管。主要由电子枪、慢波系统和收集极等部分组
  • 何塞·穆希卡荷西·阿伯托·穆希卡·康丹诺(西班牙语:José Alberto Mujica Cordano,1935年5月20日-)乌拉圭政治家,曾为第40任乌拉圭总统。1935年5月20日,穆希卡出生于乌拉圭首都蒙得维的亚附近