本福特定律

✍ dations ◷ 2025-11-13 11:31:24 #本福特定律

在数学中,本福特定律(英语:Benford's law)描述了真实数字数据集中首位数字的频率分布。一堆从实际生活得出的数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出之期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的概率就越低。它可用于检查各种数据是否有造假。但要注意使用条件:1.数据至少3000笔以上。2.不能有人为操控。

本福特定律说明在 b {displaystyle b} 进位制中,以数 n {displaystyle n} 起头的数出现的概率为:

P ( n ) = log b ( n + 1 ) log b ( n ) = log b ( n + 1 n ) , {displaystyle P(n)=log _{b}(n+1)-log _{b}(n)=log _{b}left({frac {n+1}{n}}right),}

其中 n = 1 , 2 , . . . , b 1. {displaystyle n=1,2,...,b-1.}

本福特定律不但适用于个位数字,连多位的数也可用。

在十进制首位数字的出现概率(%,小数点后一个位):

一组平均增长的数据开始时,增长得较慢,由最初的数字 a {displaystyle a} 增长到另一个数字 a + 1 {displaystyle a+1} 起首的数的时间,必然比 a + 1 {displaystyle a+1} 起首的数增长到 a + 2 {displaystyle a+2} ,需要更多时间,所以出现率就更高了。

从数数目来说,顺序从1开始数,1,2,3,...,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,...,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。

另一种解释如下. 当数据跨越多个数量级时,更自然的做法是画在对数坐标中,如果这些数据在对数坐标下的分布是均匀的,那么本福特定律自然成立。即使在对数坐标下的概率密度函数不是常数,只要其变化足够缓慢,且数据跨越了多个数量级,本福特定律也会近似成立,如下图所示.

BenfordBroad

这个定律的严格证明,可以参见Hill, T. P. "A Statistical Derivation of the Significant-Digit Law." Stat. Sci. 10, 354-363, 1996.。

1972年,Hal Varian提出这个定律来用作检查支持某些公共计划的经济数据有否欺瞒之处。1992年,Mark J. Nigrini便在其博士论文"The Detection of Income Tax Evasion Through an Analysis of Digital Frequencies."(Ph.D. thesis. Cincinnati, OH: University of Cincinnati, 1992.)提出以它检查是否有伪帐。

推而广之,它能用于在会计学、金融甚至选举中出现的数据。

华盛顿邮报引用该定律声称2009年伊朗总统大选中有造假。

若所用的数据有指定数值范围;或不是以概率分布出现的数据,如正态分布的数据;这个定律则不准确。

1881年,天文学家西蒙·纽康发现对数表包含以1起首的数那首几页较其他页破烂。

1938年,物理学家弗兰克·本福特(英语:Frank Benford)再次发现这个现象,还通过了检查许多数据来证实这点。

2009年,西班牙数学家在素数中发现了一种新模式,并且惊讶于为何现在才为人发现。虽然素数一般被认为是随机分布的,但西班牙数学家发现素数数列中每个素数的首位数字有明显的分布规律,它可以被描述了素数的本福特定律。这项新发现除了提供对素数属性的新洞见之外,还能应用于欺骗检测和股票市场分析等领域。

相关

  • 囊性、粘液、浆液性肿瘤囊性、粘液、浆液性肿瘤(Cystic, mucinous, and serous neoplasms, CMS),是一类位于卵巢的肿瘤。一类最常见的肿瘤是囊腺瘤。
  • 探险者一号探险者一号(英语:Explorer 1)是美国于1958年1月31日在佛罗里达州卡拉维纳尔角发射的第一颗地球人造卫星,晚于前苏联于1957年10月4日发射的世界第一颗地球人造卫星史普尼克1号和
  • 犬齿兽犬颌兽属(学名:Cynognathus)是种三叠纪中期的肉食性犬齿兽类,身长约1米长。犬颌兽属于真犬齿兽类,真犬齿兽类是最类似哺乳类的一群似哺乳爬行动物。犬颌兽属几乎分布于非洲、南美
  • 盖斯特讷魏尔湖坐标:48°45′08″N 11°22′34″E / 48.752300°N 11.376014°E / 48.752300; 11.376014盖斯特讷魏尔湖(德语:Gerstnerweiher),是德国的湖泊,位于该国东南部,由巴伐利亚州负责管辖
  • 魏布林根的阿格尼丝魏布林根的阿格尼丝(德语:,1072年—1143年9月24日),神圣罗马皇帝亨利四世的女儿。1086年,阿格尼丝与士瓦本公爵腓特烈一世结婚,两人共有2子2女:腓特烈一世于1105年去世。隔年,阿格尼
  • 阿尔西诺伊四世 阿尔西诺伊四世(英语:Arsinoe IV),(前63年-前41年),马其顿人,古埃及国王托勒密十二世幼女,克娄巴特拉七世、托勒密十三世和托勒密十四世之妹。亚历山大战争时期,她试图率军反击与凯撒
  • 后藤奈央后藤奈央(日语:後藤 なお),日本插画家。居住于东京都。
  • 集选区 政治主题集选区(英语:Group Representation Constituency, GRC)是新加坡实行的一种选举制度,也是一种选区,在该制度下需要几个人组成团队参选国会议员。实施集选区制度的官方理据主要是为确保国会有少数种族的代表:角逐集选区议席者的至少其中一人必须是来自新加坡马来族、印度族或其他少数种族社群。此外,对管理公共住宅区的市镇理事会(市镇会)而言,打理较大规模的选区将更经济。集选区制度于1988年6月1日生效,在这个制度落实之前,所有选区均与其他西敏制国家一样为单选区(Single
  • 魅魔魅魔(英语:succubus)是中世纪时在欧洲及中东民间传说的一种女性邪灵或超自然个体。她们会在梦中以人类女性的形式出现,一般透过性交来勾引男人。与之对应的男性邪灵叫作梦魔。宗教传统认为持续与魅魔多次性交,会令健康受损,甚至死亡。而在这个族群中会有一个统领全族的领主,神话中多半都是描述为美男子的样貌,所见其者必为之倾倒,但实质上性别不知。魅魔最早出现的历史是属美索不达米亚区域中的传说之一,于苏美王表中可考究。而在现代的小说故事里,魅魔不一定只在梦中出现,而且形象皆为极具诱惑的性感女性。暗黑破坏神系列
  • 埃尔科莱·加莱加蒂埃尔科莱·加莱加蒂(意大利语:Ercole Gallegati,1911年11月21日-1990年8月19日),意大利男子摔跤运动员。他曾代表意大利参加1932年、1936年、1948年和1952年夏季奥林匹克运动会摔跤比赛,获得两枚铜牌。