首页 >
大数定理
✍ dations ◷ 2024-11-05 16:26:00 #大数定理
在数学与统计学中,大数定律又称大数法则、大数律,是描述相当多次数重复实验的结果的定律。根据这个定律知道,样本数量越多,则其算术平均值就有越高的概率接近期望值。大数定律很重要,因为它“说明”了一些随机事件的均值的长期稳定性。人们发现,在重复试验中,随着试验次数的增加,事件发生的频率趋于一个稳定值;人们同时也发现,在对物理量的测量实践中,测定值的算术平均也具有稳定性。比如,我们向上抛一枚硬币,硬币落下后哪一面朝上是偶然的,但当我们上抛硬币的次数足够多后,达到上万次甚至几十万几百万次以后,我们就会发现,硬币每一面向上的次数约占总次数的二分之一,亦即偶然之中包含着必然。切比雪夫不等式的一个特殊情况、辛钦定理和伯努利大数定律都概括了这一现象,都称为大数定律。例如,抛掷一颗均匀的6面的骰子,1,2,3,4,5,6应等概率出现,所以每次扔出骰子后,出现点数的期望值是1
+
2
+
3
+
4
+
5
+
6
6
=
3.5
{displaystyle {frac {1+2+3+4+5+6}{6}}=3.5}根据大数定理,如果多次抛掷骰子,随着抛掷次数的增加,平均值(样本平均值)应该接近3.5,根据大数定理,在多次伯努利实验中,实验概率最后收敛于理论推断的概率值,对于伯努利随机变量,理论推断的成功概率就是期望值,而若对n个相互独立的随机变量的平均值,频率越多则相对越精准。例如硬币投掷即伯努利实验,当投掷一枚均匀的硬币,理论上得出的正面向上的概率应是1/2。因此,根据大数定理,正面朝上的比例在相对“大”的数字下,“理应”接近为1/2,尤其是正面朝上的概率在n次实验(n接近无限大时)后应几近收敛到1/2。即使正面朝上(或背面朝上)的比例接近1/2,几乎很自然的正面与负面朝上的绝对差值(absolute difference差值范围)应该相应随着抛掷次数的增加而增加。换句话说,绝对差值的概率应该是会随着抛掷次数而接近于0。直观的来看,绝对差值的期望会增加,只是慢于抛掷次数增加的速度。大数定律主要有两种表现形式:弱大数定律和强大数定律。定律的两种形式都肯定无疑地表明,样本均值收敛于真值其中
X
1
{displaystyle X_{1}}
,
X
2
{displaystyle X_{2}}
, ... 是独立同分布、期望值
E
(
X
1
)
=
E
(
X
2
)
=
⋯
=
μ
{displaystyle operatorname {E} (X_{1})=operatorname {E} (X_{2})=,cdots ,=mu }
且皆勒贝格可积的随机变量构成的无穷序列。
X
j
{displaystyle X_{j}}
的勒贝格可积性意味着期望值
E
(
X
j
)
{displaystyle operatorname {E} (X_{j})}
存在且有限。方差
Var
(
X
1
)
=
Var
(
X
2
)
=
⋯
=
σ
2
<
∞
{displaystyle operatorname {Var} (X_{1})=operatorname {Var} (X_{2})=,cdots ,=sigma ^{2}<infty }
有限的假设是非必要的。很大或者无穷大的方差会使其收敛得缓慢一些,但大数定律仍然成立。通常采用这个假设来使证明更加简洁。强和弱之间的差别在所断言的收敛的方式。对于这些方式的解释,参见随机变量的收敛。弱大数定律也称为辛钦定理,陈述为:样本均值依概率收敛于期望值。也就是说对于任意正数 ε,强大数定律指出,样本均值以概率1收敛于期望值。即设
a
1
,
a
2
,
…
,
a
n
,
…
{displaystyle a_{1}, a_{2}, dots , a_{n}, dots }
为相互独立的随机变量,其数学期望为:
E
(
a
i
)
=
μ
(
i
=
1
,
2
,
…
)
{displaystyle operatorname {E} (a_{i})=mu quad (i=1, 2, dots )}
,方差为:
Var
(
a
i
)
=
σ
2
(
i
=
1
,
2
,
…
)
{displaystyle operatorname {Var} (a_{i})=sigma ^{2}quad (i=1, 2, dots )}则序列
a
¯
=
1
n
∑
i
=
1
n
a
i
{displaystyle {overline {a}}={frac {1}{n}}sum _{i=1}^{n}a_{i}}
依概率收敛于
μ
{displaystyle mu }
(即收敛于此数列的数学期望
E
(
a
i
)
{displaystyle E(a_{i})}
)。换言之,在定理条件下,当
n
{displaystyle n}
无限变大时,
n
{displaystyle n}
个随机变量的算术平均将变成一个常数。设在
n
{displaystyle n}
次独立重复伯努利试验中,
事件
X
{displaystyle X}
发生的次数为
n
x
{displaystyle n_{x}}
。
事件
X
{displaystyle X}
在每次试验中发生的总体概率为
p
{displaystyle p}
。
n
x
n
{displaystyle {frac {n_{x}}{n}}}
代表样本发生事件
X
{displaystyle X}
的频率。大数定律可用概率极限值定义:
则对任意正数
ε
>
0
{displaystyle varepsilon >0}
,下式成立:定理表明事件发生的频率依概率收敛于事件的总体概率。
定理以严格的数学形式表达了频率的稳定性。
就是说当
n
{displaystyle n}
很大时,事件发生的频率于总体概率有较大偏差的可能性很小。
相关
- 并殖属见内文并殖属(学名:Paragonimus)是扁形动物门吸虫纲复殖亚纲斜睾目住胞科的一个属。本属物种多达数十个,而且部分物种之下还有亚种,彼此间要分辨也不容易,而当中有多少属于同种异
- 畸胎瘤畸胎瘤(英语:Teratoma)是一种常见的卵巢肿瘤,来源于多能性生殖细胞,发病率占全部卵巢原发性肿瘤的15%。畸胎瘤主要为实心或囊心、被膜包覆的肿瘤,在肿瘤中可以看到许多类似正常的
- 图书馆2.0图书馆2.0代表一种现代化形式的图书馆服务之广义模式,它反映了图书馆提供服务给使用者的模式之转变。图书馆2.0的概念是建立在商业2.0(英语:Business 2.0)和Web 2.0的哲学基础上
- 儿科学小儿科(或称儿科)是现代医学的一个分支,专门医疗患病的婴儿、儿童及青少年。最大的年龄通常至青春期。一个受到这方面知识专门训练的医生被称作儿科医生。
- 星际物质在天文学,星际物质(ISM)是存在于星系的恒星系统之外,在太空中的物质和辐射。这些物质的形式包括电离的气体、原子、和分子,以及宇宙尘和宇宙射线。它们填充了星际空间,并且顺利地
- 梅第奇家族美第奇家族(意大利语:Medici,/ˈmɛdᵻtʃi/ MED-i-chee;意大利语发音:),或译为麦地奇家族、梅迪奇家族、梅迪契家族、梅第奇家族,是佛罗伦萨15世纪至18世纪中期在欧洲拥有强大势力
- 弗里茨·阿尔贝特·李普曼弗里茨·阿尔贝特·李普曼(Fritz Albert Lipmann,1899年6月12日-1986年7月24日),生于德国的犹太裔美国籍生物化学家,由于发现辅酶A及其作为中间体在代谢中的重要作用而获得1953年
- 詹姆斯·约瑟夫·西尔维斯特詹姆斯·约瑟夫·西尔维斯特(英语:James Joseph Sylvester,1814年9月3日-1897年3月15日),英国数学家和律师。西尔维斯特从1833年开始在剑桥大学圣约翰学院就读,但由于他是犹太人他
- 瓢虫瓢虫为鞘翅目瓢虫科(学名:Coccinellidae)圆形突起的甲虫的通称,是体色鲜艳的小型昆虫,常具红、黑或黄色斑点。别称为胖小、红娘、花大姐、金龟、金龟子(但金龟子实际上是指另一种
- 大不列颠岛坐标:53°49′34″N 2°25′19″W / 53.826°N 2.422°W / 53.826; -2.422大不列颠岛(英语:Great Britain;苏格兰盖尔语:Breatainn Mhòr;威尔士语:Prydain Fawr;Cornish:Breten Veur