第4章大数定律和中心极限定理由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“大数法则之盈定理详解”。
第四章大数定律和中心极限定理
教 学 内 容(Contents)
Chapter Four大数定律和中心极限定理(Large Number Law and
Central Limit Theorem)
§4.1大数定律(Large number law)
人们在长期的实践中发现,事件发生的频率具有稳定性,也就是说随着试验次数的增多,事件发生的频率将稳定与一个确定的常数。对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均值也具有稳定性,由于这类稳定性都是在对随机现象进行大量重复试验的条件下呈现出来的,因而反映这方面规律的定理我们就统称为大数定律。
一、契比雪夫不等式(Chebyshev inequality)
Theorem 4.1设随机变量X的均值E(X)及方差D(X)存在,则对于任意正数,有不等式
P{|XE(X)|}D(X)
2成立。或P{|XE(X)|}1
anyvalue0 D(X)2(If the mean E(X)and variance D(X)of therandomvariable X areknown,thenfor
P{|XE(X)|}D(X)
2)orP{|XE(X)|}1D(X)
2
我们称该不等式为契比雪夫(Chebyshev)不等式。
Proof:(我们仅对连续性的随机变量进行证明)设f(x)为X的密度函数,记E(X),D(X)2
则P{|XE(X)|}
xf(x)dxx(x)2
22f(x)dx 12(x)2f(x)dx122D(X)
从定理中看出,如果D(X)越小,那么随机变量X取值于开区间(E(X),E(X))中的概率就越大,这就说明方差是一个反映随机变量的概率分布对其分布中心(distribution center)(E(X))的集中程度的数量指标。
利用契比雪夫不等式,我们可以在随机变量X的分布未知的情况下估算事件{|XE(X)|}的概率。
Example 4.1设随机变量X的数学期望E(X)10,方差D(X)0.04,估计
的大小。P9.2X1
1Solution
P0.8X101PX100.81P9.2X110.040.93752(0.8)
不会小于0.9375.因而 P9.2X11
二、契比雪夫大数定律(Chebyshev Law of Large Number)
Theorem 4.2设相互独立的随机变量X1,X2,,Xn,分别具有均值
E(X1),E(X2),,E(Xn),及方差D(X1)D(X2),,D(Xn),,若存在常数C,使D(Xk)C,(k1,2,),则对于任意正整数,有
1n1n
limPXkE(Xk)1 nnk1nk1
(Let X1,X2,,Xn, be a sequence of independent random variables with the mean E(X1),E(X2),,E(Xn), and variance D(X1),D(X2),,D(Xn),,suppose there exists a constant C, such that D(Xk)C,(k1,2,),then for any value 0,1n1n
limPXkE(Xk)1)nnk1nk1
Proof:由于X1,X2,,Xn,相互独立,那么对于任意的n1,X1,X2,,Xn相互独立。于是
1n1D(Xk)2nk1n
nD(Xk)k1nC n
令 yn
令n,则有1Xk,则由契比雪夫不等式(Chebyshev inequality)有 nk1D(Yn)C1PYnE(Yn)11 2n
2limPYnE(Yn)1 n
1n1n
即limPXkE(Xk)1.nnk1nk1
Corollary 4.1 设相互独立的随机变量X1,X2,,Xn,有相同的分布,且 E(Xk),1n则对于任意正整数,有m(Let D(Xk),(k1,2,)存在,ilPXk1.nnk1
and X1,X2,,Xn, be a sequence of independent and identically distributed random variables,2
E(Xk),D(Xk)2,(k1,2,)exist ,then,for any value 0,1nlimPXk1.)nnk1
定理4.2我们称之为契比雪夫大数定理(Chebyshev Law of Large Number),推论4.1是
1n它的特殊情况,该推论表明,当n很大时,事件Xk的概率接近于1。一般地,nk1
我们称概率接近于1的事件为大概率事件(large probability event),而称概率接近于0的事件为小概率事件(small probability event),在一次试验中大概率事件几乎肯定要发生,而小概率事件几乎不可能发生,这一规律我们称之为实际推断原理(fact infer principle)。
三、贝努里大数定律(Bernoulli Law of Large Number)
Theorem 4.3设m是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中
mp1.(Let m represents the nnnumber of events A that occur in the independent trials,p represents the probability of events
A that occur in each trials, then for any value 0
mlimPp1.)nn发生的概率,则对于任意正整数,有limPn
1第k次试验A发生(k1,2,),X1,X2,,Xk是n个相互
0第k次试验A不发生
独立的随机变量,且E(Xi)p,D(Xi)pq.又 mX1X2Xk,因而由推论4.1Proof:令XK有
mlimPp1nn
1limPXkp1nnk1n
定理4.3我们称之为贝努利大数定律(Bernoulli Law of Large Number),它表明事件A发生的频率mn依概率收敛于事件A的概率p,也就是说当n很大时事件发生的频率与概率有较大偏差的可能性很小。根据实际推断原理,当试验次数很大时,就可以利用事件发生的频率来近似地代替事件的概率。
§4.2中心极限定理(Central Limit Theorem)
中心极限定理(Central Limit Theorem)是研究在适当的条件下独立随机变量的部分和X
k1nk的分布收敛于正态分布的问题。
Theorem 4.4设相互独立的随机变量X1,X2,,Xn,服从同一分布,且
E(Xk),D(Xk)20,(k1,2,),则对于任意x,随机变量Yn
分布函数Fn(x)趋于标准正态分布函数,即有 Xk1nkn的n
nXnt2kx1limFn(x)limPk1xe2dt nnn2
(Let X1,X2,,Xn, be a sequence of independent and identically distributed random variables,and E(Xk),D(Xk),(k1,2,)exist ,then,for any x,the distribution function
2Fn(x)of random variable YnXk1nkn tends to the standard normal distribution, n
nXnt2kx12k1limFn(x)limPxedt.)nnn
定理的证明从略。
该定理我们通常称之为林德贝格-勒维(Lindeberg-Levy)定理。
Corollary 4.2设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为20.单分布函数未知,当n充分大时,XXk近似服从正态分布N(n,(n)2).k1n
(Let X1,X2,,Xn, be a sequence of independent and identically distributed random
2variables,with mean and variance 0.While the distribution function is unknown,and
n is large,then XXk isanormalapproximationdistribution N(n,(n)2).)
k1n
Corollary 4.3设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方
21n)).差为0.单分布函数未知,当n充分大时,Xk近似服从正态分布N(,(nk1n
(Let X1,X2,,Xn, be a sequence of independent and identically distributed random 2
2variables,with mean and variance 0.While the distribution function is unknown,and
1n
n is large,then Xk isanormalapproximationdistribution N(,()2).)nk1n由推论4.3知,无论X1,X2,,Xn是什么样的分布函数,他的平均数X当n充分大时总是近似地服从正态分布。
Example 4.2某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?
1第k个分机要用外线(k1,2,,260),X1,X2,,X2600第k个分机不要用外线
是260个相互独立的随机变量,且E(Xi)0.04,mX1X2X260表示同时使用外线的分机数,根据题意应确定最小的x使P{mx}95%成立。由上面定理,有Solution令XK
tx260pm260pb12P{mx}Pedt 260p(1p)2260p(1p)
查得(1.65)0.95050.95,故,取b1.65,于是 2
xb260p(1p)260p1.652600.040.962600.0415.6
1也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。
Example 4.3用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率。
Solution设一箱味精净重为X克,箱中第k袋味精的净重为Xk克,k1,2,,200.X1,X2,,X200是200个相互独立的随机变量,且E(Xk)100,D(Xk)100,E(X)E(X1X2X200)20000,D(X)20000,D(X)2
因而有P{X2050}01P{X2050} 0
5001(3.54)0.0002 22
Theorem 4.5(德莫佛—拉普拉斯定理DeMovire-Laplace Theorem)设mA表示n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率。则对于任意区间(a,b],恒有
t2mnnpb12limPabedt annp(1p)2
(Let mA represents the number of events A that occur in the nindependent trials,prepresents the probability of events A that occur in each trials, then for any interal(a,b],1PX20000
That is
tmnnpb12bedt.)limPaannp(1p)2
这两个定理表明二项分布的极限分布是正态分布。一般来说,当n较大时,二项分布的概2率计算起来非常复杂,这是我们就可以用正态分布来近似地计算二项分布。
np(1p)np(1p)np(1p)
nnpnnp(2)(1)np(1p)np(1p),0.8),求P{80X100}.Example 4.4 设随机变量X服从B(100
100808080}()()SolutionP{80X100n0.80.2n0.80.2
(5)(0)10.50.5 kn1Cnkpk(1p)nkP{n1mnn2}Pn2n1npmnnpn2np
Example 4.5 设电路共电网中内有10000盏灯,夜间每一盏灯开着的概率为0.7,假设各灯的开关彼此独立,计算同时开着的灯数在6800与7200之间的概率。,0.7),于是 Solution记同时开着的灯数为X,它服从二项分布B(10000
P{6800X7200}(72007000
0.70.30.70.32002()12(4.36)10.999991 45.83)(68007000)
第四章小结(Summary of Chapter Four)
本章介绍了大数定律和中心极限定理。要求了解契比雪夫不等式、契比雪夫定理和伯努利定理;了解独立同分布的中心极限定理和德莫佛—拉普拉斯定理。