第5章大数定律和中心极限定理由刀豆文库小编整理,希望给你工作、学习、生活带来方便,猜你可能喜欢“第5章中心极限定理”。
第5章大数定律和中心极限定理
§5.1大数定律
1.依概率收敛
我们曾经指出,频率是概率的反映,随着观察次数n不断增大,频率将会逐渐靠近概率,这里讲的逐渐靠近与数学分析中的极限概念有关系吗?怎样用数学语言来描述它?设事件A在一次试验中发生的概率为p,如果观察了n次这样的试验,事件A发生了un
unu,当n增大时,频率n逐渐靠近概率p,这个nn
uu“逐渐靠近”是否可以说n的极限是p,即 limnp?遗憾的是,这种说法是不成立的,nnn
因为这个极限意味着,对任意给定的0,必然存在充分大的整数N,使得对一切nN,uu都有np成立。而我们知道,频率n是随着试验结果而变的,比如在n重贝努利试nn
unA,A,A,,A1。从验中,下面的试验结果: 还是有可能发生的,这时,而unnnn个A出现次,则事件A在n次试验中发生的频率为
而当很小时(01p),无论N多么大,也不能得到当nN时,都有成立,从而极限关系limunpnunp不成立。nn
u但注意到当n很大时,事件:np发生的概率是很小的,例如上述的unn,即n
unu1发生的概率为p(n1)pn,显然,当n时,这个概率趋近于零。因此,频率nn
uu靠近概率不是意味着limnp,而是意味着limp(np)0,或者nnnn
limP(nunp)1。n
通过对这一问题的研究,下面我们给出依概率收敛的定义。
定义1设u1,u2,,un为一随机变量序列,a为一常数,如果对于任意给定的0,总有limp(una)0或者limp(una)1成立,就称随机变量序列{un}依概率收nn
敛于a,记为limuna或者una(n)。npp
另外,机变量序列{un}依概率收敛于a也可以说成:机变量序列{un}以概率1收敛于a,或者说成:机变量序列{un}几乎处处收敛于a,这是同一个概念的几种不同的说法。
2.大数定理
1)契比雪夫大数定律
定理设相互独立的随机变量X1,X2,,Xn,分别具有均值
E(X1),E(X2),,E(Xn),及方差D(X1)D(X2),,D(Xn),,若存在常数C,使D(Xk)C,(k1,2,),则对于任意正整数,有
1n1n
limPXkE(Xk)1 nnk1nk1
证明:由于X1,X2,,Xn,相互独立,那么对于任意的n1,X1,X2,,Xn相互独立。于是
1n1D(Xk)2nk1nD(Xk)
k1nC n
1n
令 ynXk,则由契比雪夫不等式,有 nk1
1PYnE(Yn)1
令n,则有 limPnE(Yn)1,nD(Yn)21C 2n
1n1n
即limPXkE(Xk)1.nnk1nk1
推论: 设相互独立的随机变量X1,X2,,Xn,有相同的分布,且 E(Xk),1nD(Xk),(k1,2,)存在,则对于任意正整数,有limPXk1.nnk1
1nX该推论表明,当n很大时,事件k的概率接近于1。一般地,我们称概nk12
率接近于1的事件为大概率事件,而称概率接近于0的事件为小概率事件,在一次试验中大概率事件几乎肯定要发生,而小概率事件几乎不可能发生,这一规律我们称之为实际推断原理。
2)贝努里大数定律
设m是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,mp1.n
1第k次试验A发生证明:令XK(k1,2,),X1,X2,,Xk是n个相互
0第k次试验A不发生
独立的随机变量,且E(Xi)p,D(Xi)pq1.又 mX1X2Xk,因而由推论则对于任意正整数,有limPn
4.1有
mlimPp1nn
n1limPXkp1nnk1
定理4.3我们称之为贝努利大数定律,它表明事件A发生的频率n依概率收敛于事件A的概率p,也就是说当n很大时事件发生的频率与概率有较大偏差的可能性很小。根据实际推断原理,当试验次数很大时,就可以利用事件发生的频率来近似地代替事件的概率。
定理3(辛钦大数定理)设1,2,,n,是相互独立的随机变量序列,它们服从相同的分布,且具有有限的数学期望 Eia,i1,2,,n,则对任意的0,有
1nlimPia1。nni1
§5.2中心极限定理
1.依分布收敛
定义:(依分布收敛)设随机变量Xn、X的分布函数分别为Fn(x)及F(x),如果任意L使得Fn(x)及F(x)连续的点x,都有Fn(x)F(x),则称Xn依分布收敛于X,并记为XnX。
2.中心极限定理
1)林德贝格-勒维定理:设相互独立的随机变量X1,X2,,Xn,服从同一分布,且 E(Xk),D(Xk)20,(k1,2,),则对于任意x,随机变量Yn
分布函数Fn(x)趋于标准正态分布函数,即有 Xk1nkn的n
nXnt2kx1limFn(x)limPk1xe2dt nnn2
定理的证明从略。
该定理我们通常称之为林德贝格-勒维(Lindeberg-Levy)定理。
推论1设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差为0.单分布函数未知,当n充分大时,XXk近似服从正态分布N(n,(n)2).2n
k1推论2:设相互独立的随机变量X1,X2,,Xn服从同一分布,已知均值为,方差
21n))。为0.单分布函数未知,当n充分大时,Xk近似服从正态分布N(,(nk1n
由推论知,无论X1,X2,,Xn是什么样的分布函数,他的平均数X当n充分大时总是2近似地服从正态分布。
例 1某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?
1第k个分机要用外线(k1,2,,260),X1,X2,,X260是260
0第k个分机不要用外线
个相互独立的随机变量,且E(Xi)0.04,令 mX1X2X260表示同时使用外线的分机数,根据题意,应确定最小的x使P{mx}95%成立。由林德贝格-勒维定理,有 解令XK
tx260pm260pb12P{mx}Pedt,260p(1p)2260p(1p)
查得(1.65)0.95050.95,故,取b1.65,于是 2
xb260p(1p)260p1.652600.040.962600.0415.61。也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。
例 4.3用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率。
解设一箱味精净重为X克,箱中第k袋味精的净重为Xk克,k1,2,,200.X1,X2,,X200是200个相互独立的随机变量,且E(Xk)100,D(Xk)100。
设 XX1X2X200,则
E(X)E(X1X2X200)20000,D(X)20000,D(X)2
}01P{X2050} 0因而有P{X2050
5001(3.54)0.0002。22
2)德莫佛—拉普拉斯定理:设mA表示n次独立重复试验中事件A发生的次数,p是事件
A在每次试验中发生的概率。则对于任意区间(a,b],恒有
t2bmnp1nlimPabe2dt annp(1p)2
这两个定理表明二项分布的极限分布是正态分布。一般来说,当n较大时,二项分布的概1PX20000率计算起来非常复杂,这是我们就可以用正态分布来近似地计算二项分布。
np(1p)np(1p)
nnpnnp(2)(1)。np(1p)np(1p),0.8),求P{80X100}.例 4.4 设随机变量X服从B(100
100808080}()()解P{80X100n0.80.2n0.80.2
(5)(0)10.50.5 kn1Cnkpk(1p)nkP{n1mnn2}Pn2n1npmnnpn2npnp(1p)
例 4.5 设电路共电网中内有10000盏灯,夜间每一盏灯开着的概率为0.7,假设各灯的开关彼此独立,计算同时开着的灯数在6800与7200之间的概率。,0.7),于是 解 记同时开着的灯数为X,它服从二项分布B(10000
P{6800X7200}(72007000
0.70.30.70.3
2002()12(4.36)10.999991。45.83
定理4(李雅普诺夫中心极限定理):设1,2,,n是独立随机变量序列,又Ekak,k2nn
k1)(68007000)Dk(k1,2,),记Bk2,若存在0,使有
2BnEk1n2kak0,n,1则对任意的x,有limp(nBn(k1nkak)x)21et22dt。