本篇文章对于初中生难度较高,建议先看这个。
一、 核心进阶
1.1 条件概率的链式法则
对于多个事件 A1,A2,…,AnA_1, A_2, \dots, A_nA1 ,A2 ,…,An :
P(A1A2⋯An)=P(A1)P(A2∣A1)P(A3∣A1A2)⋯P(An∣A1⋯An−1)P(A_1A_2\cdots A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2)\cdots P(A_n|A_1\cdots A_{n-1}) P(A1 A2 ⋯An )=P(A1 )P(A2 ∣A1 )P(A3 ∣A1 A2 )⋯P(An ∣A1 ⋯An−1 )
要注意哦👆
例1:一盒子中有5个红球、3个白球,不放回抽取3次,求:
(1) 第一次红、第二次白、第三次红的概率
(2) 前两次颜色不同的条件下,第三次是红球的概率
解:
(1) P=58×37×46=528P = \frac{5}{8} \times \frac{3}{7} \times \frac{4}{6} = \frac{5}{28}P=85 ×73 ×64 =285
(2) 前两次颜色不同的情况:A1A_1A1 ={红白} 或 A2A_2A2 ={白红}
P=P(A1)P(红∣A1)+P(A2)P(红∣A2)P(A1)+P(A2)=58×37×46+38×57×4658×37+38×57=46=23P = \frac{P(A_1)P(红|A_1) + P(A_2)P(红|A_2)}{P(A_1)+P(A_2)} = \frac{\frac{5}{8}\times\frac{3}{7}\times\frac{4}{6} + \frac{3}{8}\times\frac{5}{7}\times\frac{4}{6}}{\frac{5}{8}\times\frac{3}{7} + \frac{3}{8}\times\frac{5}{7}} =
\frac{4}{6} = \frac{2}{3} P=P(A1 )+P(A2 )P(A1 )P(红∣A1 )+P(A2 )P(红∣A2 ) =85 ×73 +83 ×75 85 ×73 ×64 +83 ×75 ×64 =64 =32
1.2 独立性扩展
* 两两独立:任意两个事件独立
* 相互独立:任意多个事件同时发生的概率等于各自概率的乘积
* 注意:两两独立 ≠ 相互独立
反例:抛两枚均匀硬币,AAA={第一枚正面}, BBB={第二枚正面}, CCC={两枚同面}
P(A)=P(B)=P(C)=12,P(AB)=P(AC)=P(BC)=14P(A)=P(B)=P(C)=\frac{1}{2}, P(AB)=P(AC)=P(BC)=\frac{1}{4} P(A)=P(B)=P(C)=21 ,P(AB)=P(AC)=P(BC)=41
但 P(ABC)=14≠P(A)P(B)P(C)=18P(ABC)=\frac{1}{4} \neq P(A)P(B)P(C)=\frac{1}{8}P(ABC)=41 =P(A)P(B)P(C)=81 ,故两两独立但非相互独立。
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
二、 离散随机变量深入
2.1 几何分布
XXX ~ Ge(p)Ge(p)Ge(p):首次成功所需的试验次数
P(X=k)=(1−p)k−1p,E(X)=1p,D(X)=1−pp2P(X=k) = (1-p)^{k-1}p, \quad E(X)=\frac{1}{p}, \quad D(X)=\frac{1-p}{p^2} P(X=k)=(1−p)k−1p,E(X)=p1 ,D(X)=p21−p
例2:射手的命中率为0.8,每次射击独立
(1) 首次命中所需射击次数不超过3的概率
(2) 已知前3次未命中,第4次命中的概率
解:
(1) P(X≤3)=0.8+0.2×0.8+0.22×0.8=0.992P(X≤3) = 0.8 + 0.2×0.8 + 0.2^2×0.8 = 0.992P(X≤3)=0.8+0.2×0.8+0.22×0.8=0.992
(2) 由几何分布的无记忆性:P(X=4∣X>3)=0.8P(X=4|X>3)=0.8P(X=4∣X>3)=0.8
2.2 复合分布(压轴题常考)
例3(竞赛题):设昆虫产卵数NNN~Poisson(λ)Poisson(\lambda)Poisson(λ),每个卵以概率ppp孵化,各卵孵化独立。求孵化出的昆虫数MMM的分布、期望、方差。
解:
(1) 分布:由全概率公式
P(M=m)=∑n=m∞P(N=n)P(M=m∣N=n)P(M=m) = \sum_{n=m}^\infty P(N=n)P(M=m|N=n) P(M=m)=n=m∑∞ P(N=n)P(M=m∣N=n)
=∑n=m∞e−λλnn!Cnmpm(1−p)n−m= \sum_{n=m}^\infty e^{-\lambda}\frac{\lambda^n}{n!}C_n^m p^m (1-p)^{n-m} =n=m∑∞ e−λn!λn Cnm pm(1−p)n−m
令k=n−mk=n-mk=n−m:
=e−λ(λp)mm!∑k=0∞[λ(1−p)]kk!=e−λp(λp)mm!= e^{-\lambda}\frac{(\lambda p)^m}{m!}\sum_{k=0}^\infty \frac{[\lambda(1-p)]^k}{k!} = e^{-\lambda p}\frac{(\lambda p)^m}{m!} =e−λm!(λp)m k=0∑∞ k![λ(1−p)]k =e−λpm!(λp)m
故MMM ~ Poisson(λp)Poisson(\lambda p)Poisson(λp)
(2) 期望方差:E(M)=λpE(M)=\lambda pE(M)=λp, D(M)=λpD(M)=\lambda pD(M)=λp
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
三、 连续随机变量深入
3.1 正态分布变换
若XXX~N(μ,σ2)N(\mu, \sigma^2)N(μ,σ2),则:
1. 标准化:Z=X−μσZ=\frac{X-\mu}{\sigma}Z=σX−μ ~N(0,1)N(0,1)N(0,1)
2. 线性变换:Y=aX+bY=aX+bY=aX+b~N(aμ+b,a2σ2)N(a\mu+b, a^2\sigma^2)N(aμ+b,a2σ2)
3. 可加性:独立时XiX_iXi ~N(μi,σi2)N(\mu_i,\sigma_i^2)N(μi ,σi2 ),则∑aiXi\sum a_iX_i∑ai Xi ~N(∑aiμi,∑ai2σi2)N(\sum a_i\mu_i, \sum a_i^2\sigma_i^2)N(∑ai μi ,∑ai2 σi2 )
例4:设备寿命XXX~N(1000,502)N(1000,50^2)N(1000,502)(小时)
(1) 寿命超过1100小时的概率
(2) 任取3台,至少2台寿命超过1000小时的概率
解:
(1) P(X>1100)=P(Z>1100−100050)=P(Z>2)=1−Φ(2)≈0.0228P(X>1100)=P(Z>\frac{1100-1000}{50})=P(Z>2)=1-\Phi(2)\approx0.0228P(X>1100)=P(Z>501100−1000 )=P(Z>2)=1−Φ(2)≈0.0228
(2) 设YYY为超过1000小时的台数,则YYY~B(3,0.5)B(3,0.5)B(3,0.5)
P(Y≥2)=C32(0.5)3+C33(0.5)3=0.5P(Y≥2)=C_3^2(0.5)^3 + C_3^3(0.5)^3=0.5P(Y≥2)=C32 (0.5)3+C33 (0.5)3=0.5
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
四、 大数定律与中心极限定理
4.1 契比雪夫不等式
对任意ϵ>0\epsilon>0ϵ>0,P(∣X−E(X)∣≥ϵ)≤D(X)ϵ2P(|X-E(X)|≥\epsilon)≤\frac{D(X)}{\epsilon^2}P(∣X−E(X)∣≥ϵ)≤ϵ2D(X)
应用:估计概率上界,证明大数定律
4.2 中心极限定理(压轴核心)
独立同分布XiX_iXi ,E(Xi)=μE(X_i)=\muE(Xi )=μ,D(Xi)=σ2D(X_i)=\sigma^2D(Xi )=σ2,则
∑i=1nXi−nμσn→dN(0,1)\frac{\sum_{i=1}^n X_i - n\mu}{\sigma\sqrt{n}} \xrightarrow{d} N(0,1) σn ∑i=1n Xi −nμ d N(0,1)
例5(压轴题):某保险公司有10000个同类型保险,每单保费200元,理赔额XXX(万元)分布:
P(X=0)=0.9P(X=0)=0.9P(X=0)=0.9, P(X=5)=0.08P(X=5)=0.08P(X=5)=0.08, P(X=10)=0.02P(X=10)=0.02P(X=10)=0.02
(1) 利润不低于40万元的概率
(2) 安全附加费率θ\thetaθ应为多少,使得保险公司破产概率小于0.01?
解:
(1) 设理赔总额S=∑i=110000XiS=\sum_{i=1}^{10000} X_iS=∑i=110000 Xi
E(X)=0×0.9+5×0.08+10×0.02=0.6E(X)=0×0.9+5×0.08+10×0.02=0.6E(X)=0×0.9+5×0.08+10×0.02=0.6(万元)
E(X2)=0×0.9+25×0.08+100×0.02=4E(X^2)=0×0.9+25×0.08+100×0.02=4E(X2)=0×0.9+25×0.08+100×0.02=4
D(X)=4−0.62=3.64D(X)=4-0.6^2=3.64D(X)=4−0.62=3.64
总保费P=10000×0.02=200P=10000×0.02=200P=10000×0.02=200万元
利润Y=200−SY=200-SY=200−S
P(Y≥40)=P(S≤160)P(Y≥40)=P(S≤160)P(Y≥40)=P(S≤160)
由中心极限定理,SSS近似服从N(6000,36400)N(6000, 36400)N(6000,36400)(单位:千元)
P(S≤160000)=P(Z≤160000−6000036400×1000)≈P(Z≤1000006033)≈P(Z≤16.58)≈1P(S≤160000)=P\left(Z≤\frac{160000-60000}{\sqrt{36400×1000}}\right)≈P\left(Z≤\frac{100000}{6033}\right)≈P(Z≤16.58)≈1 P(S≤160000)=P(Z≤36400×1000 160000−60000 )≈P(Z≤6033100000 )≈P(Z≤16.58)≈1
(2) 设保费为200(1+θ)200(1+\theta)200(1+θ),要P(S>10000×0.02(1+θ))<0.01P(S>10000×0.02(1+\theta))<0.01P(S>10000×0.02(1+θ))<0.01
即P(Z>200(1+θ)−1203.64)<0.01P\left(Z>\frac{200(1+\theta)-120}{\sqrt{3.64}}\right)<0.01P(Z>3.64 200(1+θ)−120 )<0.01
查表Φ−1(0.99)=2.33\Phi^{-1}(0.99)=2.33Φ−1(0.99)=2.33
200(1+θ)−1203.64>2.33\frac{200(1+\theta)-120}{\sqrt{3.64}}>2.333.64 200(1+θ)−120 >2.33 ⇒ θ>0.042\theta>0.042θ>0.042,即附加费率至少4.2%
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
五、 多维随机变量与协方差矩阵
5.1 协方差性质
* Cov(aX+b,cY+d)=ac Cov(X,Y)Cov(aX+b, cY+d) = ac\,Cov(X,Y)Cov(aX+b,cY+d)=acCov(X,Y)
* Cov(X,Y)=E(XY)−E(X)E(Y)Cov(X,Y) = E(XY)-E(X)E(Y)Cov(X,Y)=E(XY)−E(X)E(Y)
* D(X±Y)=D(X)+D(Y)±2Cov(X,Y)D(X±Y) = D(X)+D(Y)±2Cov(X,Y)D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
* 相关系数:ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}ρXY =D(X)D(Y) Cov(X,Y) ,∣ρ∣≤1|\rho|≤1∣ρ∣≤1
例6:(X,Y)(X,Y)(X,Y)的联合密度f(x,y)=x+yf(x,y)=x+yf(x,y)=x+y,0<x<10<x<10<x<1,0<y<10<y<10<y<1
(1) 边缘密度
(2) 协方差与相关系数
(3) Z=X+YZ=X+YZ=X+Y的分布
解:
(1) fX(x)=∫01(x+y)dy=x+12f_X(x)=\int_0^1 (x+y)dy=x+\frac{1}{2}fX (x)=∫01 (x+y)dy=x+21 ,同理fY(y)=y+12f_Y(y)=y+\frac{1}{2}fY (y)=y+21
(2) E(X)=∫01x(x+12)dx=712E(X)=\int_0^1 x(x+\frac{1}{2})dx=\frac{7}{12}E(X)=∫01 x(x+21 )dx=127
E(XY)=∫01∫01xy(x+y)dxdy=13E(XY)=\int_0^1\int_0^1 xy(x+y)dxdy=\frac{1}{3}E(XY)=∫01 ∫01 xy(x+y)dxdy=31
Cov(X,Y)=13−712×712=−1144Cov(X,Y)=\frac{1}{3}-\frac{7}{12}×\frac{7}{12}=-\frac{1}{144}Cov(X,Y)=31 −127 ×127 =−1441
D(X)=E(X2)−[E(X)]2=∫01x2(x+12)dx−49144=11144D(X)=E(X^2)-[E(X)]^2=\int_0^1 x^2(x+\frac{1}{2})dx-\frac{49}{144}=\frac{11}{144}D(X)=E(X2)−[E(X)]2=∫01 x2(x+21 )dx−14449 =14411
同理D(Y)=11144D(Y)=\frac{11}{144}D(Y)=14411
ρ=−1/14411/144=−111\rho=\frac{-1/144}{11/144}=-\frac{1}{11}ρ=11/144−1/144 =−111
(3) 分布函数FZ(z)=P(X+Y≤z)F_Z(z)=P(X+Y≤z)FZ (z)=P(X+Y≤z)
当0<z≤10<z≤10<z≤1:FZ(z)=∫0z∫0z−x(x+y)dydx=z33F_Z(z)=\int_0^z\int_0^{z-x}(x+y)dydx=\frac{z^3}{3}FZ (z)=∫0z ∫0z−x (x+y)dydx=3z3
当1<z≤21<z≤21<z≤2:FZ(z)=1−∫z−11∫z−x1(x+y)dydxF_Z(z)=1-\int_{z-1}^1\int_{z-x}^1 (x+y)dydxFZ (z)=1−∫z−11 ∫z−x1 (x+y)dydx
求导得密度函数(分段表示)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
六、 极限定理综合压轴题
最终压轴题:设X1,X2,…X_1,X_2,\dotsX1 ,X2 ,…独立同分布,P(Xi=1)=p=1−P(Xi=0)P(X_i=1)=p=1-P(X_i=0)P(Xi =1)=p=1−P(Xi =0)
定义T=min{n:∑i=1nXi=100}T=\min\{n: \sum_{i=1}^n X_i = 100\}T=min{n:∑i=1n Xi =100}(第100次成功所需试验次数)
(1) 求E(T)E(T)E(T)和D(T)D(T)D(T)
(2) 用中心极限定理近似计算P(T>120)P(T>120)P(T>120)(p=0.6p=0.6p=0.6时)
(3) 证明:T−100/p100(1−p)/p2→dN(0,1)\frac{T-100/p}{\sqrt{100(1-p)/p^2}} \xrightarrow{d} N(0,1)100(1−p)/p2 T−100/p d N(0,1)
解:
(1) TTT是100个独立几何分布Ge(p)Ge(p)Ge(p)的和
E(T)=100pE(T)=\frac{100}{p}E(T)=p100 ,D(T)=100(1−p)p2D(T)=\frac{100(1-p)}{p^2}D(T)=p2100(1−p)
(2) 当p=0.6p=0.6p=0.6,E(T)=5003≈166.67E(T)=\frac{500}{3}≈166.67E(T)=3500 ≈166.67,D(T)=4009≈44.442D(T)=\frac{400}{9}≈44.44^2D(T)=9400 ≈44.442
P(T>120)=P(Z>120−166.6744.44)=P(Z>−1.05)=Φ(1.05)≈0.8531P(T>120)=P\left(Z>\frac{120-166.67}{44.44}\right)=P(Z>-1.05)=\Phi(1.05)≈0.8531P(T>120)=P(Z>44.44120−166.67 )=P(Z>−1.05)=Φ(1.05)≈0.8531
(3) 由独立同分布的中心极限定理,T=∑i=1100YiT=\sum_{i=1}^{100}Y_iT=∑i=1100 Yi ,其中YiY_iYi ~Ge(p)Ge(p)Ge(p)
E(Yi)=1/pE(Y_i)=1/pE(Yi )=1/p,D(Yi)=(1−p)/p2D(Y_i)=(1-p)/p^2D(Yi )=(1−p)/p2
故T−100/p100(1−p)/p2→dN(0,1)\frac{T-100/p}{\sqrt{100(1-p)/p^2}} \xrightarrow{d} N(0,1)100(1−p)/p2 T−100/p d N(0,1)
------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
备考建议
1. 三大支柱:条件概率、分布函数、数字特征
2. 两条主线:离散与连续的对应关系
3. 一个核心:正态分布与中心极限定理
4. 常见陷阱:独立与相关、条件概率与交事件、有放回与无放回
创作不易,投入巨大,版权所有,盗版必究 创作不易,投入巨大,版权所有,盗版必究 创作不易,投入巨大,版权所有,盗版必究