跳到主要内容

多维随机变量及其分布

二维随机变量

定义

EE是一个随机试验,它的样本空间为SS,设X=X(e),Y=Y(e)X=X(e), Y=Y(e)是定义在SS上的两个随机变量,由它们构成的向量(X,Y)(X,Y),叫做二维随机变量(也称随机矢量)

image-20201214100621431

分布函数及其性质

(X,Y)(X,Y)是一个二维随机变量,对任意的实数x,yx,y,定义

F(x,y)=P({Xx}{Yy})P{Xx,Yy}F(x,y)=P(\{X\le x\}\cap \{Y\le y\})\triangleq P\{X\le x,Y\le y\}

则称F(x,y)F(x,y)为二维随机变量(X,Y)(X,Y)的分布函数。

  • 性质
    • F(x,y)F(x,y)是关于变量 x 和 y 的不减函数
    • 0F(x,y)10\le F(x,y)\le 1
    • F(,y)=limxF(x,y)=0,F(x,)=limyF(x,y)=0F(,)=limx,yF(x,y)=0F(+,+)=limx,y+F(x,y)=1F(-\infty,y)=\lim\limits_{x\rightarrow-\infty}F(x,y)=0,\quad F(x,-\infty)=\lim\limits_{y\rightarrow-\infty}F(x,y)=0\\ F(-\infty,-\infty)=\lim\limits_{x,y\rightarrow-\infty}F(x,y)=0\\ F(+\infty,+\infty)=\lim\limits_{x,y\rightarrow+\infty}F(x,y)=1
    • F(x,y)F(x,y)既关于 x 右连续(F(x+0,y)=F(x,y)F(x+0,y)=F(x,y)),也关于 y 右连续(F(x,y+0)=F(x,y)F(x,y+0)=F(x,y)

二维离散型随机变量及其分布

若二维随机变量(X,Y)(X,Y)只有有限或可列个取值对,则称X,YX,Y为一个二维离散型随机变量

若随机矢量(X,Y)(X,Y)所有可能取值对为(xi,yi),(i=1,2,,j=1,2,)(x_i,y_i),(i=1,2,\ldots,j=1,2,\ldots)

则称

P({X=xi}{Y=yi}){X=xi,Y=yi}=Pi,j(i=1,2,,j=1,2,)P(\{X=x_i\}\cap\{Y=y_i\})\triangleq \{X=x_i,Y=y_i\}=P_{i,j} \\(i=1,2,\ldots,j=1,2,\ldots)

(X,Y)(X,Y)分布律或称联合分布律

联合分布律可以更直观地用以下表格的形式来描述

image-20201214102644386

其中pi,j(i=1,2,,j=1,2,)p_{i,j}(i=1,2,\ldots,j=1,2,\ldots)要满足以下条件

  • pi,j0p_{i,j}\ge 0
  • i=1j=1pi,j=1\sum\limits_{i=1}^\infty\sum\limits_{j=1}^\infty p_{i,j}=1
image-20201214102957256

二维连续型随机变量及其概率密度

二维连续型随机变量的定义

(X,Y)(X,Y)为二维随机变量,F(x,y)F(x,y)为其分布函数,若存在一个非负二元

函数f(x,y)f(x,y),使得对任意x,yx,y

F(x,y)=xyf(s,t)dsdtF(x,y)=\int_{-\infty}^x\int_{-\infty}^y f(s,t)dsdt

则称(X,Y)(X,Y)为二维连续型随机变量,并称f(x,y)f(x,y)(X,Y)(X,Y)的概率密度,

或称为XXYY联合概率密度

二维概率密度的性质

  • f(x,y)0f(x,y)\ge 0
  • ++f(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x,y)dxdy=1
  • P{(X,Y)D}=Df(x,y)dxdyP\{(X,Y)\in D\}=\iint\limits_D f(x,y)dxdy(其中的DD为一个平面区域)
  • f(x,y)=2F(x,y)xyf(x,y)=\cfrac{\partial ^2 F(x,y)}{\partial x\partial y}

两个常见的二维连续型随机变量

二维均匀分布

(X,Y)(X,Y)的概率密度为

f(x,y)={ 1A(x,y)G 0其他其中G为平面上的一个有界区域,A为其面积(即S(G)f(x,y)=\begin{cases} \ \cfrac{1}{A}\qquad (x,y)\in G \\ \ 0\qquad \quad 其他 \end{cases}\quad \\其中 G 为平面上的一个有界区域,A 为其面积(即 S(G))
二维正态分布

(X,Y)(X,Y)的概率密度为

f(x,y)=12π1ρ2σ1σ2exp12(1ρ2)[(xμ1σ1)22ρ(xμ1σ1)(yμ2σ2)+(yμ2σ2)2]f(x,y)=\cfrac{1}{2\pi \sqrt{1-\rho^2}\sigma_1\sigma_2}exp{\cfrac{-1}{2(1-\rho^2)}\left[ \bigg(\cfrac{x-\mu_1}{\sigma_1}\bigg)^2-2\rho \bigg(\cfrac{x-\mu_1}{\sigma_1}\bigg)\cdot \bigg(\cfrac{y-\mu_2}{\sigma_2}\bigg)+\bigg(\cfrac{y-\mu_2}{\sigma_2}\bigg)^2 \right]}

​ 记作(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)

image-20201214105818882

image-20201214105854999 image-20201214105910259

边缘分布

(Marginal Distribution)

概念

对于二维随机变量 w(X,Y)(X,Y),其分布函数为 F(x,y)F(x,y),它的每个分量 XXYY 都是一维随机变量,它们各自的分布函数分别为 FX(x)F_X(x)FY(y)F_Y(y),通常把它们称为 (X,Y)(X,Y) 关于 XXYY边缘分布函数

接下来我们考察一下联合分布函数F(x,y)F(x,y)与边缘分布函数FX(x)F_X(x)FY(y)F_Y(y)的关系:

FX(x)=P{Xx}=P{Xx,Y<+}=F(x,+)FY(y)=P{Yy}=P{X<+,Yy}=F(+,y)F_X(x)=P\{X\le x\}=P\{X\le x,Y<+\infty\}=F(x,+\infty)\\F_Y(y)=P\{Y\le y\}=P\{X< +\infty,Y\le y\}=F(+\infty,y) image-20201214111426897

二维离散型随机变量的边缘分布律

FX(x)=F(x,+)=xixj=1+pi,jF_X(x)=F(x,+\infty)=\sum\limits_{x_i\le x}\sum\limits_{j=1}^{+\infty}p_{i,j}

(注意:对一维随机变量XXFX(x)=xixpiF_X(x)=\sum\limits_{x_i\le x}p_i

所以关于XX的边缘分布律为

P{X=xi}=j=1pi,jpi(i=1,2,)P\{X=x_i\}=\sum\limits_{j=1}^\infty p_{i,j}\triangleq p_{i\cdot} \qquad(i=1,2,\ldots)

类似地,关于YY的边缘分布律为

P{Y=yi}=i=1pi,jpj(j=1,2,)P\{Y=y_i\}=\sum\limits_{i=1}^\infty p_{i,j}\triangleq p_{j\cdot} \qquad(j=1,2,\ldots)

二维连续型随机变量的边缘概率密度

image-20210214110419298

设二维连续型随机变量(X,Y)(X,Y)的联合概率密度为f(x,y)f(x,y),则

FX(x)=F(x,+)=x[+f(s,t)dt]ds对一维连续型随机变量XFX(x)=xfX(t)dtF_X(x)=F(x,+\infty)=\int_{-\infty}^x\left[ \int_{-\infty}^{+\infty}f(s,t)dt \right]ds \\ 对一维连续型随机变量 X,F_X(x)=\int_{-\infty}^{x}f_X(t)dt

所以,==关于XX的边缘概率密度==为

fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy

同样地,==关于 YY 的边缘概率密度==为

fY(y)=+f(x,y)dxf_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx

22

image-20210214111551126

条件分布

(Conditional Distribution)

二维离散型随机变量的条件分布律

(X,Y)(X,Y)是二维离散型随机变量,其分布律为

P{X=xi,Y=yi}=pi,ji,j=1,2,P\{X=x_i,Y=y_i\}=p_{i,j}\qquad i,j=1,2,\ldots

的概率,即求事件

{X=xiY=yi}i=1,2,\{X=x_i|Y=y_i\}\qquad i=1,2,\ldots

的概率。由条件概率公式可得

P{X=xiY=yi}=P{X=xi,Y=yi}P{Y=yi}=pi,ji=1pi,ji=1,2,P\{X=x_i|Y=y_i\}=\cfrac{P\{X=x_i,Y=y_i\}}{P\{Y=y_i\}}=\cfrac{p_{i,j}}{\sum\limits_{i=1}^{\infty}p_{i,j}}\qquad i=1,2,\ldots

其为在Y=yiY=y_i的条件下随机变量XX的==条件分布律==

类似地,称

P{Y=yiX=xi}=P{X=xi,Y=yi}P{X=xi}=pi,jj=1pi,jj=1,2,P\{Y=y_i|X=x_i\}=\cfrac{P\{X=x_i,Y=y_i\}}{P\{X=x_i\}}=\cfrac{p_{i,j}}{\sum\limits_{j=1}^{\infty}p_{i,j}}\qquad j=1,2,\ldots

为在X=xiX=x_i的条件下随机变量YY条件分布律

二维连续型随机变量的条件概率密度

考的不多

联合密度比边缘密度

fXY(xy)=f(x,y)fY(y)f_{X|Y}(x|y)=\cfrac{f(x,y)}{f_Y(y)}

为在Y=yY=y条件下XX的==条件概率密度==,记为fXY(xy)f_{X|Y}(x|y)

同时称

FXY(xy)=xf(s,y)fY(y)ds=xfXY(xy)dxF_{X|Y}(x|y)=\int_{-\infty}^x\cfrac{f(s,y)}{f_Y(y)}ds=\int_{-\infty}^xf_{X|Y}(x|y)dx

为在Y=yY=y条件下XX的==条件分布函数==,记为FXY(xy)F_{X|Y}(x|y)P{XxY=y}P\{X\le x|Y=y\}

类似地,定义

fYX(yx)=f(x,y)fY(x)FYX(yx)=yf(x,t)fX(x)dtf_{Y|X}(y|x)=\cfrac{f(x,y)}{f_Y(x)}\\ F_{Y|X}(y|x)=\int_{-\infty}^y\cfrac{f(x,t)}{f_X(x)}dt

QQ图片20201216102601 image-20201216102953130

随机变量的独立性

二个随机变量独立性的概念

联合密度 = 边缘密度相乘

边缘密度 = 条件密度

F(x,y),FX(x),FY(y)F(x,y),F_X(x),F_Y(y)分别为二维随机变量(X,Y)(X,Y)的联合分布函数和边缘分布函数,若对任意的x,yx,y,都有

F(x,y)=FX(x)FY(y)P{Xx,Yy}=P{Xx}P{Yy}F(x,y)=F_X(x)F_Y(y) \quad 即\\ P\{X\le x,Y\le y\}=P\{X\le x\}P\{Y\le y\}

==独立的条件==

  • 离散型:P{X=xi,Y=yj}=P{X=xi}P{Y=yj}P\{X= x_i,Y= y_j\}=P\{X= x_i\}P\{Y= y_j\} 对任意 i, j 成立
  • 连续型:f(x,y)=fX(x)fY(y)f(x,y)=f_X(x)f_Y(y)

image-20201218102602473

对于连续型随机变量(X,Y)(X,Y),若XXYY相互独立,当且仅当

fX(x)=fXY(xy) 或 fY(y)=fYX(yx)f_X(x)=f_{X|Y}(x|y) \ 或 \ f_Y(y)=f_{Y|X}(y|x)

(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho),则

fX(x)=12πσ1e(xμ1)22σ12,fX(x)=12πσ2e(xμ2)22σ22f_X(x)=\cfrac{1}{\sqrt{2\pi}\sigma_1}e^{-\cfrac{(x-\mu_1)^2}{2\sigma_1^2}},\quad f_X(x)=\cfrac{1}{\sqrt{2\pi}\sigma_2}e^{-\cfrac{(x-\mu_2)^2}{2\sigma_2^2}}

对于二维正态随机变量(X,Y)(X,Y),相互独立的充要条件为 ρ=0\rho=0

多维随机变量的独立性

nn维随机变量(X1,X2,,Xn)(X_1,X_2,\ldots ,X_n)的分布函数定义为

F(x1,x2,,xn)=P{X1x1,X2x2,,Xnxn}F(x_1,x_2,\ldots,x_n)=P\{X_1\le x_1,X_2\le x_2,\ldots,X_n\le x_n\}

若对于所有x1,x2,,xnx_1,x_2,\ldots,x_n,有

F(x1,x2,,xn)=FX1(x1)FX2(x2)FXn(xn)F(x_1,x_2,\ldots,x_n)=F_{X_1}(x_1)F_{X_2}(x_2)\ldots F_{X_n}(x_n)

则称X1,X2,,XnX_1,X_2,\ldots ,X_n是相互独立的

两个随机变量的函数的分布

二维连续型随机变量的函数的分布

一般的二维连续型随机变量的函数的分布

(X,Y)(X,Y)是二维随机变量,其概率密度为f(x,y)f(x,y)Z=g(X,Y)Z=g(X,Y)是一个二维随机变量的函数,==则==

FZ(z)=P{Zz}=P{g(X,Y)z}=Dzf(x,y)dxdy其中Dz={(x,y)g(x,y)z}F_Z(z)=P\{Z\le z\}=P\{g(X,Y)\le z\}=\iint\limits_{D_z} f(x,y)dxdy \\ 其中 D_z=\{(x,y)|g(x,y)\le z\}

image-20201216110202103

Z=X+YZ=X+Y的分布

(X,Y)(X,Y)是二维随机变量,其概率密度为f(x,y)f(x,y),则Z=X+YZ=X+Y的分布函数为

FZ(z)=z[+f(uy,y)dy]duF_Z(z)=\int_{-\infty}^z[\int_{-\infty}^{+\infty}f(u-y,y)dy]du

其概率密度为

fX+Y(z)=+f(zy,y)dy=+f(x,zx)dxf_{X+Y}(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy=\int_{-\infty}^{+\infty}f(x,z-x)dx

QQ图片20201216110537

Z=YX,Z=XYZ=\cfrac{Y}{X},Z=XY的分布

(X,Y)(X,Y)是二维随机变量,其概率密度为f(x,y)f(x,y),则Z=YXZ=\cfrac{Y}{X}的分布函数为

fYX(z)=+xf(x,xz)dxf_{\frac{Y}{X}}(z)=\int_{-\infty}^{+\infty}|x|f(x,xz)dx

也可以求得Z=XYZ=XY的概率密度为

fXY(z)=+1xf(x,zx)dxf_{XY}(z)=\int_{-\infty}^{+\infty}\cfrac{1}{|x|}f(x,\cfrac{z}{x})dx

M=max{X,Y},N=min{X,Y}M=max\{X,Y\},N=min\{X,Y\} 的分布

(X,Y)(X,Y) 是二维随机变量,其概率密度为 f(x,y)f(x,y),则 M=max{X,Y}M=max\{X,Y\} 的分布函数为

Fmax(z)=FX(z)FY(z)F_{max}(z)=F_X(z)F_Y(z)

N=min{X,Y}N=min\{X,Y\} 的分布函数为

Fmin(z)=1[1FX(z)][1FY(z)]F_{min}(z)=1-[1-F_X(z)][1-F_Y(z)]
  • 扩展

    Xi(i=1,2,,n)X_i(i=1,2,\ldots,n)nn个相互独立的随机变量,它们的分布函数为Fxi(x)F_{x_i}(x),则M=max{X1,X2,,Xn}M=max\{X_1,X_2,\ldots,X_n\}N=min{X1,X2,,Xn}N=min\{X_1,X_2,\ldots,X_n\}的分布函数分别为

Fmax(z)=Fx1(z)Fx2(z)Fxn(z)Fmin(z)=1[1Fx1(z)][1Fx2(z)][1Fxn(z)] F_{max}(z)=F_{x_1}(z)F_{x_2}(z)\ldots F_{x_n}(z) \\ \qquad \\ F_{min}(z)=1-[1-F_{x_1}(z)][1-F_{x_2}(z)]\ldots [1-F_{x_n}(z)]

QQ图片20201216112249

二维离散型随机变量的函数的分布

  • 注意:若XXYY相互独立
    • XN(μ1,σ12),YN(μ2,σ22)X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2),则X+YN(μ1+μ2,σ12+σ22)X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2)
    • Xe(α),Ye(β)X\sim e(\alpha),Y\sim e(\beta),则min(X,Y)e(α+β)min(X,Y)\sim e(\alpha+\beta)
    • XB(n1,p),YB(n2,p)X\sim B(n_1,p),Y\sim B(n_2,p),则Z=X+YB(n1+n2,p)Z=X+Y\sim B(n_1+n_2,p)
    • Xπ(λ1),Yπ(λ2)X\sim \pi(\lambda_1),Y\sim \pi(\lambda_2),则Z=X+Yπ(λ1+λ2)Z=X+Y\sim \pi(\lambda_1+\lambda_2)