跳到主要内容

随机变量的数字特征

定义:这些用来描述随机变量统 计特征的数字,称为随机变量的数字特征

​ 最常用的数字特征有:数学 期望(均值)、方差、相关系数和矩。

数学期望 E(x)

(Expectation)

定义

设离散型随机变量XX的分布律为P{X=xk}=pk,(k=1,2,)P\{X=x_k\}=p_k,\quad (k=1,2,\ldots),若级数k=1xkpk\sum\limits_{k=1}^\infty x_kp_k绝对收敛,则称级数k=1xkpk\sum\limits_{k=1}^\infty x_kp_k的和为XX数学期望(均值),记为E(X)E(X)

设连续型随机变量XX的概率密度为f(x)f(x),若积分+xf(x)dx\int_{-\infty}^{+\infty}xf(x)dx绝对收敛,则称级数+xf(x)dx\int_{-\infty}^{+\infty}xf(x)dx的和为XX数学期望(==均值==),记为E(X)E(X)

image-20201218101413419

性质

  • E(C)=CE(C)=C
  • E(CX)=CE(X)E(CX)=CE(X)
  • E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)
  • XXYY相互独立,则E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)

六个常见随机变量的数学期望

(0-1)分布

E(X)=pE(X)=p

二项分布 B(n,p)B(n,p)

E(X)=npE(X)=np

泊松分布 π(λ)\pi(\lambda)

E(X)=λE(X)=\lambda

均匀分布 U(a,b)U(a,b)

E(X)=a+b2E(X)=\cfrac{a+b}{2}

指数分布 e(λ)e(\lambda)

E(X)=1λE(X)=\cfrac{1}{\lambda}

正态分布 N(μ,σ2)N(\mu,\sigma^2)

E(X)=μE(X)=\mu

随机变量的函数的数学期望

  • XX为离散型的,Y=g(X)Y=g(X)的均值

    XX的分布律为P{X=xi}=pi(i=1,2,)P\{X=x_i\}=p_i\quad (i=1,2,\ldots),则

    E(Y)=i=1g(xi)piE(Y)=\sum\limits_{i=1}^\infty g(x_i)p_i
  • (X,Y)(X,Y)为离散型的,Z=g(X,Y)Z=g(X,Y)的均值

    (X,Y)(X,Y)的分布律为P{X=xi,Y=yi}=pi,j(i,j=1,2,)P\{X=x_i,Y=y_i\}=p_{i,j}\quad (i,j=1,2,\ldots),则

    E(Z)=i,jg(xi,yi)pi,jE(Z)=\sum\limits_{i,j}g(x_i,y_i)p_{i,j}
  • XX为连续型的,Y=g(X)Y=g(X)的均值

    XX的概率密度为fX(x)f_X(x),则

    E(Y)=+g(x)fX(x)dxE(Y)=\int_{-\infty}^{+\infty}g(x)f_X(x)dx
  • (X,Y)(X,Y)为连续型的,Z=g(X,Y)Z=g(X,Y)的均值

    (X,Y)(X,Y)的概率密度为f(x,y)f(x,y),则

    E(Z)=++g(x,y)f(x,y)dxdyE(Z)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy

image-20201218105951288 image-20201218110057750 image-20201218110111093

方差 D(X)

(Variance)

定义

XX是一个对随机变量,若E{[XE(X)]2}E\{[X-E(X)]^2\}存在,则称其为XX方差,记为D(X)D(X)Var(X)Var(X)

D(X)\sqrt{D(X)}标准差均方差,记为σ(X)\sigma(X)

  • 认识

    标准差、方差越大,离散程度越大,若XX的取值比较集中,则方差D(X)D(X)较小,若XX的取值比较分散,则方差D(X)D(X)较大。因此,D(X)D(X)是刻画XX取值分散程度的一个量,它是衡量取值分散程度的一个尺度

  • ==公式==

D(X)=E(X2)[E(X)]2D(X)=E(X^2)-[E(X)]^2

性质

  • D(C)=0D(C)=0

  • D(CX)=C2D(X)D(CX)=C^2D(X)

  • D(X+Y)=D(X)+D(Y)+2E{[XE(X)][YE(Y)]}D(X+Y)=D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\}

    XXYY相互独立,则有D(X+Y)=D(X)+D(Y)D(X+Y)=D(X)+D(Y),又有D(XY)=D(X)+D(Y)D(X-Y)=D(X)+D(Y)

常见随机变量的方差

(0-1)分布

D(X)=p(1p)D(X)=p(1-p)

二项分布 B(n,p)B(n,p)

D(X)=np(1p)D(X)=np(1-p)

泊松分布 π(λ)\pi(\lambda)

D(X)=λD(X)=\lambda

均匀分布 U(a,b)U(a,b)

D(X)=(ba)212D(X)=\cfrac{(b-a)^2}{12}

指数分布 e(λ)e(\lambda)

D(X)=1λ2D(X)=\cfrac{1}{\lambda^2}

正态分布 N(μ,σ2)N(\mu,\sigma^2)

D(X)=σ2D(X)=\sigma^2

==随机变量参考总结==

分布名称分布律或概率密度数学期望方差
(0-1)分布P{X=k}=pk(1p)1kP\{X=k\}=p^k(1-p)^{1-k}ppp(1p)p(1-p)
二项分布 B(n,p)B(n,p)P{X=k}=Cnkpk(1p)nkP\{X=k\}=C_n^kp^k(1-p)^{n-k}npnpnp(1p)np(1-p)
泊松分布 π(λ)\pi(\lambda)P{X=k}=eλλkk!P\{X=k\}=e^{-\lambda}\cfrac{\lambda^k}{k!}λ\lambdaλ\lambda
均匀分布 U(a,b)U(a,b)f(x)={ 1baa<x<b 0其他f(x)=\begin{cases}\ \cfrac{1}{b-a}\qquad a<x<b\\ \ 0\qquad\qquad 其他\end{cases}a+b2\cfrac{a+b}{2}(ba)212\cfrac{(b-a)^2}{12}
指数分布 e(λ)e(\lambda)f(x)={ λeλxx0 0其他f(x)=\begin{cases}\ \lambda e^{-\lambda x}\qquad x\ge 0\\ \ 0\qquad\qquad 其他\end{cases}1λ\cfrac{1}{\lambda}1λ2\cfrac{1}{\lambda^2}
正态分布 N(μ,σ2)N(\mu,\sigma^2)f(x)=12πσe(xμ)22σ2f(x)=\cfrac{1}{\sqrt{2\pi}\sigma}e^{-\cfrac{(x-\mu)^2}{2\sigma^2}}μ\muσ2\sigma^2

image-20201218113426305

协方差

定义

(X,Y)(X,Y)为二维随机变量,若E{[XE(X)][YE(Y)]}E\{[X-E(X)][Y-E(Y)]\}存在,则称其为XXYY协方差,记为Cov(X,Y)Cov(X,Y)

  • ==公式==
Cov(X,Y)=E(XY)E(X)E(Y)Cov(X,Y)=E(XY)-E(X)E(Y)

性质

  • Cov(X,X)=D(X)Cov(X,X)=D(X)
  • Cov(X,Y)=Cov(Y,X)Cov(X,Y)=Cov(Y,X)
  • Cov(aX,bY)=abCov(X,Y)Cov(aX,bY)=abCov(X,Y)
  • Cov(C,X)=0Cov(C,X)=0
  • Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)
  • XXYY相互独立时,Cov(X,Y)=0Cov(X,Y)=0
  • D(aX+bY)=a2D(X)+b2D(Y)+2abCov(X,Y)D(aX+bY)=a^2D(X)+b^2D(Y)+2abCov(X,Y)

相关系数

定义

(X,Y)(X,Y)为二维随机变量,D(X)>0,D(Y)>0D(X)>0,D(Y)>0,称

Cov(X,Y)D(X)D(Y)\cfrac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}

XXYY相关系数,记为ρXY\rho_{XY}。其值为 0 时,XXYY不相关

性质

  • ρXY1|\rho_{XY}|\le 1

  • XXYY相互独立时,ρXY=0\rho_{XY}=0XXYY不相关

  • D(X)>0,D(Y)>0,ρXY=1存在常数a,b,使得P{Y=aX+b}=1D(X)>0,D(Y)>0,|\rho_{XY}|=1\Leftrightarrow 存在常数 a,b,使得 P\{Y=aX+b\}=1

    而且当a>0a>0时,ρXY=1\rho_{XY}=1,当a<0a<0时,ρXY=1\rho_{XY}=-1

==相关系数刻画了随机变量XXYY之间”线性相关“的程度==

image-20201221110802057
  • X=XE(X)DXX^*=\cfrac{X-E(X)}{\sqrt{D{X}}}是对随机变量XX的标准化,有
ρXY=Cov(X,Y)\rho_{XY}=Cov(X^*,Y^*)
  • 对于二维正态分布来说,不相关\Leftrightarrow独立

image-20201228112938854 image-20201228112956332

不相关与独立

独立:没有任何关系

不相关:没有线性关系

独立不相关不相关独立独立 \Rightarrow 不相关 \\ 不相关 \nRightarrow 独立

二维随机变量中,两者等价

定义

X,YX,Y是随机变量

  • E(Xk),k=1,2,E(X^k),k=1,2,\ldots存在,称它为XXkk阶原点矩,简称**kk阶矩**
  • E{[XE(X)]k},k=2,3,E\{[X-E(X)]^k\},k=2,3,\ldots存在,称它为XX的**kk阶中心矩**
  • E(XkYl),k,l=1,2,E(X^kY^l),k,l=1,2,\ldots存在,称它为XXYY的**k+lk+l阶混合矩**
  • E{[XE(X)]k[YE(Y)]l},k,l=2,3,E\{[X-E(X)]^k[Y-E(Y)]^l\},k,l=2,3,\ldots存在,称它为**XXYYk+lk+l阶混合中心矩**

数学期望为一阶原点矩,方差为二阶中心矩,协方差为二阶混合中心矩

协方差矩阵

nn维随机变量(X1,X2,,Xn)(X_1,X_2,\ldots,X_n)的二阶混合中心矩E{[XiE(Xi)][YjE(Yj)]}ci,j,(i,j=1,2,,n)E\{[X_i-E(X_i)][Y_j-E(Y_j)]\}\triangleq c_{i,j}, (i,j=1,2,\ldots,n)都存在,则称矩阵

(c11c12c1nc21c22cnncn1cn2cnn)\begin{pmatrix} c_{11}&c_{12}&\ldots&c_{1n} \\ c_{21}&c_{22}&\ldots&c_{nn}\\ \vdots&\vdots&\vdots&\vdots \\ c_{n1}&c_{n2}&\ldots&c_{nn} \end{pmatrix}

nn维随机变量(X1,X2,,Xn)(X_1,X_2,\ldots,X_n)协方差矩阵