跳到主要内容

概念

随机试验

  • 特性

    • 可重复性:可在相同条件下重复进行
    • 可观察性:可能结果不止一个,并且能事先知道所有可能结果
    • 不确定性:结果无法事先预知
  • 符号:EE

样本空间

  • 定义:样本点的集合,记作 SS

  • 情况:有限个,可列个(可以排列成一个数列),不可列

随机事件

  • 定义:试验 EE 的样本空间 SS 的子集称为 EE 的随机事件,简称事件
  • 若一次事件的结果出现在某一随机事件中,则称该事件发生了
  • 特殊事件
    • 基本事件:由一个样本点组成的单点集
    • 必然事件:样本空间 SS 本身
    • 不可能事件:空集 \emptyset

事件运算

运算符

  • 包含:ABA\subset B A 的发生必然导致 B 的发生
  • 相等:A=BA=B
  • 和事件:ABA\cup B A 和 B 至少有一个发生
  • 积事件:ABA\cap BABAB A 和 B 同时发生
  • 差事件:ABA-B A 发生而 B 不发生
  • 不相容事件:AB=AB=\emptyset A 和 B 不能同时发生
  • 逆事件(对立事件):A=B\overline{A}=BB=A\overline{B}=A 满足条件 AB=S,AB=A\cup B=S,AB=\emptyset

推广

  • i=1nAi\bigcup\limits_{i=1}^{n} A_i n 个事件至少有一个发生
  • i=1Ai\bigcup\limits_{i=1}^{\infty} A_i 无穷个事件至少有一个发生
  • i=1nAi\bigcap\limits_{i=1}^{n} A_i n 个事件同时发生
  • i=1Ai\bigcap\limits_{i=1}^{\infty} A_i 无穷个事件同时发生

定律

  • 交换律、结合律、分配律
  • 德摩根定律(对偶律):AB=ABi=1nAi=A1A2Ani=1nAi=A1A2An\overline{A \cup B}=\overline{A}\cap \overline{B}\\ \overline{\bigcup\limits_{i=1}^{n} A_i}=\overline{A_1}\cap \overline{A_2}\ldots\cap \overline{A_n} \\ \overline{\bigcap\limits_{i=1}^{n} A_i}=\overline{A_1}\cup \overline{A_2}\ldots\cup \overline{A_n}
  • ==AB=AAB=ABA-B=A-AB=A\overline B==

频率

  • 定义
    • 频数:n 次实验中事件 A 发生的次数,记为 nAn_A
    • 频率:比值 nA/nn_A / n,记为 Rn(A)R_{n}(A)
  • 性质
    • 0Rn(A)10\leq R_{n}(A) \leq 1
    • Rn(S)=1R_{n}(S)=1
    • 对于互不相容的事件,Rn(A1A2Ak)=Rn(A1)+Rn(A2)++Rn(Ak)R_n(A_1\cup A_2\cup\ldots\cup A_k)=R_n(A_1)+R_n(A_2)+\ldots+R_n(A_k)

概率

定义

有随机试验EE,它的样本空间SS。对于EE的每一个事件AA赋予一个实数(集合函数),记为P(A)P(A),称之为概率

满足条件

  1. 非负性:对于每个事件AA,有P(A)0P(A)\geq 0
  2. 完备性:对于必然事件,有P(S)=1P(S)= 1
  3. 可列可加性

性质

  1. P()=0P(\empty)=0
  2. P(A)1P(A)\leq 1
  3. P(A)=1P(A)P(\overline A)=1-P(A)
  4. ==P(AB)=P(A)P(AB)P(A-B)=P(A)-P(AB)==
  5. BAB \subset A,有P(AB)=P(A)P(B)P(A-B)=P(A)-P(B)
  6. (有限可加性)对于互不相容的事件,P(A1A2An)=i1nP(Ai)P(A_1\cup A_2\cup\ldots\cup A_n)=\sum\limits_{i-1}^{n}P(A_i)
  7. ==(加法公式P(AB)=P(A)+P(B)P(AB)P(A\cup B)=P(A)+P(B)-P(AB)==
  8. ==P(A)=0A=P(A)=0\nRightarrow A=\empty==

概型

古典概型

  • 定义:样本点有限;每一个基本事件发生的概率等可能

  • 概率计算公式

    P(A)=事件A中所含的样本点数样本空间S中所含样本点数P(A)=\frac{事件 A 中所含的样本点数}{样本空间 S 中所含样本点数}
    • 100 个产品中有 4 个次品,从中抽 12 个,求恰好有 2 个次品的概率
    C42C9610C10012\frac{C_4^2C_{96}^{10}}{C_{100}^{12}}
    • 袋中 a 白球 b 红球,k 人作无放回抽取,求第 i 个人取到 白球的概率
aAa+b1k1Aa+bk=aa+b \frac{a\cdot A_{a+b-1}^{k-1}}{A_{a+b}^k}=\frac{a}{a+b}

几何概型

  • 定义:样本空间为一个区间、平面区域、或空间立体的等可能随机试验的概率模型
  • 概率计算公式(μ\mu表示区间、平面区域或空间立体的长度、面积或体积)
p(A)=μ(A)μ(B)p(A)=\frac{\mu(A)}{\mu(B)}
    • 甲乙相约 7-8 点见面,先到者最多等 20 分钟,过时离开,求两者会面概率
S={(x,y)0x60,0y60}A={(x,y)(x,y)S,xy20}画图,求面积比S=\{(x,y)\mid0\le x\le 60,0\le y\le 60\} \\ A=\{(x,y)\mid(x,y)\in S,|x-y|\le 20\} \\ 画图,求面积比

条件概率

事件 A 已发生的条件下,B 发生的概率,记作P(BA)P(B| A)

==公式:P(BA)=P(AB)P(A)P(B | A)=\cfrac{P(AB)}{P(A)}==

划分的概念

满足:

​ 1. A1,A2,,AnA_1, A_2,\ldots,A_n互不相容

​ 2. A1A2An=SA_1\cup A_2\cup\ldots\cup A_n=S

定律

  • (加法公式)P(B1B2A)=P(B1A)+P(B2A)P(B1B2A)P(B_1\cup B_2|A)=P(B_1|A)+P(B_2|A)-P(B_1 B_2|A)

  • ==(乘法公式)P(AB)=P(BA)P(A)P(AB)=P(B|A)P(A)==

    ​ 推广:P(A1A2An)=P(A1)P(A2A1)P(A3A2A1)P(AnAn1A2A1)P(A_1 A_2 \ldots A_n)=P(A_1)P(A_2|A_1)P(A_3|A_2 A_1)\ldots P(A_n|A_{n-1}\ldots A_2 A_1)

  • ==(全概率公式)==若A1,A2,,AnA_1, A_2,\ldots,A_n是样本空间SS的划分,BB为任意一个事件

P(B)=i=1nP(BAi)P(Ai)P(B)=\sum\limits_{i=1}^{n}P(B|A_i)P(A_i)
  • ==(贝叶斯公式)==
P(AiB)=P(BAi)P(Ai)k=1nP(BAk)P(Ak)P(A_i|B)=\frac{P(B|A_i)P(A_i)}{\sum\limits_{k=1}^{n}P(B|A_k)P(A_k)}
  • n=2n=2,将A1A_1记为AA,此时A2A_2就是A\overline A

​ (全概率公式)

P(B)=P(BA)P(A)+P(BA)P(A)P(B)=P(B|A)P(A)+P(B|\overline A)P(\overline A)

​ (贝叶斯公式)

P(AB)=P(BA)P(A)P(BA)P(A)+P(BA)P(A)P(A|B)=\cfrac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline A)P(\overline A)}

独立性

互不相容与独立没有必然联系

概念

P(BA)=P(B)P(B|A)=P(B),意味着AA的发生不影响BB的发生

P(AB)=P(A)P(B)P(AB)=P(A)P(B)

AABB两事件独立

定理

  • P(B)>0P(B)>0,若A,BA, B独立,则P(AB)=P(AB)=P(A)P(A|B)=P(A|\overline B)=P(A)
  • A,BA, B独立,则AAB\overline BA\overline ABBA\overline AB\overline B也独立

推广

A1,A2,,AnA_1, A_2,\ldots,A_n,如果对于其中任意 2 个,3 个,...,n 个事件的积事件的概率都等于各事件概率之积,则A1,A2,,AnA_1, A_2,\ldots,A_n相互独立

n 重贝努利试验

若在随机试验EE中,只关注随机试验AAA\overline A的发生,则称EE为一个贝努利试验,独立地重复 n 次即为 n 重贝努利试验

P(A)=pP(A)=p,则事件AA出现了kk次的概率为

P=Cnkpk(1p)nkP=C_{n}^{k}\cdot p^k(1-p)^{n-k}

贝叶斯详述

P(HE)=P(H)P(EH)P(E)P(H|E)=\frac{P(H)P(E|H)}{P(E)}

H:Hypothesis,假设

E:Evidence,证据

比例角度

  • 分母:符合特征的概率
  • 分子:符合特征同时又符合假设的概率,通常是——符合假设的概率 × 符合假设之中符合特征的概率

新增的信息对假设类别与非假设类别产生的影响不同

若影响相同,则引入的证据是无关特征

我们容易根据似然概率得出看法,天然的将P(HE)P(H|E)P(EH)P(E|H)视作相同,其实是没有考虑到先验概率带来的影响

假设应该建立在先验概率上,不过先验概率基于个人的经验,必然存在偏差

P(H)P(H):先验概率

P(HE)P(H|E):Posterior,后验概率,将证据考虑之后的概率

P(EH)P(E|H):Likelihoods,似然概率,在假设成立的情况下,符合证据特征的概率;伴随新增信息带来的可能性

P(E)P(E):The total probability of seeing the evidence,通常用全概率公式展开