序号为1到43,让人工智能数字随机抽取取,抽到43的概率是多少?

300多年前,“概率”一词在欧洲的赌场上萌芽;而现在,概率是一个经常在生活中可以看到的词语。天气预报中,有降水概率;买彩票时,需要知道中奖概率。使用“概率”一词时,我们是在描述一个事件的什么性质?这些概率是如何获得的?本章将会探讨关于概率的许多基本问题。4.1 什么是概率?夏栎有一枚一元硬币。现在她反复地掷硬币,并记录每一次朝上的是正面还是反面。随着掷硬币次数的增加,数据发生了微妙的变化:次数正面反面正面/总数10730.7000005028220.56000010055450.550000200951050.4750003001451550.4833334002061940.515000............从表可以看出,随着投掷次数的增加,正面次数占总数的比率虽然上下摆动,但是总体来说似乎向着 0.5 逐渐靠近。一般地,在一场试验中,事件 A 发生的试验次数与总试验次数的比值被称为事件 A 在本次试验中发生的频率。上面的试验结果似乎说明,正面朝上的频率在往 0.5 接近。这个 0.5 似乎是事件“硬币正面朝上”的某种特性,这个特性使得掷硬币次数很多时,正面朝上的频率接近于 0.5 。这引出了我们关于概率的最初定义。对于一个事件 A ,它的频率在试验次数增大时接近于某个常数,我们称这个常数为事件 A 的概率,称为 P(A) 。在小学和初中提及概率时,我们都是这样认识它的。然而,如果对定义进行深入思考,我们会得到一些疑问。(1)正面朝上的概率一定就是 0.5 吗?换言之,上面表中最后一列的数真的能确定就是趋于 0.5 ,而不是趋于 0.51 或者别的什么数,只是我们没有发现?如果有可能是这样,通过试验来求概率是否存在着一定的风险?(2)还有一个更严重的问题,我们假设某次试验的数据比较奇怪,如下:次数正面反面正面/总数10910.9000005010400.20000010011890.1100002001001000.5000003001011990.3366674001022980.255000............那么这究竟是说明我们“运气不太好”,还是说正面朝上的频率可能并没有规律?有人可能会用这样的方式来解释:上面的数据当然是有可能出现的,但是随着试验次数增加,这种“奇怪数据”出现的可能性越来越小。这当然没什么不对的。但是对于数学家而言,我们需要用频率来定义概率,而在对定义本身提出疑问时,却又要搬出“可能性”,即概率来解释,这样就陷入了逻辑的怪圈......数学是追求严密的学科,只是从实践中随意地找到一个概念并不能让数学家满意。上面的规律确实是正确的,但是我们目前还无法精密地描述它,也无法从中看到概率的全貌。下一节我们将用数学特有的方法来描述概率。在充分地学习了概率的知识(一部分需要在数学VI中学习)后,我们将描述被称为大数定律的概率论基石定理,并重新准确地描述“频率逼近概率”的重要思想方法。练习题4.11.生物学家需要研究某区域内梅花鹿的种群密度,他们捕捉了 20 只梅花鹿并在这些梅花鹿身上做了标记,然后放归。一段时间过后,生物学家再次捕捉了 100 只梅花鹿,发现其中有 2 只做了标记。(1)该区域抓到做标记的梅花鹿的概率推断为多少?(2)已知该区域面积为 200 平方千米,估计该区域梅花鹿的种群密度。种群密度等于区域内物种的个数除以区域面积。2.绿叶水果公司以 2 元/千克的成本价新进了 10 吨柑橘。在验货时,发现部分柑橘损坏。工作人员在所有柑橘中抽取一部分,记录损坏柑橘重量,并绘制表格如下。柑橘总质量m(千克)损坏柑橘质量n(千克)n/m505.500.11010010.500.10515015.150.10120019.420.09725024.350.09730030.320.10135035.320.10140039.240.09845044.570.09950051.540.103(1)完好柑橘实际的成本价应该是多少?(2)公司希望通过这一批柑橘获取 5 万元的毛利润。请问公司在出售完好柑橘时,每千克定价多少元比较合适?4.2
概率论公理概率是事件的一种属性,我们要从事件开始。而事件又是依附于什么的呢?我们需要引入样本空间的概念。考虑掷一个正方体骰子,可能出现的点数有 1,2,3,4,5,6 。令\Omega=\{1,2,3,4,5,6\} ,则集合 \Omega 表示可能出现的所有结果。一般地,一次试验中所有可能结果组成的集合被称为样本空间。再举一个例子,假设投掷两枚硬币,并用 1 表示正面朝上, 0 表示反面朝上,则样本空间可以写成\Omega=\{(1,1),(1,0),(0,1),(0,0)\} 。样本空间可以是有限集,也可以是无限集。一个事件是指样本空间的子集,一般用大写字母 A,B,C 等表示。为了具体地说明这一点,我们考虑掷骰子时得到偶数点数的事件,实际上它可以表示为A=\{2,4,6\} 。所谓事件 A 发生,无非就是在样本空间 \Omega 中取出一个元素 \omega ,满足 \omega\in A 。\Omega 本身也是一个事件,一般称为必然事件;空集 \varnothing 则被称为不可能事件。事件被定义为集合,它拥有与集合相同的关系和运算方式。这里我们只进行迅速的回顾,并介绍一些概率论特有的术语。对于两个事件 A,B ,如果 A\subseteq B ,称事件 A 包含于事件 B ,或事件 B 包含事件 A ,表示如果事件 A 发生,则事件 B 也发生;如果 A\subseteq B 且 B\subseteq A ,称事件 A,B 相等,记为 A=B 。对于两个事件 A,B ,事件 A\cup B 表示两个事件中至少有一个发生,称为 A,B 的并事件或和事件,也可以记为 A+B ;事件 A\cap B 表示两个事件都发生,称为 A,B 的交事件或积事件,也可以记为 AB 。举例:在掷骰子中,令 A 为点数为偶数的事件, B 为点数小于 4 的事件,则A=\{2,4,6\},B=\{1,2,3\},A\cup B=\{1,2,3,4,6\},A\cap B=\{2\} 。如果事件 A,B 满足 A\cap B=\varnothing ,则称 A,B 为互斥事件或不相容事件。这表示两个事件中至多只有一个发生。如果两个互斥事件 A,B 还满足 A\cup B=\Omega ,也就是说 B=\complement_\Omega A ,我们称 A,B 为对立事件,并重新记为 B=\bar A 。两个事件为对立事件意味着两个事件恰有一个发生。上面讲述的这些概念都可以用韦恩图表示,留作习题。接下来要进入我们的主题:概率。概率是定义在事件上的一个属性,对于每个事件 A ,都对应着一个概率 P(A) 。令 \mathscr F 为样本空间所有子集的集合,即事件组成的集合;那么概率就可以看成是一个映射 P:\mathscr F\to\mathbb R 。按照平时的常识,这个映射应该具有如下的性质:公理4.1
对任何事件 E
,有 P(E)\geq 0 。公理4.2 P(\Omega)=1 ,即必然事件概率为 1 。下面这个公理似乎没有上面两个直观,但是很快它就会证明自己是相当基本的。公理4.3(可加性)
设 E_1,\cdots, E_n 是一系列两两互斥的事件。则\displaystyle P\left(\bigcup_{k=1}^n E_k\right)=\sum_{k=1}^n P(E_k) 。这个公理在大学概率论中会被替换为一个更强的版本:允许事件的个数为无限个。实际上,这个更强的版本推出的结论也更多。然而,在目前的学习中我们一般不会遇见无限个事件的并集,所以不这样做。不难发现,公理4.3可以替换成 n=2
的情形,因为可以用数学归纳法。有了以上三个公理,我们就可以对概率进行研究了。定理4.1 P(\varnothing)=0 。证明:在公理4.3中令 n=2,E_1=E_2=\varnothing ,有P(\varnothing)=P(\varnothing)+P(\varnothing) ,即 P(\varnothing)=0 。 \square 这说明不可能事件概率为零。定理4.2(减法定理)
设事件 A,B 满足 A\subseteq B ,则P(B\bar A)=P(B)-P(A) 。证明:因为 B=BA\cup B\bar A=A\cup B\bar A ,且 A,B\bar A 互斥,所以根据公理4.3P(B)=P(A)+P(B\bar A) ,也就得到结果。 \square 根据上述定理和公理4.1立刻得到定理4.3(单调性)
设事件 A,B 满足 A\subseteq B ,则 P(A)\leq P(B) 。证明:由定理4.2和公理4.1:P(A)=P(B)-P(B\bar A)\leq P(B) 。 \square 根据定理4.3和公理4.2,立刻得到0\leq P(A)\leq P(\Omega)=1 ,也就得到概率是 [0,1] 中的数。下面的定理对计算很有用。定理4.4(加法定理,容斥原理)
设 A,B 是事件,则P(A\cup B)=P(A)+P(B)-P(AB) 。证明:不难发现A\cup B=A\bar B\cup AB\cup B\bar A ,且它们两两互斥。根据公理4.3:\begin{align}P(A\cup B)&=P(A\bar B)+P(AB)+P(B\bar A)\\&=(P(A\bar B)+P(AB))+(P(B\bar A)+P(BA))-P(AB)\\&=P(A)+P(B)-P(AB)\end{align} \square 推论4.5
对任意事件 A ,P(A)+P(\bar A)=1 。证明:在定理4.4中令 B=\bar A ;注意 A\cup \bar A=\Omega,A\cap \bar A=\varnothing 即可。 \square 这个推论可以概括为:对立事件的概率之和为 1 。定理4.6(布尔不等式)
设 E_1,\cdots, E_n 是一系列事件,则\displaystyle P\left(\bigcup_{k=1}^n E_k\right)\leq\sum_{k=1}^n P(E_k) 。注意它与公理4.3的区别。证明:对 n 用数学归纳法是有效的,现在我们来用另一种方法。令F_1=E_1,F_2=E_2\bar E_1,\cdots, F_n=E_n \bar E_1\cdots \bar E_{n-1} ,则可以验证(为什么?)\displaystyle \bigcup_{k=1}^n E_k=\bigcup_{k=1}^n F_k ,且 F_1,\cdots, F_n 两两互斥。注意到 F_k\subseteq E_k ,根据公理4.3和定理4.3:\displaystyle P\left(\bigcup_{k=1}^n E_k\right)=\sum_{k=1}^n P(F_k)\leq \sum_{k=1}^n P(E_k) 。 \square 上面的证明把一个一般的事件并集转化为互斥事件的并集,这有时候会有用处。苏联的天才和传奇数学家柯尔莫果洛夫(Andrey Nikolaevich Kolmogorov)为概率论的公理化奠定了坚实的基础。柯尔莫果洛夫是如此的才华横溢,他在数学的各个领域都留下了辉煌的成果。在代数拓扑领域,开创了新的领域上同调;在概率论领域,不仅完成了概率论公理化,还证明了大量的不等式和定理,为大数定律等结果的证明铺好了路;发展了随机过程中的连续时间Markov链理论;解决了希尔伯特(Hilbert)第十三问题;开启了数理统计中统计推断的一般分析;在物理学和动力系统中,留下了伟大的KAM定理和遍历理论,其在研究三体问题中发挥了极大的作用;此外,他还研究流体力学,大气物理,海洋物理,应用数学的语言学,化学,生物数学,控制论,军事中火力射击的数学理论(卫国战争期间,并因此获得了苏联英雄奖章),应用统计方法的历史学......练习题4.21.用韦恩图表示事件的各种关系和运算。2.如图是某班学生订阅语文、数学、英语学习资料的情况。 A,B,C 分别表示订阅语文、数学、英语资料的学生的集合。现在从中随机选择一名学生,并用 A,B,C 表示对应的事件,如 A 表示选择的学生订阅了语文资料。(1)用语言描述区域 1,4,5,8 。(2)用集合描述下面的事件:(a)至少订阅了一种学习资料;(b)恰好订阅了一种学习资料;(c)没有订阅学习资料。3.设事件 A,B 满足 P(A)=P(B)=\dfrac 12 。证明 P(AB)=P(\bar A\bar B) 。4.设 A\triangle B=A\bar B\cup B\bar A ,证明 P(A\triangle B)=P(A)+P(B)-2P(AB) 。5.(1)推论4.5的逆命题是否成立?如果成立,请给出证明;如果不成立,请举一个反例。(2)证明推论4.5的推广:设事件 E_1,\cdots, E_n 满足 \displaystyle \bigcup_{i=1}^n E_i=\Omega,\bigcap_{i=1}^n E_i=\varnothing 。则\displaystyle\sum_{i=1}^n P(E_i)=1 。6.设 A,B,C 为三个事件,证明P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(CA)+P(ABC) ,把它与集合中的容斥原理作比较。7.对事件 A,B ,证明 \max\{P(A),P(B)\}\leq P(A\cup B)\leq 2\max\{P(A),P(B)\} 。8.用数学归纳法证明定理4.6。9.(Bonferroni不等式)分别用数学归纳法和布尔不等式证明:对任意的事件 E_1,\cdots, E_n ,有\displaystyle P(E_1\cdots E_n)\geq\sum_{k=1}^n P(E_k)-n+1 。10.设 A,B,C 为事件,证明:P(AB)+P(AC)-P(BC)\leq P(A) 。4.3
古典概型上面对概率做了公理化的定义。然而,如果不给出更多的条件,仅仅使用公理和它们的推论是无法计算实际的概率的。在现实中,我们常常发现或假定一些条件,使得可以直接计算事件的概率,而不是需要通过试验来推测。其中最常见的就是古典概率模型,简称古典概型。掷硬币时,我们会假设正面和反面朝上的概率是一样的,都是 \frac 12 ;掷骰子时,会假设每个点数的概率是一样的,都是 \frac 16 。两个例子的共同点在于,样本空间是有限集,且每个“基本事件”的概率都是一样的。一般地,设样本空间 \Omega=\{\omega_1,\cdots,\omega_n\} 是有限集, P 为定义在其上的概率。如果 P 满足P(\{\omega_i\})=\dfrac 1n,i=1,\cdots, n ,则称 \Omega 和 P 组成了一个古典概率模型,简称古典概型。不难发现,古典概型有着直观的概率计算公式:定理4.7(古典概型概率计算公式)
设 \Omega 和 P 组成古典概型, A 是事件。则P(A)=\dfrac{|A|}{|\Omega|} 。证明:如果 A=\varnothing ,那么显然成立。否则,不妨设样本空间为 \Omega=\{\omega_1,\cdots,\omega_n\} ,且事件 A=\{\omega_1,\cdots,\omega_k\} 。这时我们有 A=\displaystyle\bigcup_{i=1}^k \{\omega_i\} ,所以根据公理4.3:\displaystyle P(A)=\sum_{i=1}^k P(\{\omega_i\})=\sum_{i=1}^k\frac 1n=\frac kn=\frac{|A|}{|\Omega|} 。 \square 这个公式在小学和初中学习时被视为是不言自明的。现在,概率论公理化和对古典概型的严密定义为它打下了坚固的基础。例1
抛掷两个质地均匀的正方体骰子(分别编号为一号,二号)。求下列事件的概率:(1)两个骰子的点数之和为 5 ,记为事件 A ;(2)两个骰子的点数相等,记为事件 B ;(3)一号骰子的点数大于二号骰子的点数,记为事件 C 。解:首先写出样本空间:\Omega=\{(m,n)|m,n\in\{1,2,3,4,5,6\}\} ,不难得到
\Omega|=6\times 6=36 。(1)直接列举: A=\{(1,4),(2,3),(3,2),(4,1)\} 。这样P(A)=\dfrac{|A|}{|\Omega|}=\dfrac 4{36}=\dfrac 19 。(2)直接列举: B=\{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)\} 。这样P(B)=\dfrac{|B|}{|\Omega|}=\dfrac{6}{36}=\dfrac 16 。(3)这个问题当然也可以直接列举,但是现在我们倾向于更加聪明的方法。所有的情况可以分为三种:两个骰子的点数相等,一号骰子的点数大于二号,二号骰子的点数大于一号(记为事件 C' )。而后两者可以一一对应,只需要把两个骰子的点数调换即可。也就是说 P(C)=P(C') 。因为P(B)+P(C)+P(C')=1 ,所以 P(C)=\dfrac12(1-P(B))=\dfrac 5{12} 。关于例1,如果我们不规定两个骰子的编号,可能有人会这样想:如果没有顺序,那么样本空间也没有顺序,即\Omega=\{(m,n)|m,n\in\{1,2,3,4,5,6\},m\leq n\} ,可以计算出
\Omega|=\mathrm C_6^2+6=21 。这时 A=\{(1,4),(2,3)\} ,也就是 P(A)=\dfrac 2{21} 。问题来了,取消编号并不会实质地影响掷骰子的结果,那么为什么同一个事件计算出了两种不同的概率呢?答案是,上述没有顺序时的概率模型并非古典概率模型。只需要稍微留意,就会发现 P(\{(1,1)\}) 和 P(\{(1,2)\}) 并不相等。由此,我们可以总结出计算古典概率的基本步骤:(1)明确样本空间和基本事件,并检查其是不是古典概型;(2)计算事件包含的元素个数;(3)根据古典概型概率计算公式得出概率。当然,计算过程中也可以灵活运用4.2节的性质。接下来我们来看一些古典概型问题。在部分问题中,计数原理和排列组合是有用的。例2
盒子中有 10 个编号了 1,2,\cdots, 10 的小球,从中随机抽取三个球。分别在:抽取之后不放回和抽取之后放回的情况下求(1)三个球上的号码都不大于 7 的概率;(2)三个球上最大的号码为 7 的概率。解:用 A 表示三个球上号码都不大于 7 的事件, B 表示三个球上最大的号码为 7 的事件, C 表示三个球上号码都不大于 6 的事件。在抽取之后不放回的情况下, \Omega 表示在 10 个不同球中抽取三个的组合的集合,从而
\Omega|=\mathrm C_{10}^3 。而事件 A 意味着只在 7 个不同球中抽取三个的组合,所以
A|=\mathrm C_7^3 ;事件 B 中 7 号球已经被取出,则表示在 6 个不同球中抽取两个的组合,所以
B|=\mathrm C_6^2 。根据计算公式:P(A)=\dfrac{\mathrm C_7^3}{\mathrm C_{10}^3}=\dfrac 7{24},P(B)=\dfrac{\mathrm C_6^2}{\mathrm C_{10}^3}=\dfrac 18 。在抽取之后放回的情况下, \Omega 可以表示为 10 个不同小球中选择可重复的三个的"可重排列"的集合,所以
\Omega|=10^3 ;类似,
A|=7^3,|C|=6^3 。所以P(A)=\dfrac{7^3}{10^3}=\dfrac{343}{1000},P(C)=\dfrac{6^3}{10^3}=\dfrac{216}{1000} 。注意,实际上 C\subseteq A,B=A\bar C ,所以P(B)=P(A)-P(C)=\dfrac{127}{1000} 。B 的概率也可以这样计算:设 B_i 表示最大号码为 7 且含有 i 个 7 的概率 (i=1,2,3) ,则 B=B_1\cup B_2\cup B_3 且它们两两互斥。则|B_1|=\mathrm C_3^1\times 6^2=108,|B_2|=\mathrm C_3^2\times 6=18,|B_3|=1 。这时P(B)=P(B_1)+P(B_2)+P(B_3)=\dfrac{108+18+1}{10^3}=\dfrac{127}{1000} 。例3
一副不含王牌的扑克牌包含 52 张牌,被分为 4 种花色,每种花色包括 13 张牌。规定其大小顺序为3<4<\cdots<10<\mathrm J<\mathrm Q<\mathrm K<\mathrm A<2 。“顺子”是指在上面的顺序中连续的五张牌,“同花顺”是指五张牌同花色的顺子。王焕洗牌之后抽了 5 张牌,求他抽到(1)顺子,(2)同花顺的概率。解:样本空间为从 52 张牌中抽五张的集合,所以
\Omega|=\mathrm C_{52}^5 。(1)设抽到顺子为事件 A 。如果不考虑花色,那么可以存在的顺子从 3,4,5,6,7 到 \mathrm{J,Q,K,A},2 一共有 9 种。对于顺子中的每一张牌,都有 4 种花色可供选择,所以
A|=9\times 4^5 ,也就是P(A)=\dfrac{9\times 4^5}{\mathrm C_{52}^5} 。(2)设抽到同花顺为事件 B 。与顺子不同的是,这里整体的五张牌只有 4 种花色可选,所以
B|=9\times 4=36 ,即P(B)=\dfrac{36}{\mathrm C_{52}^5} 。例4
口袋里有 n-1 个白球和一个黑球。每次从中随机取出一个球,并放入一个白球。如此做 k 次。求第 k 次拿出的球是白球的概率。解: \Omega 表示 k 次取球的所有可能结果,所以
\Omega|=n^k 。用 E 表示第 k 次拿出的球是白球的事件,则 \bar E 表示第 k 次拿出的球是黑球的事件。因为只有一个黑球,而且一旦在某次被取出,之后口袋里只有白球,所以 \bar E 一定是前 k-1 次都是白球,第 k 次时黑球,从而
\bar E|=(n-1)^{k-1} ,也就是P(\bar E)=\dfrac{(n-1)^{k-1}}{n^k} ,从而 P(E)=1-P(\bar E)=1-\dfrac{(n-1)^{k-1}}{n^k} 。这道题直接计算
E
比较困难,所以需要计算它的反面。例5
假设某个赛季过后,田径队的战绩是 n 次赢和 m 次输。一个游程是指赢或输的连续序列。比如,田径队连续赢了5次之后连续输了2次,那么就有一个长度为5的赢的游程和一个长度为2的输的游程。设 r 为正整数,求赢的游程个数为 r 的概率。(假设每种输赢顺序等可能)解:用 \mathrm{L} 表示输, \mathrm{W} 表示赢。这时候 \Omega 表示含有 n 个 \mathrm W 和 m 个 \mathrm L 的序列的集合,从而
\Omega|=\mathrm C_{m+n}^n 。如果赢的游程个数为 r (记为事件 A ),则事件 A 发生时田径队的比赛记录可以写为\begin{align} &\mathrm{LL\cdots LWW\cdots WL\cdots LW\cdots W\cdots\cdots WW\cdots WLL\cdots L}\\ &\ \ \ \ \ \small{y_1}\ \ \ \ \ \ \ \ \ \
\ \ \ \small{x_1}\ \ \ \ \ \ \ \ \ \ \ \small{y_2}\ \ \ \ \ \ \ \ \ \ \small{x_2}\ \ \ \ \ \ \ \
\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \small{x_r}\ \ \ \ \ \ \ \ \ \ \small{y_{r+1}}\\ \end{align}\\其中 x_1,\cdots x_r>0,y_1,y_{r+1}\geq0,y_2,\cdots,y_r> 0 ,表示赢和输游程的长度。首先 x_1+\cdots+x_r=n ,这个方程的正整数解个数为 \mathrm C_{n-1}^{r-1} 。令 \overline{y_i}= \begin{cases} y_i+1,i=1\mathrm{\ or\ }i=r+1\\ y_i,\mathrm{\ else} \end{cases} ,则 \overline{y_1}+\cdots+\overline{y_{r+1}}=m+2 。这个方程的正整数解个数为 \mathrm C_{m+1}^r 。故
A|=\mathrm C_{n-1}^{r-1}\mathrm C_{m+1}^r 。从而所求概率 P(A)=\dfrac{\mathrm C_{n-1}^{r-1}\mathrm C_{m+1}^r}{\mathrm C_{m+n}^n} 。练习题4.31.盒子中有编号 1,2,3,4,5 的五个球,从中任意取出三个球,取出后不再放回。求:(1)三次取出的球依次为 1,4,5 的概率;(2)三次取出的球为 1,4,5 ,但无论顺序的概率。2.设有 2n 名来自 n 个班级的同学,他们任意地坐成一排照相,求有同班同学不相邻的概率。3.设有 n 张卡片放在箱子里,其中 m 张做了标记。有 n 个人依次抽签,抽到做标记的卡片的人需要参加运动会。对 1\leq k\leq n ,求第 k 个抽签的人中签的概率,并以此说明抽签是公平的。提示:考虑 n 张卡片按被抽到的顺序作排列,第 k 个人抽到意味着第 k 位必定是有标记的卡片,而其他位置没有要求。4.(1)从 0,1,\cdots, 9
中不放回地任取 k 个数 (1\leq k\leq 10) ,对每个 k ,求这 k 个数的乘积被 10 整除的概率。(2)从 0,1,\cdots, 9
中放回地任取 k 个数 (1\leq k\leq 10) ,对每个 k ,求这 k 个数的乘积被 10 整除的概率。5.某人抛掷一枚硬币 2n 次,求正面朝上次数多于反面朝上次数的概率。6.两个箱子中装有小球;第一个箱子中装着 5 个白球, 11 个黑球, 8 个红球;第二个箱子中装着 10 个白球, 8 个黑球, 6 个红球。在两个箱子中各取出一个球。求两个取出的球颜色不同的概率。7.用概率论证明:对任意正整数 a,A,a<A ,有\displaystyle\frac Aa=1+\frac{A-a}{A-1}+\frac{(A-a)(A-a-1)}{(A-1)(A-2)}+\cdots+\frac{(A-a)(A-a-1)\cdots 1}{(A-1)(A-2)\cdots a} 。8.掷一枚骰子,问需要掷多少次才能保证不出现 6 点的概率小于 0.3 ?9.在不含王牌的一副扑克牌中随机抽取六张,求其中包含所有四种花色的概率。10.王易连续十次掷两个骰子,求出现过点数之和为 5 或 7 ,且点数之和为 5 先出现的概率。11.罐子中放有一些白球和黑球,有放回地抽出两个球。证明两个球颜色相同的概率不小于 \frac12 。12. 50 个铆钉随机地取来用于 10 个部件上,其中有 3 个铆钉强度太弱。每个部件用 3 个铆钉。如果一个部件上的 3 个铆钉强度都太弱,则这个部件强度太弱。求有部件强度太弱的概率。13.甲有 n+1 枚硬币,乙有 n 枚硬币,他们俩都掷这些硬币。求甲的正面朝上个数比乙多的概率。14.从数 1,2,\cdots, n 中任取 k 个,求其中没有两个数相邻的概率。15.三对夫妻站成一排照相,求至少有一对夫妻相邻的概率。问题4.31.从一副没有王牌的扑克牌中取出 13 张牌。对 k=0,1,2,3,4 ,求取出的牌中恰有 k 对同花色 \mathrm{K-Q} 的概率。2.用 G 表示具有下列形式的函数 g:[0,n]\to\mathbb R 的集合:g(0)=0,g(x)=g(j)+\alpha_j(x-j),x\in [j,j+1],j=0,1,\cdots, n-1 ,其中 \alpha_j\in\{1,-1\} 。对于 k\in\{-n,-n+1,\cdots, 0,1,\cdots, n\} ,定义G_k=\{g\in G|g(n)=k\} 。现在从 G 中等可能随机选取一个函数 g ,求 g\in G_k 的概率。4.4
条件概率与独立性4.4.1 条件概率接下来我们讨论一种特殊情况下的概率。之前的小节中,概率问题都是在样本空间 \Omega 的范围内讨论。那么,能不能在某个事件 A 的范围内,讨论其他事件发生的概率?或者说,在 A 发生的条件下,其他事件的概率?这就是条件概率。看一个例子。假设一个家庭想要生育两个孩子,生育男孩和女孩的概率各为 \frac 12 。如果已经知道这个家庭有女孩,那么两个孩子都是女孩的概率是多少?首先写出样本空间,用 b 表示男孩, g 表示女孩,则\Omega=\{(b,b),(b,g),(g,b),(g,g)\} 。设有女孩的事件为 A ,则 A=\{(b,g),(g,b),(g,g)\} ;两个孩子都是女孩的事件为 B=\{(g,g)\} 。现在假定事件 A 会发生,那么在这个条件下事件 B 实际上就是 AB ;这时候概率就是 AB 的元素个数除以 A 的元素个数,即 \dfrac{|AB|}{|A|}=\dfrac 13 。注意到\displaystyle\frac{|AB|}{|A|}=\frac{|AB|/|\Omega|}{|A|/|\Omega|}=\frac{P(AB)}{P(A)} ,我们或许可以把两个概率的比值定义为条件概率。一般地,设 A,B 为事件,满足 P(A)>0 。则P(B|A)=\dfrac{P(AB)}{P(A)} 称为在 A 发生的情况下, B 的条件概率。关于条件概率,首先需要注意的是,它确实是一种概率。也就是说,满足概率的三个公理。定理4.8
对满足 P(A)>0 的事件 A ,令
P'(B)=P(B|A)=\dfrac{P(AB)}{P(A)}
,则
P':\mathscr F\to \mathbb R 也是一个概率。证明:首先,对于事件
B
,有
P(B|A)=\dfrac{P(AB)}{P(A)}\geq 0
。其次,我们有
P(\Omega|A)=\dfrac{P(A\Omega)}{P(A)}=\dfrac{P(A)}{P(A)}=1
。最后,设
E_1,\cdots, E_n
为一系列互斥事件,则 E_1A,\cdots, E_n A 也互斥,所以\displaystyle P\left(\bigcup_{k=1}^n E_k\bigg|A\right)=\frac{P\left(\bigcup_{k=1}^n E_k A\right)}{P(A)}=\sum_{k=1}^n \frac{P(E_k A)}{P(A)}=\sum_{k=1}^n P(E_k|A)
。 \square 上面这个结果与我们的直觉相符:在特定条件下的概率也是概率。证明这一点后,4.2节中所有的性质都将对条件概率生效,这里不再赘述。例1
罐子里放着 7 个白球和 3 个黑球,从中无放回抽取三个球。已知其中之一是黑球,求其余两个球都是白球的概率。解:用 A 表示其中之一是黑球的事件, B 表示三个球为一黑两白的事件,则 B\subseteq A ,则|\Omega|=\mathrm C_{10}^3=120,|A|=\mathrm C_{10}^3-\mathrm C_7^3=85,|B|=\mathrm C_3^1\mathrm C_7^2=63 ,其中
A
的计算方法是在总数中去除三个都是白球的情况。这时P(AB)=P(B)=\dfrac{63}{120},P(A)=\dfrac{85}{120} 。故P(B|A)=\dfrac{P(AB)}{P(A)}=\dfrac{63}{85} 。根据条件概率的定义,可以得到P(AB)=P(A)P(B|A) 。如果我们可以直观地求得条件概率,那么可以利用它来求解
P(AB)
。更一般地,我们有下面的定理定理4.9(乘法定理)
设 n\geq 2 , A_1,\cdots, A_n 为事件,满足 P(A_1\cdots A_n)>0 。则P(A_1\cdots A_n)=P(A_1)P(A_2|A_1)\cdots P(A_n|A_1\cdots A_{n-1}) 。证明留作习题。例2
某商店出售一种产品,每箱装 100 件,且已知每箱中混有 4 件不合格品,商店采用“缺一赔十”的销售方式,即顾客买一箱产品,如果随机地取一件发现是不合格品,商店立刻把 10 件合格品放在箱子中,不合格的那件拿走。顾客在一个箱子中随机地先后取
3
件进行测试,求他发现全是不合格品的概率。解:用 A_i(i=1,2,3) 表示第
i
次取为不合格品的概率。显然 P(A_1)=\dfrac 4{100}=\dfrac 1{25} 。在 A_1 发生后,不合格品被商家拿走并换成 10 个合格品,所以 P(A_2|A_1)=\dfrac 2{109} 。同样, P(A_3|A_1A_2)=\dfrac{1}{118} 。所以P(A_1A_2A_3)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)=\dfrac{1}{160775} 。有些时候我们会对事件进行分类,在条件概率中也是如此。设 A_1,\cdots, A_n 为两两互斥的事件,且满足 \displaystyle\bigcup_{k=1}^n A_k=\Omega ,则称 A_1,\cdots, A_n 是样本空间的一个分划。我们有下面的重要定理。定理4.10(全概率公式)
设 A_1,\cdots, A_n 是样本空间的一个分划,满足 P(A_k)>0(1\leq k\leq n) , B 是任意事件,则\displaystyle P(B)=\sum_{k=1}^n P(A_k)P(B|A_k) 。证明:因为 \displaystyle\bigcup_{k=1}^n A_k=\Omega ,所以 B=\displaystyle\bigcup_{k=1}^n BA_k ,且 BA_k(1\leq k\leq n) 两两互斥。所以\displaystyle P(B)=\sum_{k=1}^n P(BA_k)=\sum_{k=1}^n P(A_k)P(B|A_k) 。 \square 对于
n=2
的情况,公式变成P(B)=P(A)P(B|A)+P(\bar A)P(B|\bar A) ,在概率计算中较为常见。例3
某工厂的第一、二、三号车间生产同一产品,产量占总产量为 \dfrac 12,\dfrac 13,\dfrac 16 ,次品率分别为
1\%, 1\%, 2\%
。在该工厂生产的产品中随机挑选一件,求它是次品的概率。解:分别用 A_1,A_2,A_3 表示挑选的产品为第一、二、三号车间生产的事件, B 表示产品为次品的事件。则P(A_1)=\dfrac 12,P(A_2)=\dfrac 13,P(A_3)=\dfrac 16 ;P(B|A_1)=1\%,P(B|A_2)=1\%,P(B|A_3)=2\% 。根据全概率公式P(B)=\displaystyle\sum_{k=1}^3 P(A_k)P(B|A_k)=0.01\left(\frac12+\frac 13\right)+0.02\times\frac 16=\frac 7{600} 。例4
罐子里放着 a 个白球和 b 个黑球。每次从罐子里取出一个球,并放入 c+1 个与取出的球同色的球,如此反复。对任意的正整数 n ,证明第 n 次取出的是白球的概率是 \frac a{a+b} 。证明:用 A_n 表示第 n 次取出的是白球的事件,则 \bar A_n 表示第 n 次取出的是黑球的事件。对 n 用数学归纳法。 n=1 时,显然 P(A_1)=\dfrac a{a+b} 。假设命题对 n=k 成立,则 n=k+1 时,由全概率公式P(A_{k+1})=P(A_1)P(A_{k+1}|A_1)+P(\bar A_1)P(A_{k+1}|\bar A_1) 。注意,如果 A_1 发生,则接下来是在放有 a+c 个白球和 b 个黑球的罐子中取球 k 次。从而由归纳假设P(A_{k+1}|A_1)=\dfrac{a+c}{a+b+c} 。同理, P(A_{k+1}|\bar A_1)=\dfrac a{a+b+c} 。所以P(A_{k+1})=\displaystyle\frac a{a+b}\cdot\frac{a+c}{a+b+c}+\frac b{a+b}\cdot\frac a{a+b+c}=\frac a{a+b} 。对 n=k+1 也成立。 \square 全概率公式在计算概率中有一种特殊的应用,那就是与递推数列进行结合。如果问题具有明确的步骤,步骤之间具有递推结构,就可以借助全概率公式来处理。例5
甲乙两人轮流掷骰子,甲先开始。如果某次掷出 1 点则交给乙来掷,乙掷出
1 点后交给甲来掷,如此下去。求第 n 次掷骰子是由甲来掷的概率。解:用 A_n 表示第 n 次掷骰子是由甲来掷的事件, p_n=P(A_n) 。则 p_1=1 。对 n\geq 2 ,由全概率公式 P(A_n)=P(A_{n-1})P(A_n|A_{n-1})+P(\bar A_{n-1})P(A_n|\bar A_{n-1})
。如果第 n-1 次为甲掷,则不能掷出
1 点;否则需要掷出 1 点。也就是 P(A_n|A_{n-1})=\dfrac 56,P(A_n|\bar A_{n-1})=\dfrac 16 。所以上式变为p_n=\displaystyle\frac 56 p_{n-1}+\frac 16(1-p_{n-1})=\frac 23 p_{n-1}+\frac 16 。求解数列:p_n-\frac 12=\frac 23\left(p_{n-1}-\frac 12\right) ,所以 \displaystyle p_n-\frac 12=\left(\frac23\right)^{n-1}\left(p_1-\frac12\right)=\frac12\left(\frac23\right)^{n-1} ,即 p_n=\dfrac 12+\dfrac 12\left(\dfrac23\right)^{n-1} 。例6
设 m\in\mathbb N^* 。一个质点在数轴上运动,最开始质点位于坐标为 k(0<k<m) 的点。假设某整数秒时刻质点位于 x ,经过一秒时间,质点会向 x+1 或 x-1 移动,二者的概率分别是 p 和 q=1-p 。如果质点运动到 0 或 m ,则之后一直保持静止,称为被对应的点吸附。求质点被 m 吸附的概率。解:用 A_k 表示从 k 出发,被 m 吸附的事件。令 p_k=P(A_k) ,则 p_0=0,p_m=1 。用 H 表示质点第一次运动向右的事件,则 \bar H 表示第一次运动向左的事件。根据全概率公式P(A_k)=P(H)P(A_k|H)+P(\bar H)P(A_k|\bar H) 。如果在
k
向右,则下次从 k+1 出发;如果向左,则下次从 k-1 出发。从而P(A_k|H)=p_{k+1},P(A_k|\bar H)=p_{k-1} 。所以上式也就是p_k=p\cdot p_{k+1}+q\cdot p_{k-1}(k=1,\cdots, m-1) 。数列的特征方程是 px^2-x+q=0 ,解出 x_1=\dfrac qp,x_2=1 。如果 p=q=\dfrac 12 ,则数列是等差数列,公差为 \dfrac 1m(p_m-p_0)=\dfrac 1m ,所以 p_k=\dfrac km ;如果
p\neq q ,那么通项公式形如p_k=C_1+C_2\left(\dfrac qp\right)^k ,代入
p_0=0,p_m=1
得 \begin{cases}C_1+C_2=0\\C_1+C_2\left(\frac qp\right)^m=1\end{cases} ,解得 C_1=-C_2=\dfrac1{1-\left(\frac qp\right)^m} 。所以p_k=\dfrac{1-\left(\frac qp\right)^k}{1-\left(\frac qp\right)^m} 。现在我们考察一个更进一步的概率问题。在例3中,有时需要对次品的来源进行调查。假设抽出一个次品,请问它来自一号车间的概率是多少?问的其实就是 P(A_1|B) 。因为已经计算了 P(B) ,所以并不复杂:\displaystyle P(A_1|B)=\frac{P(A_1B)}{P(B)}=\frac{P(A_1)P(B|A_1)}{P(B)}=\frac{0.01\times\frac12}{\frac 7{600}}=\frac 37
。这个问题实际上是一种“执果索因”的问题。在实际生活中,一些事情的机制很可能是未知的,我们只能通过分析结果来窥视其中的部分原因。在概率论中完成这类工作的利器就是下面的贝叶斯(Bayes)公式。定理4.11(贝叶斯公式)
设 A_1,\cdots, A_n 是样本空间的一个分划,满足 P(A_k)>0(1\leq k\leq n) , B 是任意事件,满足
P(B)>0
,则P(A_k|B)=\dfrac{P(A_k)P(B|A_k)}{\displaystyle\sum_{j=1}^nP(A_j)P(B|A_j)} 。证明:由条件概率的定义和全概率公式:P(A_k|B)=\dfrac{P(A_kB)}{P(B)}=\dfrac{P(A_k)P(B|A_k)}{\displaystyle\sum_{j=1}^nP(A_j)P(B|A_j)} 。 \square 下面我们再来举例子说明贝叶斯公式是如何执果索因的。例7
林悦和夏阳两人是网友,经常用电子邮件互相联系。他们约定,在收到对方信件的当天立刻回电子邮件。由于线路问题,电子邮件有 p\in (0,1) 的概率无法在当天送达收件人。夏阳在某天发了一份电子邮件给林悦,但是没有收到她的回音。求林悦收到了夏阳发的电子邮件的概率。解:用 A 表示林悦收到了夏阳发的电子邮件的事件, B
表示夏阳收到了林悦的回件的事件,则要求的就是 P(A|\bar B) 。根据题目条件:P(A)=1-p,P(\bar B|A)=p,P(\bar B|\bar A)=1 ,其中第三个是因为没收到电子邮件就肯定不会回件。根据贝叶斯公式:\displaystyle P(A|\bar B)=\frac{P(A)P(\bar B|A)}{P(A)P(\bar B|A)+P(\bar A)P(\bar B|\bar A)}=\frac{(1-p)p}{(1-p)p+p}=\frac{1-p}{2-p}
。分析一下结果。夏阳没有收到回音有两种情况:林悦没有收到他的电子邮件;以及林悦收到了,但回件没有成功到达。因为 \dfrac{1-p}{2-p}<\dfrac 12 ,所以更有可能是前一种情况:没有收到,所以没有回复。例8
药剂师杰克有如下的诊断方案:如果他有至少 80\% 的把握判断病人有某种病,那么他会建议病人手术;否则将会推荐进一步检查。一开始杰克只有 60\% 的把握确定病人琼斯患有此病。他推荐琼斯做了检查项目A,该项目的检查指标会对患此病者显示阳性,对健康人不会。一开始琼斯的检查结果为阳性,但是病历告诉杰克,琼斯患有糖尿病,而检查项目A有 30\% 的可能性对患有糖尿病而不患此病的人显示阳性。请问杰克应该建议手术还是建议做进一步检查?解:用 D 表示琼斯患此病的事件, E 表示检查项目A显示阳性的事件,则一开始杰克的推测是 P(D)=0.6 ,而条件表示 P(E|\bar D)=0.3,P(E|D)=1 。由贝叶斯公式\displaystyle P(D|E)=\frac{P(D)P(E|D)}{P(D)P(E|D)+P(\bar D)P(E|\bar D)}=\frac{0.6\times 1}{0.6\times 1+0.4\times 0.3}=\frac 56>0.8 ,所以杰克应该建议手术。贝叶斯公式出自18世纪的英国哲学家贝叶斯(Thomas Bayes)之手。有趣的是,贝叶斯并不研究概率论,这个公式是他试图研究统计推断时得出的。这个公式可以作如下的解释:如果某个过程有 A_1,\cdots, A_n 这些可能的原因,则 P(A_k) 则是对这些原因的事前估计,被称为先验概率;而最后结果 B 出现后,人们将通过贝叶斯公式计算 P(A_k|B) ,对这些原因的概率获得新的认识,被称为后验概率。通过多个结果事件,我们将对原因拥有越来越精确的认识。在现实世界中,基于先验概率对后验概率做出推断的方法已经形成一种固定的学派,被称为贝叶斯学派。贝叶斯学派的思想方法广泛地渗透在现代概率统计中。4.4.2 事件的独立性在实际问题中有一种事件关系经常受到人们的关注,即两个事件是“相互独立的”,或者说一个事件的结果不影响另一个事件。举个例子:某班上有 51 名同学,其中 30 男 21 女;其中团员 17 人, 10 男 7 女。用 A,B 分别表示随机选择一名同学,是男生和是团员的事件。这时|\Omega|=51,|A|=30,|B|=17,|AB|=10 ,所以 \displaystyle P(A)=\frac{30}{51}=\frac {10}{17},P(B)=\frac{17}{51}=\frac 13,P(A|B)=\frac{10}{17},P(B|A)=\frac{10}{30}=\frac 13 。从数据中我们发现P(A)=P(A|B),P(B)=P(B|A) 。这个式子可以解释为: A 发生的概率无论是不是以 B 为条件都一样;调换过来也是如此。这似乎可以作为独立性的定义。注意到上式可以推出P(AB)=P(A)P(B) ,一般地,设
A,B
是事件,如果
P(AB)=P(A)P(B)
,则称事件
A,B
相互独立,简称独立。根据上面的讨论立刻得知定理4.12
设事件 A,B 满足 P(A)>0 ,则事件 A,B 相互独立的充要条件是 P(B)=P(B|A) 。此外,根据相互独立的定义还可以推出下面的基础结果:定理4.13
事件 A,B 相互独立与下面的三个条件中任何一个都等价:(1) A,\bar B 相互独立;(2) \bar A,B 相互独立;(3) \bar A,\bar B 相互独立。证明:(1)注意到P(A\bar B)=P(A)-P(AB) ,所以P(A\bar B)=P(A)P(\bar B)=P(A)(1-P(B))=P(A)-P(A)P(B)\Leftrightarrow P(AB)=P(A)P(B) 成立。(2)(3)留作习题。 \square 下面这个例子表明有些看起来独立的事件不一定独立。例9
一个袋子中装有标号 1,2,3,4 的 4 个球,采用不放回方式摸两个球,事件 A,B 分别表示第一次和第二次摸出的球标号小于 3 的事件,证明 A,B 不相互独立。证明:显然 P(A)=\dfrac 12 。根据全概率公式P(B)=P(A)P(B|A)+P(\bar A)P(B|\bar A)=\dfrac 12\times\dfrac 13+\dfrac 12\times \dfrac23=\dfrac 12 。而 P(AB)=\dfrac{\mathrm A_2^2}{\mathrm A_4^2}=\dfrac1 6 ,所以 P(AB)\neq P(A)P(B) ,二者不相互独立。 \square 之后我们来看独立性在计算中的应用。例10
程澈和李霞组成一支队伍参加成语大会。比赛中每轮会由两人各猜一个成语。根据以往的训练数据,程澈和李霞猜对的概率分别是 \frac 34,\frac 23 。在每轮中,二人猜的结果互不影响,不同轮次也互不影响。求队伍在两轮中猜对 3 个词语的概率。解:用 A_1,A_2,B_1,B_2 分别代表程澈和李霞在两轮中猜对一个,两个成语的事件。根据独立性:\displaystyle P(A_1)=2\times\frac 14\times\frac 34=\frac 38,P(A_2)=\frac 34\times\frac 34=\frac 9{16} ;\displaystyle P(B_1)=2\times\frac 13\times\frac 23=\frac 49,P(B_2)=\frac 23\times\frac 23=\frac 49 。用 E 表示队伍在两轮中猜对 3 个词语的事件,则 E=A_1B_2\cup A_2B_1 。根据独立性可知P(E)=P(A_1)P(B_2)+P(A_2)P(B_1)=\displaystyle\frac 38\times\frac 49+\frac 9{16}\times\frac 49=\frac 5{12} 。例11
甲乙两人独立地各自掷硬币。求两人抛掷 n 次后,正面朝上的次数相等的概率。解:用 A_k,B_k 表示甲和乙抛掷后正面朝上有 k 次的概率,则 A_k,B_k 相互独立。用 E 表示二人正面朝上次数相等的事件,则 E=\displaystyle\bigcup_{k=0}^n A_kB_k 。而 P(A_k)=P(B_k)=\dfrac{\mathrm C_n^k}{2^n} ,所以\displaystyle P(E)=\sum_{k=0}^ n P(A_kB_k)=\sum_{k=0}^n P(A_k)P(B_k)=\sum_{k=0}^n\frac{(\mathrm C_n^k)^2}{4^n} 。根据范德蒙恒等式: \displaystyle\sum_{k=0}^n(\mathrm C_n^k)^2=\sum_{k=0}^n \mathrm C_n^k\mathrm C_n^{n-k}=\mathrm C_{2n}^n
,所以 P(E)=\dfrac{\mathrm C_{2n}^n}{4^n} 。由此可见,如果事件具有相互独立的性质,那么计算事件的概率会变得更为方便。在计算中需要多多留意独立性假设。稍后我们会更正式地讨论这个问题。现在讨论多个事件(至少三个)的独立性问题。人们很可能会觉得,只要多个事件中任意选择两个都独立,那么这些事件就独立了。实际上却不是如此。想象如上图所示的三个环,只要任意去掉一个环,剩下两个环都可以直接分离;但是三个环以这种方式放在一起时却无法分离彼此。这暗示多个事件的独立性需要更强的条件。现在先以三个事件的独立性为例。设 A,B,C 是事件,称它们相互独立,如果以下的四个关系式成立:P(ABC)=P(A)P(B)P(C) ,P(AB)=P(A)P(B) ,P(BC)=P(B)P(C) ,P(CA)=P(C)P(A) 。显然,三个事件相互独立可以推出它们两两独立。然而,反过来是不正确的。我们来看下面的例子:例12
设一个均匀的四面体的四个面上,其中三个面分别涂有红白黑三色,而剩下一个面同时涂有这三种颜色。抛掷这个四面体,用 A,B,C 分别表示朝下的面上涂了红,白,黑色的事件,证明 A,B,C 两两独立但不相互独立。证明:因为P(A)=P(B)=P(C)=\dfrac12,P(AB)=P(BC)=P(CA)=\dfrac 14 ,所以 A,B,C 两两独立。然而P(ABC)=\dfrac14\neq P(A)P(B)P(C) ,所以 A,B,C 不相互独立。 \square 更加一般地,可以定义 n 个事件的相互独立。设 A_1,\cdots, A_n 是事件,如果对于任意的子集 I\subseteq\{1,2,\cdots, n\},|I|\geq 2 都有\displaystyle P\left(\bigcap_{i\in I}A_i\right)=\prod_{i\in I}P(A_i) ,则称 A_1,\cdots, A_n 相互独立。根据定义不难知道,若 A_1,\cdots, A_n相互独立,则对任何上述的子集, A_i(i\in I) 也相互独立。相互独立的事件计算概率是相当方便的。事实上,我们有定理4.14
设 A_1,\cdots, A_n 相互独立。则(1) \displaystyle P\left(\bigcap_{k=1}^n A_k\right)=\prod_{k=1}^n P(A_k) ;(2) \displaystyle P\left(\bigcup_{k=1}^n A_k\right)=1-\prod_{k=1}^n (1-P(A_k)) 。证明:(1)只需要在定义中令 I=\{1,2,\cdots, n\} 即可。(2)注意, \bar A_1,\cdots,\bar A_n 也相互独立(为什么?),所以根据集合的反演律\begin{align}P\left(\bigcup_{k=1}^n A_k\right)&=1-P\left(\overline{\bigcup_{k=1}^n A_k}\right)\\&=1-P\left(\bigcap_{k=1}^n \bar A_k\right)\\&=1-\prod_{k=1}^n P(\bar A_k)\\&=1-\prod_{k=1}^n(1-P(A_k))\end{align} \square 例13
有一种试验分为成功和失败两种结果,成功的概率是 p 。已知不同试验之间不会影响。做 n 次试验,求每次都成功和至少有一次成功的概率。解:根据定理4.14,分别为 p^n 和 1-(1-p)^n 。本例中提到的模型叫伯努利(Bernoulli)试验,在概率论中还会遇到的。练习题4.41.乔伊 80\% 肯定他把失踪的钥匙放在了他外套的两个口袋中的一个里。他 40\% 确定放在左口袋, 40\% 确定放在右口袋。现在乔伊检查了左口袋发现没有钥匙。求钥匙在右口袋的概率。2.甲乙两人朝目标各射击一次,二人射中目标的概率分别是 0.6,0.5 。现在已知目标被射中,求甲射中目标的概率。3.证明乘法定理。4.幼儿园老师买了 2n-1 块牛奶巧克力和 2n 块白巧克力。现在任意发给一个小朋友 n 块巧克力,小朋友吃后发现都是同种的。求都是白巧克力的概率。5.有两个口袋,第一个装着 5 个白球和 2 个黑球,第二个装着 4 个白球和 5 个黑球。从第一个袋子中取出两个球放入第二个袋子,然后在第二个袋子中任取一个球。求取出的是白球的概率。6.有一枚不均匀硬币,某人抛掷它 n 次。已知第一次是正面朝上的概率为 c ;之后的抛掷中,与前一次结果相同的概率是 p 。求第 n 次为正面朝上的概率。7.证明条件全概率公式:设 E_1,\cdots, E_n 是样本空间的一个分划, A,B 是事件,满足 P(E_kB)>0,1\leq k\leq n 。则P(A|B)=\displaystyle\sum_{k=1}^n P(A|E_kB)P(E_k|B) 。并按照此形式模仿写出条件贝叶斯公式。8.两个赌徒A和B就连续抛掷一枚硬币打赌。对于每一次抛掷的结果,如果是正面朝上,则B支付给A一元;否则A支付给B一元。一直下去直到有人的钱输光。假定硬币正面朝上的概率为 p ,A有 i 元, B有 N-i 元。求A赢得所有钱的概率。9.军队释放 3 枚深水炸弹攻击敌方潜艇。一枚深水炸弹击沉潜艇的概率为 \dfrac13 ,击伤的概率为 \dfrac12 ,击不中的概率为 \dfrac16 。已知击伤两次也可以导致潜艇被击沉,求能击沉敌方潜艇的概率。10.质点在正四面体 ABCD 的顶点上运动,每一步都从所在的顶点转移到其他的顶点,转移到每个顶点的概率都是 \dfrac13 。开始时质点位于点 A 。求第 n 次移动之后质点位于点 A 的概率。11.一只母猩猩生了一只幼猩猩,现在要给幼猩猩找到父亲。在基因分析之前,有迹象表明父亲一定是两只公猩猩之一,第一只的概率为 p ,第二只的概率为 1-p 。现在知道母猩猩在某一基因的基因型为AA,第一只公猩猩的基因型为aa,第二只为Aa。检测得出幼猩猩的基因型为Aa。求第一只公猩猩是父亲的概率。12.袋子里装有 m 枚正品硬币和 n 枚赝品硬币,赝品的两面印的都是国徽。在袋子中任取一枚硬币,并将它投掷 r 次。已知每次都是国徽面朝上,求取出的硬币是正品的概率。13.已知 P(\bar A)=0.3,P(B)=0.4,P(A\bar B)=0.5 ,求 P(B|A\cup \bar B) 的值。14.美国的电视节目Let's Make a Deal中有一个著名的问题,其常被用作概率论"反直觉"的例子。参与者会看见三扇关闭了的门,其中一扇的后面有一辆汽车,选中后面有车的那扇门可赢得该汽车,另外两扇门后面则各藏有一只山羊。当参与者选定了一扇门,但未去开启它的时候,节目主持人开启剩下两扇门的其中一扇,露出其中一只山羊。主持人其后会问参与者要不要换另一扇仍然关上的门。运用概率论的知识分析是否应该换门。15.1965年5月,在布宜诺斯艾利斯举行的世界桥牌锦标赛上,英国一对著名的桥牌手Terrence Reese和Boris Schapiro被指控作弊,说是他们用手指作暗号暗示他们红桃的张数。Reese和Schapiro都否认这项指控。事后,英国桥牌协会举行了一个听证会,听证会按法律的程序进行,既包含控方,也包含辩方。双方都有目击证人。在接下来的调查过程中,控方检查了Reese和Schapiro打的几手牌,并声称他们的打法与通过作弊已知了红桃的张数的打法是吻合的。针对这个观点,辩方律师指出,他们的打法也同样与标准打法一致。然而,控方指出,既然他们的打法与其作弊的假设是一致的,那么就应该是支持这种假设。你如何理解控方的理由,它充分吗?如果充分,为什么?如果不充分,那么控方还需要提供什么方面的证据?提示:这是概率论解决司法问题的例子。设有罪指控为 H ,控方提供的证据是 E 。如果要说明 E 确实是有效的证据,那么应该有 P(H|E)>P(H) 。运用贝叶斯公式。16.证明:若 P(A|B)=P(A|\bar B) ,则事件 A,B 相互独立。17.证明定理4.13的(2)(3)。18.设事件 A,B 相互独立,且 P(A\cup B)=1 。证明事件 A,B 之一与任何事件相互独立。19.考察正方体各个面的中心(共 6 个点)。小兰和小军两人相互独立地从中选择三个点做成三角形,求二人做成的三角形全等的概率。20.如图所示为一个电路系统。每个电阻都有 p 的概率发生异常,且相互独立。只有没发生异常的电路能组成A,B之间的通路时,整个系统才是正常的。求系统正常的概率。21.对敌机进行三次独立的射击,命中率分别为 0.4,0.5,0.7 。敌机被击中一次、两次、三次后坠落的概率分别为 0.2,0.6,1 。求射击三次后击落敌机的概率。22.有一个由三人组成的评判组和一个独立评判人各自对事务做出决定。评判组中有两个人相互独立地以概率 p 作出正确决定,第三个人与前两人独立地通过掷硬币决定,整个组的决定按照多数票的意见进行;独立评判人以概率 p 作出正确决定。试问评判组和独立评判人哪个作出正确决定的概率更大?23.设 a_1,\cdots, a_n\in [0,1] ,用概率论证明\displaystyle\sum_{k=1}^n a_k\prod_{i=1}^{k-1}(1-a_i)+\prod_{k=1}^n (1-a_k)=1 。提示:考虑一系列相互独立的事件 E_1,\cdots, E_n 满足 P(E_k)=a_k ,我们需要用两种方法计算 \displaystyle P\left(\bigcup_{k=1}^n E_k\right) 。24.设 A,B,C 是事件, P(C)>0 。称 A,B 关于 C 条件独立,如果 P(AB|C)=P(A|C)P(B|C) 。如果 H_1,\cdots, H_n 是样本空间的一个分划,满足 P(H_k)>0(1\leq k\leq n) ; E_1,E_2 是事件,满足 P(E_1E_2)>0 ,且对任意的 1\leq k\leq n , E_1,E_2 关于 H_k 条件独立。证明对 1\leq i\leq n :P(H_i|E_1E_2)=\dfrac{P(E_2|H_i)P(H_i|E_1)}{\displaystyle\sum_{k=1}^n P(E_2|H_k)P(H_k|E_1)} 。提示:用贝叶斯公式。问题4.41.举例说明:事件 A,B,C 即使满足 P(ABC)=P(A)P(B)P(C) ,也不一定相互独立。2.证明事件 A_1,\cdots, A_n 相互独立的充要条件是,对任意的事件组 (\hat A_1,\cdots, \hat A_n) ,其中 \hat A_k\in\{A_k,\bar A_k\} ,都有P(\hat A_1\cdots\hat A_n)=P(\hat A_1)\cdots P(\hat A_n) 。4.5
几何概型简介有一些概率问题用古典概型无法解决,其原因是它们的样本空间并非有限集;更准确的,样本空间可以视为空间(通常是 1,2,3 维)的区域。这时就需要一个新的概率模型来解决问题。一般地,设样本空间 \Omega 为 \mathbb R(\mathbb R^2,\mathbb R^3) 的(可求长度,面积或体积的)子集,如果对 \Omega 的任意(可求长度,面积或体积的)子集 A 都有P(A)=\dfrac{\sigma(A)}{\sigma(\Omega)} ,其中 \sigma(X) 表示 X 的长度,面积或体积,则称 \Omega 和 P 组成了一个几何概率模型,简称几何概型。1.更高维度也可以定义几何概型,但目前我们不知道什么是高维的"体积",所以暂时不考虑。2.之所以要说可求长度,面积或体积的集合,是因为第一,有长度,面积或体积为无穷大的集合;第二,即使不考虑无穷大,不可以求这些的集合依然存在,即所谓不可测集。它们的性质是非常怪异的。同学们会在大学课程《实分析》中详细学习它们。我们通过一些例子来熟悉几何概型。例1
收音机电台会在每个整点进行报时。夏栀子睡午觉醒来后发现表停了,她打开收音机想收听电台报时。求她的等待时间不超过 10 分钟的概率。解:用 A 表示等待时间不超过 10 分钟的事件。她醒来的时间总是可以放在某一个整小时的时段里,并用区间 \Omega=[0,60] 标注这个时段。等待时间不超过十分钟意味着醒来时间位于 [50,60] 内,所以 A=[50,60] ,从而P(A)=\dfrac{\sigma(A)}{\sigma(\Omega)}=\dfrac{60-50}{60}=\dfrac 16 。例2
甲乙两人于某日下午 6 至 7 时到达某处,每人都只在该处停留十分钟。求它们在某处相遇的概率。解:分别用 x,y 表示两人到达的时间。样本空间可以表示为\Omega=\{(x,y)|6\leq x,y\leq 7\} ;用 A 表示两人相遇的事件,则A=\left\{(x,y)\in\Omega\bigg
x-y|\leq\dfrac16\right\} 。绘制图像如下。图中蓝色区域就是A图中可以看出, \bar A 对应于两个边长为 \dfrac56 的等腰三角形的并集,即 \sigma(A)=1-\left(\dfrac56\right)^2=\dfrac{11}{36} 。而 \sigma(\Omega)=1 ,所以P(A)=\dfrac{\sigma(A)}{\sigma(\Omega)}=\dfrac{11}{36} 。例3
蜜蜂在一个棱长为 3 的正方体蜂箱中飞行。称蜜蜂为"安全飞行",如果蜜蜂与正方体任意表面的距离均大于 1 。求蜜蜂安全飞行的概率。解:样本空间 \Omega 是棱长为 3 的正方体,而蜜蜂安全飞行的事件 A 是内部中心棱长为 1 的正方体。所以P(A)=\dfrac{\sigma(A)}{\sigma(\Omega)}=\dfrac{1^3}{3^3}=\dfrac1{27} 。上面的问题反映了基础的使用几何概型的方法。然而,当我们开始考虑稍稍复杂的问题时,会出现一个很大的麻烦。下面的经典例子说明几何概型的定义可能还存在不明确之处。例4(Bertrand奇论)
在单位圆内任意作圆的一条弦,求弦长大于 \sqrt 3 的概率。设所求事件为 E 。解法一:不妨设弦 AB 的端点 A 已经取定,那么样本空间 \Omega 就是单位圆周。长度为 \sqrt 3 的弦,其对应的圆心角是 \dfrac{2\pi}3 ,所以弧长也是 \dfrac{2\pi}3 。这样P(E)=\dfrac{2\pi/3}{2\pi}=\dfrac 13 。解法二:对于任意一条弦,它与圆心的距离可能为 [0,1] 中的数;对于长度大于 \sqrt3 的弦,它与圆心的距离小于 \dfrac 12 。这样P(E)=\dfrac{1/2}{1}=\dfrac 12 。解法三:弦 AB 由它的中点 K 唯一确定。中点 K 的位置可以取为整个单位圆;而对于长度大于 \sqrt3 的弦,中点 K 的位置则是半径为 \frac12 的同心圆,所以P(E)=\dfrac{\pi(1/2)^2}{\pi\cdot 1^2}=\dfrac 14 。奇怪的事情是,这三个解法看起来都有道理,但是得到了不一样的结果。问题出在哪里呢?实际上,"任意作弦"的含义不够清楚,导致了有多种理解。每一种理解都取了不同的样本空间和事件区域,并假设样本空间上的概率是"均匀分布"的,而它们并不等价。我们会在学习均匀分布之后再次对几何概型进行回顾,那时可以有更加严密的描述。在本节最后我们来对著名的蒙特卡洛(Monte Carlo)方法作简单介绍。蒙特卡洛方法是通过大量随机样本点来估测真实值的许多算法的总称。先举一个例子。例5
用蒙特卡洛方法计算圆周率 \pi 的值。第一步,我们绘制一个半径为 1 的圆,以及它的外切正方形,如图。不难算得圆与正方形的面积之比是 \dfrac\pi 4 。第二步,在正方形内选取随机点。具体实现方法为:取两个 [0,2] 内的随机数 a,b ,则 (a,b) 就是正方形内的随机点。取 n 组随机点(一般很大),并计数落在圆内的随机点个数 m 。具体而言,圆的方程是 (x-1)^2+(y-1)^2=4 ,所以只需要验证 (a-1)^2+(b-1)^2\leq 4 即可。第三步,用 A 表示点落在圆内的事件,则一方面 P(A)=\dfrac\pi 4 ;另一方面,用随机点的比例估计概率,有 P(A)\approx\dfrac mn 。也就是\displaystyle\frac\pi4\approx\frac mn\Rightarrow \pi\approx\frac{4m}{n} 。从上面的例子可以看出蒙特卡洛方法是如何解决问题的,可以总结为:(1)把问题转化为(几何概型的)求概率问题;(2)生成样本空间内的均匀随机点,计算符合要求的随机点的比例;(3)把随机模拟得到的概率近似值与概率准确值比较,得到想要的结果。对计算机有一定了解的同学可能会知道,计算机生成的随机数并不是真正的随机数,而是用特殊算法生成的周期很长的数列,被称为伪随机数。多数时候伪随机数看起来和用起来与随机数都无区别。然而,伪随机数中微妙的非随机特性曾经对部分使用蒙特卡洛方法的科学实验产生了影响。鉴于目前产生真随机数依然需要借助"自然之功",我们有时不得不对计算机产生的随机数留个心眼。练习题4.51.在区间 [0,1] 内任取两个数,求这两个数的平方和也在 [0,1] 中的概率。2.把一根长为 4 米的绳子对折,之后随机选取一个位置剪断,求得到的三段都不短于 1 米的概率。3.在棱长为 1 的正方体 ABCD-EFGH 中随机取一点 P ,求四棱锥 P-ABCD 的体积不小于 \dfrac14 的概率。4.在平面上画着一些间隔距离为 a 的平行直线网。现在向平面抛掷一枚半径为 r<\dfrac a2 的硬币,求硬币压到某条直线的概率。5.在圆周上随机选择三个点 A,B,C ,求三角形 ABC 是锐角三角形的概率。6.设 a,b 分别是从区间 [0,3],[0,2] 取的随机数,求方程 x^2+2ax+b^2=0 有实数根的概率。7.如果样本空间 \Omega 是一条线段,事件 A 是线段上的有限个点,证明 P(A)=0 。由此可以说明概率为零的事件不一定是 \varnothing 。8.在矩形 ABCD 中,
AB|=5,|AC|=7 。在矩形中随机取一点 P ,求 \angle APB>\dfrac\pi2 的概率。9.设 \Omega=\{(x,y,z)|0\leq x,y,z\leq 4\} ,求事件 A=\left\{(x,y,z)\in\Omega\bigg|\displaystyle\frac x2+\frac y3+\frac z4\leq 1\right\} 的概率。10.唐玥家里订了一份报纸,送报人会在早上 6:30-7:30 之间的某时把报纸送到。唐玥离开家出去工作的时间是早上 7:00-8:00 的某个时刻。求唐玥去上班之前能拿到报纸的概率。11.用合适的语言表述:蒙特卡洛方法求下图中阴影部分面积的步骤。附加阅读*
概率的可数可加性和连续性本附录最好在学习过数学IV的内容之后再来阅读,会有更好的理解。在之前我们提到了,概率的三个公理中第三个也可以替换为更强的版本,这也就是下面的公理4.3'(可数可加性)
设 E_1,\cdots, E_n,\cdots 是一个无限的事件序列,满足它们两两互斥,则\displaystyle P\left(\bigcup_{k=1}^\infty E_k\right)=\sum_{k=1}^\infty P(E_k) 。这个版本显然比原来的更强。为了从这个推出有限的可加性,只需要令 E_{n+1}=E_{n+2}=\cdots=\varnothing 即可。可数可加性的意义在于它可以让概率具有与极限有关的性质。实际上,可以证明定理4.a1(上连续性)
设 E_1,\cdots, E_n,\cdots 是一个无限的事件序列,满足 E_n\subseteq E_{n+1},\forall n\in\mathbb N^* 。则\displaystyle P\left(\bigcup_{n=1}^\infty E_n\right)=\lim_{n\to\infty} P(E_n) 。证明:记 F_1=E_1,F_n=E_n\bar E_{n-1}(n\geq 2) 。则 \displaystyle\bigcup_{n=1}^\infty F_n=\bigcup_{n=1}^\infty E_n ,且 E_n=\displaystyle\bigcup_{m=1}^n F_m ,以及 F_n 两两互斥。所以\begin{align}P\left(\bigcup_{n=1}^\infty E_n\right)&=P\left(\bigcup_{n=1}^\infty F_n\right)\\&=\sum_{n=1}^\infty P(F_n)\\&=\lim_{n\to\infty}\sum_{m=1}^n P(F_m)\\&= \lim_{n\to\infty} P(E_n)\end{align} \square 类似还有定理4.a2(下连续性)
设 E_1,\cdots, E_n,\cdots 是一个无限的事件序列,满足 E_n\supseteq E_{n+1},\forall n\in\mathbb N^* 。则\displaystyle P\left(\bigcap_{n=1}^\infty E_n\right)=\lim_{n\to\infty} P(E_n) 。对 \bar E_n 使用上连续性即可,留给大家完成。第四章复习提要1.用频率逼近来定义概率存在什么问题?2.概率建立在哪些基本概念和公理的基础上?概率论公理如何推出概率的各种性质?3.尽可能多条目地比较古典概型和几何概型的区别(如样本空间,计算公式等),并各自举出三个相关的数学问题。4.条件概率是什么意思?它如何计算?全概率公式和贝叶斯公式如何应用?5.复述两个和有限个事件相互独立的概念,并阐述独立性与条件概率的关系。具有独立性的事件计算概率时有哪些方便之处?

要讲分析过程。...
要讲分析过程。
展开
首先,从8张卡片中抽出两张的组合有c82(是组合数哈)=8*7/2=28(种)要想抽到1,我们就先把1抽出来,然后再从剩下的7张卡片中抽出一张即可,组合数有:c71=7(种)所以,能抽到1的概率就为:7/28=1/4
本回答由提问者推荐已赞过已踩过你对这个回答的评价是?评论
收起P=C(1,7)/C(2,8)=7/28=1/4学排列组合没?C7 1的格式打不出来啊
你如果学了就会懂了 我就先假装你学了哈。答案是C7 1 除以C 8 2,结果为1/4收起
更多回答(1)

第一,出现单双数的概率(比方9,33,35为单,2,16,44为)占据50%第二,出现大小数的概率(比方1-25为小,26-50为大)也是占50%那么这两种概率对比的话,...
第一,出现单双数的概率(比方9,33,35为单,2,16,44为)占据50%第二,出现大小数的概率(比方1-25为小,26-50为大)也是占50%那么这两种概率对比的话,出现哪种概率高,个人认为第一种概率大,但是朋友不相信,求人分析一下
展开
1到50共有50个数字,其中有25个奇数和25个偶数。因此抽到奇数或者偶数的概率都是25/50 = 1/2如果认为1~25是小数字,其余为大数字,则共有25个小数字和25个大数字,抽到小数字和大数字的概率也都是25/50 = 1/2已赞过已踩过你对这个回答的评价是?评论
收起推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询下载百度知道APP,抢鲜体验使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。扫描二维码下载

我要回帖

更多关于 数字随机抽取 的文章

 

随机推荐