二項分布/二項式分布/Binomial Distribution
- 二項分布屬於離散型確率分布
- 只做一次的二項分布就是伯努利試驗(Bernoulli trial)
\(P(X=x)=C_{x}^{n}p^x(1-p)^{n-x} \quad (x=0,1,2,...,n)\)
1. \(C_{x}^{n}\)可以想成從n個裡面取x個當作成功的案例(P=1)。
2. 也可以也想成重複排列。
例: 5個硬幣3正2反的情況為OOOXX,那用1.的想法就是5個硬幣選3個當正面,
\(C_{3}^{5}=\frac{5 \times 4 \times 3}{3 \times 2 \times 1}\)。用2.的想法就是\(\frac{5!}{3!2!}還是=C_{3}^{5}\)
二項分布的性質
- 隨機變數\(X\)會遵守二項分布\(B(n,p)\)
- X的平均\(\mu=np\)
- X的分散\(\sigma^2=np(1-p)\)
- X的標準偏差\(\sigma=\sqrt{np(1-p)}\)
- \(P(X=3)=C_3^50.2^3(1-0.2)^2=0.0512\)
- \(\mu =np=5 \times 0.2=1\)
- \(\sigma^2=np(1-p)=5 \times 0.2 \times 0.8=0.8\)
- \(\sigma=\sqrt{0.8}=0.89\)
正規分布/常態分布(高斯分布)/Normal Distribution
- 正規分布屬於連續型確率分布
- 就是說\(P(X=x)\)不會剛好有對應的值,而是用範圍表示
- 用\(f(x) \ge 0\)表示全體分布
- \(f(x)\)為\(X\)的確率密度関数/機率密度函數/Probability Density Function (PDF)
- 連續型確率変数\(X\)在區間\([a,b]\)的機率為\(P(a \le X \le b)\)
- \(\int_{-\infty }^{\infty}f(x)dx=1\) (全部機率合起來是1)
- 在正規分布\(N(\mu , \sigma^2)\)下的PDF: \(f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{\frac{-(x-\mu)^2}{2\sigma^2}} \quad (-\infty \le x \le \infty)\)
- 隨機變數\(X\)出現在
- \((\mu - \sigma,\mu + \sigma)\)的機率為68%
- \((\mu - 2 \sigma,\mu + 2 \sigma)\)的機率為95%
- \((\mu - 3 \sigma,\mu + 3 \sigma)\)的機率為99.7%
正規分布的性質
- 隨機變數\(X\)遵守正規分布\(N(\mu,\sigma^2)\)時,\(Y=aX+b\)則會遵守\(N(a\mu+b,a^2\sigma^2)\)
- 當\(Y=aX+b\)的\(a=\frac{1}{\sigma}, b=\frac{-\mu}{\sigma}\)時,可以看成\(Z=\frac{X-\mu}{\sigma}\)
- 也就是說\(Z\)會遵守平均0,分散1的正規分布\(N(0,1)\) aka 標準正規分布
- \(n\)很大時,遵守\(B(n,p)\)的隨機變數\(X\)可以視為遵守正規分布\(N(np,np(1-p))\)
標準正規分布N(0,1)

用法:
- 假設\(u=1.96, Q(1.96)=P(Z\ge 1.96)=0.0250\)
- 因為對稱的關係,\(P(Z\le -1.96)=P(Z\ge 1.96)=0.0250\)
- \(P(Z\le 1.96)=1-P(Z\ge 1.96)=1-0.0250=0.9750\)
- \(P(|Z|\le 1.96)=P(-1.96\le Z\le 1.96)=1-0.0250\times 2=0.950\)
(就是扣掉最左跟最右的面積)
常用的數值:
- \(P(Z\ge1.28)=0.10\)
- \(P(Z\ge1.645)=0.05\)
- \(P(Z\ge1.96)=0.025\)
- \(P(|Z|\le 1.645)=P(-1.645\le Z\le 1.645)=1-0.05\times2=0.90\)
- \(P(|Z|\le 1.96)=P(-1.96\le Z\le 1.96)=1-0.0250\times 2=0.950\)
一般的正規分布\(N(\mu,\sigma)\)可以標準化後轉到\(N(0,1)\)來算機率~
例題:隨機變數\(X\)遵守正規分布\(N(60,5^2)\)時,求:
- \(P(X\ge68)\)
- \(P(X\le65)\)
- \(P(65\le X\le70)\)
Ans:
- \(P(X\ge68)=P(\frac{X-60}{5}\ge \frac{68-60}{5})=P(X\ge1.6)=0.0548\)
- \(P(X\le65)=P(\frac{X-60}{5}\le \frac{65-60}{5})=P(Z\le1)=1-0.1587=0.8413\)
- \(P(65\le X\le70)=P(\frac{65-60}{5}\le Z\le \frac{70-60}{5})=P(1\le Z\le2)\)
\(=P(Z\ge1)-P(Z\ge2)=0.1587-0.0228=0.1359\)
(大於1小於2的區域就是大於1的區域-大於2的區域~)
二項分布的正規近似
隨機變數\(X\)遵守二項分布\(B(100,0.2)\)時,用正規分布近似來算:
- \(P(X\ge30)\)
- \(P(X\le28)\)
- \(P(16\le X\le24)\)
首先轉成正規分布\(N(np,np(1-p)),\quad (\mu=np, \sigma^2=np(1-p))\)
\(B(100,20)=N(100\times0.2,100\times0.2\times (1-0.2))=N(20,16)=N(20,4^2)\)
- \(P(X\ge30)=P(\frac{X-20}{4}\ge \frac{30-20}{4})=P(Z\ge2.5)=0.0062\)
- \(P(X\le28)=P(\frac{X-20}{4}\le \frac{28-20}{4})=P(Z\le2.0)=1-0.0228=0.9772\)
- \(P(16\le X\le24)=P(\frac{16-20}{4}\le Z \le \frac{24-20}{4})\)
\(=P(-1\le Z \le 1)=P(|Z|<=1)=1-2\times0.1587=0.6826\)