0%

二項分布與正規分布

二項分布/二項式分布/Binomial Distribution

  • 二項分布屬於離散型確率分布
  • 只做一次的二項分布就是伯努利試驗(Bernoulli trial)

\(P(X=x)=C_{x}^{n}p^x(1-p)^{n-x} \quad (x=0,1,2,...,n)\)
1. \(C_{x}^{n}\)可以想成從n個裡面取x個當作成功的案例(P=1)。
2. 也可以也想成重複排列。

例: 5個硬幣3正2反的情況為OOOXX,那用1.的想法就是5個硬幣選3個當正面,
\(C_{3}^{5}=\frac{5 \times 4 \times 3}{3 \times 2 \times 1}\)。用2.的想法就是\(\frac{5!}{3!2!}還是=C_{3}^{5}\)

二項分布的性質

  • 隨機變數\(X\)會遵守二項分布\(B(n,p)\)
    • X的平均\(\mu=np\)
    • X的分散\(\sigma^2=np(1-p)\)
    • X的標準偏差\(\sigma=\sqrt{np(1-p)}\)
    例題: 隨機變數遵守二項分布B(5, 0.2),,求P(X=3)、X的平均、分散跟標準偏差。
    1. \(P(X=3)=C_3^50.2^3(1-0.2)^2=0.0512\)
    2. \(\mu =np=5 \times 0.2=1\)
    3. \(\sigma^2=np(1-p)=5 \times 0.2 \times 0.8=0.8\)
    4. \(\sigma=\sqrt{0.8}=0.89\)

正規分布/常態分布(高斯分布)/Normal Distribution

  • 正規分布屬於連續型確率分布
    • 就是說\(P(X=x)\)不會剛好有對應的值,而是用範圍表示
    • \(f(x) \ge 0\)表示全體分布
      • \(f(x)\)\(X\)的確率密度関数/機率密度函數/Probability Density Function (PDF)
    • 連續型確率変数\(X\)在區間\([a,b]\)的機率為\(P(a \le X \le b)\)
    • \(\int_{-\infty }^{\infty}f(x)dx=1\) (全部機率合起來是1)
    • 在正規分布\(N(\mu , \sigma^2)\)下的PDF: \(f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{\frac{-(x-\mu)^2}{2\sigma^2}} \quad (-\infty \le x \le \infty)\)
    • 隨機變數\(X\)出現在
      • \((\mu - \sigma,\mu + \sigma)\)的機率為68%
      • \((\mu - 2 \sigma,\mu + 2 \sigma)\)的機率為95%
      • \((\mu - 3 \sigma,\mu + 3 \sigma)\)的機率為99.7%

正規分布的性質

  • 隨機變數\(X\)遵守正規分布\(N(\mu,\sigma^2)\)時,\(Y=aX+b\)則會遵守\(N(a\mu+b,a^2\sigma^2)\)
  • \(Y=aX+b\)\(a=\frac{1}{\sigma}, b=\frac{-\mu}{\sigma}\)時,可以看成\(Z=\frac{X-\mu}{\sigma}\)
    • 也就是說\(Z\)會遵守平均0,分散1的正規分布\(N(0,1)\) aka 標準正規分布
  • \(n\)很大時,遵守\(B(n,p)\)的隨機變數\(X\)可以視為遵守正規分布\(N(np,np(1-p))\)

標準正規分布N(0,1)

用法:
  • 假設\(u=1.96, Q(1.96)=P(Z\ge 1.96)=0.0250\)
    • 因為對稱的關係,\(P(Z\le -1.96)=P(Z\ge 1.96)=0.0250\)
  • \(P(Z\le 1.96)=1-P(Z\ge 1.96)=1-0.0250=0.9750\)
  • \(P(|Z|\le 1.96)=P(-1.96\le Z\le 1.96)=1-0.0250\times 2=0.950\)
    (就是扣掉最左跟最右的面積)
常用的數值:
  1. \(P(Z\ge1.28)=0.10\)
  2. \(P(Z\ge1.645)=0.05\)
  3. \(P(Z\ge1.96)=0.025\)
  4. \(P(|Z|\le 1.645)=P(-1.645\le Z\le 1.645)=1-0.05\times2=0.90\)
  5. \(P(|Z|\le 1.96)=P(-1.96\le Z\le 1.96)=1-0.0250\times 2=0.950\)
一般的正規分布\(N(\mu,\sigma)\)可以標準化後轉到\(N(0,1)\)來算機率~

例題:隨機變數\(X\)遵守正規分布\(N(60,5^2)\)時,求:

  1. \(P(X\ge68)\)
  2. \(P(X\le65)\)
  3. \(P(65\le X\le70)\)

Ans:

  1. \(P(X\ge68)=P(\frac{X-60}{5}\ge \frac{68-60}{5})=P(X\ge1.6)=0.0548\)
  2. \(P(X\le65)=P(\frac{X-60}{5}\le \frac{65-60}{5})=P(Z\le1)=1-0.1587=0.8413\)
  3. \(P(65\le X\le70)=P(\frac{65-60}{5}\le Z\le \frac{70-60}{5})=P(1\le Z\le2)\)
    \(=P(Z\ge1)-P(Z\ge2)=0.1587-0.0228=0.1359\)
    (大於1小於2的區域就是大於1的區域-大於2的區域~)
二項分布的正規近似

隨機變數\(X\)遵守二項分布\(B(100,0.2)\)時,用正規分布近似來算:

  1. \(P(X\ge30)\)
  2. \(P(X\le28)\)
  3. \(P(16\le X\le24)\)

首先轉成正規分布\(N(np,np(1-p)),\quad (\mu=np, \sigma^2=np(1-p))\)
\(B(100,20)=N(100\times0.2,100\times0.2\times (1-0.2))=N(20,16)=N(20,4^2)\)

  1. \(P(X\ge30)=P(\frac{X-20}{4}\ge \frac{30-20}{4})=P(Z\ge2.5)=0.0062\)
  2. \(P(X\le28)=P(\frac{X-20}{4}\le \frac{28-20}{4})=P(Z\le2.0)=1-0.0228=0.9772\)
  3. \(P(16\le X\le24)=P(\frac{16-20}{4}\le Z \le \frac{24-20}{4})\)
    \(=P(-1\le Z \le 1)=P(|Z|<=1)=1-2\times0.1587=0.6826\)