Probability
Probability
該筆記參考 醫學統計學
Axiom
0≤P(A)≤1
P(Ω)=1∣Ω=total sample space
When A1,A2,⋯,An are independent
P(A1∪A2∪⋯∪An)=P(A1)+P(A2)+⋯+P(An)
Conditional Probability
P(A∣S)=P(S)P(A∩S)
P(A∩S)=P(A∣S)P(S)
Independent
P(A∩B)=P(A)P(B)
P(A∣B)=P(A)
B 無法提供任何訊息給 A
Bayes Theorem
用於條件互調
已知
P(A∩S)=P(A∣S)P(S)=P(S∣A)P(A)所以
P(S∣A)P(A)⇒P(S∣A)=P(A∣S)P(S)=P(A)P(A∣S)P(S)另外已知
P(A)=P(A∩S)+P(A∩Sˉ)=P(A∣S)P(S)+P(A∣Sˉ)P(Sˉ)最終的 Bayes theorem formula
P(S∣A)=P(A∣S)P(S)+P(A∣Sˉ)P(Sˉ)P(A∣S)P(S)
Example
20% 吸菸 P(S)=0.2
吸菸有 9% 有氣喘 P(A∣S)=0.09
不吸菸有 7% 有氣喘 P(A∣Sˉ)=0.07
有一個氣喘人出現,他有抽菸的機率是多少
Find P(S∣A)
Expectation and Variance
Expectation
求取一組 Discrete Random Variables X 的期望 (均值)
將所有 X 的值和對應機率相乘後求和,也會用 μ 表示
E(X)=∑xx⋅P(X=x)
Variance
衡量一組數據變化幅度
Var(X)=E((X−μ)2)∣μ=E(x)
也可以寫成
Var(X)=E(X2)−E(X)2
Variance 有一些性質
Var(X+b)=Var(X)
Var(aX)=a2Var(X)
Var(aX+b)=a2Var(X)
Bernoulli distribution
有一個 X = 2 ramdom variables {0,1}
兩個變數是 independent
假設取 1 的機率有 P
X 期望值為
E(X)=x∑x⋅P(X=x)=1⋅P+0⋅(1−P)=PX 的 Var 為 (x=x2)
Var(X)=E[X2]−E[X]2=E[X]−E[X]2=P−P2=P(1−P)
證明 independent X, Y 時兩大公式
E(XY)=E(X)E(Y)
Var(X+Y)=Var(X)+Var(Y)
Binomial Distribution
通常是 n 次成功率 P 的實驗,他成功的次數
success in n independent Bernoulli trials
若 X 符合二項分布,記為 X∼Binomial(n,P)
第 x 次實驗的機率寫為
P(X=x)=(xn)Px(1−P)n−x∣for x=1,2,⋯,n
Expectation and Variance of Binomial Distribution
期望值就會等於 X 滿足 X∼Binomial(n,P)
用 Xi,i=1,2,⋯n 標記每個獨立通過實驗的 X
計算 Variance
Poisson Distribution
事件在時間 T 發生 λ 次
期望在該時間的發生次數是 E(X)=λT
用微分想像 T 有 n 個時段,n→∞ 的每個微小時段都發生一次事件
每個微小時段可視為一個 Bernoulli (有發生或沒有發生)
整個 T 發生事件可視為 Binomial distribution
若 X 代表一次事件發生經過的所有時間段
當 X 符合泊松分佈時
X∼Poisson(μ=λT)the probability function of a Poisson distribution
P(X=x)→x!μxe−μExpectation of poisson
E(X)=μVariance of poisson
Var(X)=μ
Normal Distribution
Probability density function, PDF

給定範圍 [a, b] 且 a < b,那麼一個隨機連續變量 X 的機率將滿足
P(a≤X≤b)=∫abf(x)dx這稱為概率密度方程 (probability density function, PDF)
在 a ∼ b 區間內的積分,就是這個連續變量在這個區間內取值的概率
整個範圍的面積等於 1
∫−∞∞f(x)dx=1Expectation
E(X)=∫−∞∞x⋅f(x)dxVariance
Var(X)=∫−∞∞(x−μ)2f(x)dx
Normal Distribution
當數據 X 符合 normal distribution,通常會用 exp 和 var 來描述
X∼N(μ,σ2)他的 probability density function 可表示為
f(x)=2πσ21e(−2σ2(x−μ)2)Expectation E(x)=μ
Variance Var(x)=σ2
Standard Normal Distribution
Normal distribution with μ=0,σ2=1 時稱之
記為 Z∼N(0,1)
他的 probability density function 可表示為
f(x)=2π1e−2z2他有 95% 的面積在 standard deviation -1.96 至 1.96 區間
任何 normal distribution 都可以正規化成 standard,利用以下公式
Z=σX−μ
Central Limit Theorem
Covariance
還記得兩個獨立變數的 variance 可以拆開
Var(X+Y)=Var(X)+Var(Y)
若兩個變數互相會影響時 :
Var(X+Y)=E[((X+Y)−E(X+Y))2]=E[((X+Y)−(E(X)+E(Y)))2]=E[(X−E(X))−(Y−E(Y))2]=E[(X−E(X))2+(Y−E(Y))2+2(X−E(X))(Y−E(Y))]=Var(X)+Var(Y)+2E[(X−E(X))(Y−E(Y))]後面多出來的 E[(X−E(X))(Y−E(Y))] 稱為 Covariance (協方差)
Cov(X,Y)=E[(X−E(X))(Y−E(Y))]所以當兩變數互相影響、不為獨立時,Variance 的算法如下
Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)注意 : Covariance 只能評價 X, Y 之間的 linear assoication
以下有一些 covariance 的 properties
Cov(X,X)=Var(X)
Cov(X,Y)=Cov(Y,X)
Cov(aX,bY)=abCov(X,Y)
Cov(X+Y,X−Y)=Var(X)−Var(Y)
X,Y independent→Cov(X,Y)=0 (no vice versa)
Correlation
Covariance 的大小波動不穩定,會被各自數值、單位影響
可以除以各自標準差 (standardization),得到相關係數 Corr (-1 to 1)
Corr(X,Y)=SD(X)SD(Y)Cov(X,Y)=Var(X)Var(Y)Cov(X,Y)
the Central Limit Theorem
當你有數量為 n 的樣本,其 sampling distribution 為 Xˉn
當樣本數增加 n→∞,會接近 normal distribution
可以寫成
Xˉn∼N(μ,nσ2)或寫成
i=1∑nXi∼N(nμ,nσ2)簡而言之,只要樣本數夠大, Sampling distribution 的分布會服從於 Normal distribution
Binomial Distribution with Central Limit Theorem
二項分布要解決 n→∞ 得到 X∼Binomial(n,P)
因為 n 非常大,計算非常困難
所以可以運用 Central Limit Theorem
X∼N(nP,nP(1−P))n 多少算大
n>20 AND nP>5 AND n(1−P)>5
Last updated