Probability
該筆記參考
Axiom
0≤P(A)≤1
P(Ω)=1∣Ω=total sample space
When A1,A2,⋯,An are independent
P(A1∪A2∪⋯∪An)=P(A1)+P(A2)+⋯+P(An)
Conditional Probability
P(A∣S)=P(S)P(A∩S)
P(A∩S)=P(A∣S)P(S)
Independent
P(A∩B)=P(A)P(B)
P(A∣B)=P(A)
Bayes Theorem
最終的 Bayes theorem formula
Example
Expectation and Variance
Bernoulli distribution
證明 independent X, Y 時兩大公式
Binomial Distribution
Expectation and Variance of Binomial Distribution
Poisson Distribution
每個微小時段可視為一個 Bernoulli (有發生或沒有發生)
the probability function of a Poisson distribution
Normal Distribution
Probability density function, PDF
給定範圍 [a, b] 且 a < b,那麼一個隨機連續變量 X 的機率將滿足
這稱為概率密度方程 (probability density function, PDF)
在 a ∼ b 區間內的積分,就是這個連續變量在這個區間內取值的概率
Normal Distribution
當數據 X 符合 normal distribution,通常會用 exp 和 var 來描述
他的 probability density function 可表示為
Standard Normal Distribution
他的 probability density function 可表示為
他有 95% 的面積在 standard deviation -1.96 至 1.96 區間
任何 normal distribution 都可以正規化成 standard,利用以下公式
Central Limit Theorem
Covariance
所以當兩變數互相影響、不為獨立時,Variance 的算法如下
注意 : Covariance 只能評價 X, Y 之間的 linear assoication
以下有一些 covariance 的 properties
Correlation
Covariance 的大小波動不穩定,會被各自數值、單位影響
可以除以各自標準差 (standardization),得到相關係數 Corr (-1 to 1)
the Central Limit Theorem
簡而言之,只要樣本數夠大, Sampling distribution 的分布會服從於 Normal distribution
Binomial Distribution with Central Limit Theorem
所以可以運用 Central Limit Theorem
P(A∩S)=P(A∣S)P(S)=P(S∣A)P(A) P(S∣A)P(A)⇒P(S∣A)=P(A∣S)P(S)=P(A)P(A∣S)P(S) P(A)=P(A∩S)+P(A∩Sˉ)=P(A∣S)P(S)+P(A∣Sˉ)P(Sˉ) P(S∣A)=P(A∣S)P(S)+P(A∣Sˉ)P(Sˉ)P(A∣S)P(S) 20% 吸菸 P(S)=0.2
吸菸有 9% 有氣喘 P(A∣S)=0.09
不吸菸有 7% 有氣喘 P(A∣Sˉ)=0.07
Find P(S∣A)
P(S∣A)=P(A∣S)P(S)+P(A∣Sˉ)P(Sˉ)P(A∣S)P(S)=0.09⋅0.2+0.07⋅0.80.09⋅0.2=0.24 求取一組 Discrete Random Variables X 的期望 (均值)
將所有 X 的值和對應機率相乘後求和,也會用 μ 表示
E(X)=∑xx⋅P(X=x)
Var(X)=E((X−μ)2)∣μ=E(x)
Var(X)=E(X2)−E(X)2
Var(X+b)=Var(X)
Var(aX)=a2Var(X)
Var(aX+b)=a2Var(X)
有一個 X = 2 ramdom variables {0,1}
E(X)=x∑x⋅P(X=x)=1⋅P+0⋅(1−P)=P X 的 Var 為 (x=x2)
Var(X)=E[X2]−E[X]2=E[X]−E[X]2=P−P2=P(1−P) E(XY)=E(X)E(Y)
E(XY)=x∑y∑xyP(X=x,Y=y)=x∑y∑xyP(X=x)P(Y=y)=x∑xP(X=x)y∑yP(Y=y)=E(X)E(Y) Var(X+Y)=Var(X)+Var(Y)
Var(X+Y)=E((X+Y)2)−E(X+Y)2=E(X2+2XY+Y2)−(E(X)+E(Y))2=E(X2)+E(Y2)+2E(XY)−E(X)2−E(Y)2−2E(X)E(Y)=E(X2)−E(X)2+E(Y2)−E(Y)2=Var(X)+Var(Y) 通常是 n 次成功率 P 的實驗,他成功的次數
success in n independent Bernoulli trials
若 X 符合二項分布,記為 X∼Binomial(n,P)
P(X=x)=(xn)Px(1−P)n−x∣for x=1,2,⋯,n 期望值就會等於 X 滿足 X∼Binomial(n,P)
用 Xi,i=1,2,⋯n 標記每個獨立通過實驗的 X
E(X)=E(i=1∑nXi)=E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn)=i=1∑nE(Xi)=i=1∑nP=nP Var(X)=Var(i=1∑nXi)=Var(X1+X2+⋯+Xn)=Var(X1)+Var(X2)+⋯+Var(Xn)=i=1∑nVar(Xi)=i=1∑nP(1−P)=nP(1−P) 期望在該時間的發生次數是 E(X)=λT
用微分想像 T 有 n 個時段,n→∞ 的每個微小時段都發生一次事件
整個 T 發生事件可視為 Binomial distribution
X∼Poisson(μ=λT) P(X=x)→x!μxe−μ Var(X)=μ P(a≤X≤b)=∫abf(x)dx ∫−∞∞f(x)dx=1 E(X)=∫−∞∞x⋅f(x)dx Var(X)=∫−∞∞(x−μ)2f(x)dx X∼N(μ,σ2) f(x)=2πσ21e(−2σ2(x−μ)2) Expectation E(x)=μ
Variance Var(x)=σ2
Normal distribution with μ=0,σ2=1 時稱之
記為 Z∼N(0,1)
f(x)=2π1e−2z2 Z=σX−μ Var(X+Y)=Var(X)+Var(Y)
Var(X+Y)=E[((X+Y)−E(X+Y))2]=E[((X+Y)−(E(X)+E(Y)))2]=E[(X−E(X))−(Y−E(Y))2]=E[(X−E(X))2+(Y−E(Y))2+2(X−E(X))(Y−E(Y))]=Var(X)+Var(Y)+2E[(X−E(X))(Y−E(Y))] 後面多出來的 E[(X−E(X))(Y−E(Y))] 稱為 Covariance (協方差)
Cov(X,Y)=E[(X−E(X))(Y−E(Y))] Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y) Cov(X,X)=Var(X)
Cov(X,Y)=Cov(Y,X)
Cov(aX,bY)=abCov(X,Y)
Cov(X+Y,X−Y)=Var(X)−Var(Y)
X,Y independent→Cov(X,Y)=0 (no vice versa)
Corr(X,Y)=SD(X)SD(Y)Cov(X,Y)=Var(X)Var(Y)Cov(X,Y) 當你有數量為 n 的樣本,其 sampling distribution 為 Xˉn
當樣本數增加 n→∞,會接近 normal distribution
Xˉn∼N(μ,nσ2) i=1∑nXi∼N(nμ,nσ2) 二項分布要解決 n→∞ 得到 X∼Binomial(n,P)
X∼N(nP,nP(1−P)) n>20 AND nP>5 AND n(1−P)>5