Deriving a method for determining inverses
我們在做 matrix 轉為 reduced row echelon form 的過程中
A=1−11−121−134→100−112−125 其實每個轉換,都是一個 transformation
例如上面消去 row 2 和 row 3 的第一個 element,可以表示成以下的 transformation
Ta1a2a3→a1a2+a1a3−a1 而這個 transformation 又可以表示成 matrix,我們知道可以用 identity matrix 當基底來建立
T(x)=S1xS1=100010001→11−1010001 也就是說,剛剛 A 在消去 row 2 和 row 3 的動作,其實就是
==S1−11S−121S−134S1A11−10100011−11−121−134=100−112−125 我們可以繼續對未完成 reduced row echelon form 的 matrix 進行簡化
100−112−125→100010121 這次的簡化等於
Ta1a2a3→a1+a2a2a3−2a2⇒S2=10011−2001 而這個 S2 apply 在 S1*A 上
S2(S1A)=10011−2001100−112−125=100010121 還是可以繼續化簡第三行
100010121→100010001 Ta1a2a3→a1−a3a2−2a3a3⇒S3=100010−1−21 S3(S2(S1A))=100010−1−21100010121=100010001 可以發現原來 S3 × S2 × S1 的 Product 就是 A 的 inverse matrix
S3S2S1AA−1A=I=I 但其實不用每次找 inverse function / inverse matrix 都搞的這麼麻煩
上面這樣做只是為了了解尋找 inverse matrix 的原理而已
⇒AS1AS2S1AS3S2S1AIIS1IS2S1IS3S2S1IA−1 我們同時對 matrix A 和 identity matrix 做同樣的 row operation transformation
發現當 A 為 invertible 時 (可以變成 Identity matrix),對 I 做相同的簡化運算,可以得到 inverse matrix
[A∣I]→⋯→[I∣A−1] Example of finding matrix inverse
我們實際來運用剛剛發現的方式,尋找 inverse matrix
A=1−11−121−134 首先將 A 和 I 畫在一起
[A∣I]=1−11−121−134100010001 先對 A 清空第一行,同樣的運算一樣 apply 到隔壁的 identity matrix
[S1A∣S1]=100−112−12511−1010001 再來清空第二行
[S2S1A∣S2S1]=10001012121−311−2001 最後是第三行
[S3S2S1A∣S3S2S1]=[I∣A−1]=10001000157−335−2−1−21 如此一來我們就找到 A 的 inverse matrix
A−1=57−335−2−1−21 Formula for 2x2 inverse
我們來找出所有 2 × 2 matrix 的 inverse matrix
A=[acbd]⇒[acbd1001] 首先我們要讓 c 變為 0,等於要對 row vectors 執行底下這個 transformation
T1([c1c2])=[c1ac2−cc1] 第一列保留不變,第二列試著將 c 消為 0
[acbd1001]→[a0bad−bc1−c0a] 接著我們要讓 b 變為 0
T2([c1c2])=[c1(ad−bc)−c2(b)c2] 第二列保留不變,第一列試著將 b 消為 0
[a0bad−bc1−c0a]→[a(ad−bc)0(b)(ad−bc)−(ad−bc)(b)ad−bcad−bc+bc−c−aba]→[a(ad−bc)00ad−bcad−c−aba] 最後我們要讓 A 變為 identity matrix 完成 reduced row echelon form
T3([c1c2])=[a(ad−bc)c1ad−bcc2] 於是我們得到
[a(ad−bc)00ad−bcad−c−aba]→[1001a(ad−bc)ad−ad−bcca(ad−bc)−abad−bca]→[1001ad−bcd−ad−bccad−bc−bad−bca]=[I∣A−1] 我們可以將 inverse matrix 進一步化簡,每個分母都是 ad - bc ,我們將他提出
A−1=[ad−bcd−ad−bccad−bc−bad−bca]=ad−bc1[d−c−ba] 而這個就是所有 2 × 2 matrix 的 inverse matrix
可以記成 d 和 a 互換, b 和 c 變負
但我們知道,只有 matrix 為 invertible 才會有 inverse function
這個公式剛好可以看出 matrix 是否為 invertible
只要公式得出的結果為 undefined ,則 matrix 即為 non-invertible
而關鍵就在於 ad - bc 等於 0 的時候,公式結果即為 undefined
ad−bc=0⟺A is invertible 而這個 ad - bc 有一個名稱,叫作 determinant
det(A)=∣A∣=[acbd]=acbd=ad−bc 所以公式可以再一次簡化
A−1=det(A)1[d−c−ba] det(B)=1324=1×4−3×2=4−6=−2 (invertible)B−1=−21[4−3−21]=[−2231−21] det(C)=1326=1×6−3×2=6−6=0 (non-invertible) 的確,column 2 可以表示為 column 1 * 2
代表他們是 linear dependence,沒辦法 one-to-one,所以為 non invertible,沒有 inverse matrix
3 x 3 determinant
在 generalize determinant 公式前,我們先來試算 3 by 3 matrix 的 determinant
因為我們知道 determinant 很重要,可以快速看出一個 matrix 是否為 invertible
A=a11a21a31a12a22a32a13a23a33 det(A)=a11a22a32a23a33−a12a21a31a23a33+a13a21a31a22a32 看起來很抽象,我們實際操作一個 matrix 看看
C=1242−10431 det(C)=1−10−31−22431+424−10=1⋅(−1)−2⋅(−10)+4⋅(4)=−1+20+16=35 所以 C = invertible
n x n determinant
學會 3 × 3 之後,來試試看 n × n 的格式
An×n=a11a21⋮an1a12⋯⋯⋯⋱⋯a1na2n⋮ann 我們定義一個矩陣 Aij 代表 A 去掉 i row 和 j column 時的樣子
Def: Aij=(n−1)×(n−1) matrix you get if you "ignore" the ith row and the jth column of A 看起來很抽象所以舉個例子
AA11det(A)=1242−10431=[−1031],A12=[2431],A13=[24−10]=a11⋅A11−a12⋅A12+a13⋅A13 接著就可以來定義 n × n 的 determinant:
det(An×n)=a11det(A11)−a12det(A12)+a13det(A13)−+⋯±a1ndet(A1n) 這個定義就是個 recursive definition ,可以一直往下 solve 到 2 × 2 matrix
我們來試個 4 × 4 的例子
1102201332204030=1013220030−2102220030+3102013030−4102013220 接著可以往下 solve 3 × 3 的矩陣,等於
1(02030−21330+01320)−2(12030−20230+00220)+3(11330−00230+00213)−4(11320−00220+20213) 接著就可以解掉 2 × 2 的矩陣了!
1(0+(−2)×(−9)+0)−2(0+(−2)×(−6)+0)+3(1×(−9)−0+0)−4(1×(−6)−0+2×(−2)) 得到答案
==1(18)−2(12)+3(−9)−4(−6−4)18−24−27+407 也就是說,這個矩陣是 invertible 的
Determinants along other rows/cols
其實求 determinant 不是只能展開第一列,可以從任何一列或一行來展開
也就是說我們可以選擇很多 0 的那一列 (行) 來展開
只是我們要注意展開的正負符號
+−+−⋮−+−+⋮+−+−⋮−+−+⋮⋯⋯⋯⋯⋱ 其實就是在前面加上 row 和 column 判斷
(−1)row+column 在第一列第一行的就是正號
(−1)1+1=(−1)2=1 我們以上面的例子來做看看,我們展開第二列,因為有兩個 0
1102201332204030=−1213320430−2102213430 再來第一個 3 × 3 當然展開第三列,第二個我們展開第二列好了
=−1(3×3243)−2(11240−31223) 我們比剛剛更快的還要求到 determinant
=((−1)×3)−(2×(−8+3))=(−3)−(−10)=7 Rule of Sarrus of determinants
這邊還有一個方法可以用來求 3 × 3 的 determinant ,叫作 Rule of Sarrus
我們先將一般的 3 × 3 determinant 求出
adgbehcfi=aehfi−bdgfi+cdgeh=a(ei−fh)−b(di−fg)+c(dh−eg)=aei−afh−bdi+bfg+cdh−ceg=(aei+bfg+cdh)+(−afh−bdi−ceg) 仔細觀察,等於我們將矩陣多畫出兩行,然後將紅色部分 + 藍色部分
一樣來舉個例子
A=1242−1043−1 det(A)=1242−1043−11242−10=(1⋅(−1)⋅(−1))+(2⋅3⋅4)+(4⋅2⋅0)−(4⋅(−1)⋅4)−(1⋅3⋅0)−(2⋅2⋅−1)=1+24+0+16−0+4=45