線形代数I/行列の階数 のバックアップ差分(No.7)

更新


  • 追加された行はこの色です。
  • 削除された行はこの色です。
[[線形代数I]]

#contents

培風館「教養の線形代数(五訂版)」に沿って行っている授業の授業ノート(の一部)です。

* 階段行列 [#h48fd710]
* 2.3 変形定理(掃き出しの定理)・階段行列 [#h48fd710]

[[線形代数I/連立一次方程式]] でやったように、
任意の行列 &math(A); に対してガウスの消去法を適用することで、
例えば以下のような形に変形できる。(*は任意の数値)

&math(A\sim\begin{bmatrix}0&1&*&0&*&*&0&*\\0&0&0&1&*&*&0&*\\0&0&0&0&0&0&1&*\\0&0&0&0&0&0&0&0\\0&0&0&0&0&0&0&0\\\end{bmatrix});

行に対する基本変形により「これ以上掃き出せない」このような行列を「階段行列」と呼ぶ。

一般形は、

&math(\left[\begin{array}{c@{\,}c@{\,}ccc@{\,}c@{\,}ccc@{\,}c@{\,}cccccc@{\,}c@{\,}c}0&\cdots&0&1&*&\cdots&*&0&*&\cdots&*&0&*&{\ \ \ \ \ \ \ \ \ \ \ }&0&*&\cdots&*\\\vdots&&\vdots&0&0&\cdots&0&1&*&\cdots&*&0&*&&\vdots&\vdots&&\vdots\\\vdots&&\vdots&\vdots&\vdots&&\vdots&0&0&\cdots&0&1&*&\cdots&\vdots&\vdots&&\vdots\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&0&0&&\vdots&\vdots&&\vdots\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&&\vdots\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&0&\vdots&&\vdots\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&1&*&\cdots&*\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&\cdots&0&0&\cdots&0\\\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots&\vdots&&\vdots\\0&\cdots&0&0&0&\cdots&0&0&0&\cdots&0&0&0&&0&0&\cdots&0\\\end{array}\right]);

である。

* 階段行列の形 [#hb2834aa]
また、ガウスの消去法で用いる

+ ある行を定数倍(&math(\neq 0);)する
+ ある行を定数倍して別の行に加える
+ ある行を別の式を入れ替える

の3つの操作を、「行に対する基本変形」と呼ぶ。

** 階段行列の形 [#hb2834aa]

- 掃き出せた列
-- 左の列よりも1つ段を上がる
-- 1が一つあって、後は0
- 掃き出せなかった列
-- 左の列より段は上がらない

任意の行列を「行に対する基本変形」により階段行列にできる~
→ 行列の階段化

* 基本変形を表す行列 [#n979851f]
* 2.2 基本変形を表す行列(基本行列) [#n979851f]

行に対する3つの基本変形を、行列のかけ算で表すことができる。

** i 行目を c 倍する ( c ≠ 0 ) [#g727c5f5]

&math(P_i(c) = \left[\begin{array}{ccccccc}1&&&&&&\\&\ddots&&&&0&\\&&1&&&&\\&&&c&&&\\&&&&1&&\\&0&&&&\ddots&\\&&&&&&1\end{array}\right]);

は、単位行列の i 行目を c 倍した行列~
単位行列の (i,i) 要素が c になっている。

対象の行列に左から &math(P_i(c)); を掛けることで基本変形が行われる。

例:&math(P_3(2)A=\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}\begin{bmatrix}a&b\\c&d\\e&f\end{bmatrix}=\begin{bmatrix}a&b\\c&d\\2e&2f\end{bmatrix});

ここで &math(P_i(c)^{-1}=P_i(1/c)); であるから、 &math(P_i(c)); は正則である。(&math(c\ne 0);)

例:&math(P_3(2)P_3(1/2)=\begin{bmatrix}1&0&0\\0&1&0\\0&0&2\end{bmatrix}\begin{bmatrix}1&0&0\\0&1&0\\0&0&1/2\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}); 逆から掛けても同様。

** i 行目に j 行目の c 倍を加える [#y2269bc7]

&math(P_{ij}(c) = \left[\begin{array}{ccccc}1&&&&0\\&\ddots&&&\\&&\ddots&c&\\&&&\ddots&\\0&&&&1\end{array}\right]);

は、単位行列の i 行目に j 行目の c 倍を加えた行列~
単位行列の(i,j)要素が c になっている。

対象の行列に左から &math(P_{ij}(c)); を掛けることで基本変形が行われる。

例:&math(P_{13}(2)A=\begin{bmatrix}1&0&2\\0&1&0\\0&0&1\end{bmatrix}\begin{bmatrix}a&b\\c&d\\e&f\end{bmatrix}=\begin{bmatrix}a+2e&b+2f\\c&d\\e&f\end{bmatrix});

ここで &math(P_{ij}(c)^{-1}=P_{ij}(-c)); であるから、 &math(P_{ij}(c)); は正則である。

例:&math(P_{13}(2)P_{13}(-2)=\begin{bmatrix}1&0&2\\0&1&0\\0&0&1\end{bmatrix}\begin{bmatrix}1&0&-2\\0&1&0\\0&0&1\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}); 逆から掛けても同様。

** i 行目と j 行目を入れ替える [#la920c65]

&math(P_{ij} = \left[\begin{array}{ccccccc}1&&&&&&\\&\ddots&&&&0&\\&&0&&1&&\\&&&\ddots&&&\\&&1&&0&&\\&0&&&&\ddots&\\&&&&&&1\end{array}\right]);

は、単位行列の i 行目に j 行目を入れ替えた行列~
単位行列の(i,i), (j,j)要素が 0 になり、(i,j), (j,i) 要素が 1 になっている。

対象の行列に左から &math(P_{ij}); を掛けることで基本変形が行われる。

例:&math(P_{23}A=\begin{bmatrix}1&0&0\\0&0&1\\0&1&0\end{bmatrix}\begin{bmatrix}a&b\\c&d\\e&f\end{bmatrix}=\begin{bmatrix}a&b\\e&f\\c&d\end{bmatrix});

ここで &math(P_{ij}^{-1}=P_{ij}); であるから、 &math(P_{ij}); は正則である。

例:&math(P_{23}P_{23}=\begin{bmatrix}1&0&0\\0&0&1\\0&1&0\end{bmatrix}\begin{bmatrix}1&0&0\\0&0&1\\0&1&0\end{bmatrix}=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix});

** 基本行列・左基本変形 [#n45a17bb]

このように、行に対する基本変形は、「ある正則行列」を左から掛けることと同一視できる。

そこで、「行に対する基本変形」を「左基本変形」とも呼ぶ。~
(後に出てくる「列に対する基本変形」を「右基本変形」と呼ぶ)

「ある正則行列」は上で見た &math(P_i(c));、&math(P_{ij}(c));、&math(P_{ij}); のいずれかであり、
これらの行列は「基本行列」と呼ばれる。

・「基本行列」は正則である

* 行列で表した掃出しの定理 [#d59a814a]
* 2.3 行列で表した掃出しの定理(定理2.2 変形定理) [#d59a814a]

・任意の行列 &math(A); に、左から基本行列を複数掛けることで、階段行列に変形できる。

&math(P_kP_{k-1}\cdots P_2P_1A=); (階段行列)
&math(P_kP_{k-1}\cdots P_2P_1A=(階段行列));

&math(P_kP_{k-1}\cdots P_2P_1=P); と置けば、&math(P); は正則なので(∵ &math(P^{-1}=P_1^{-1}P_2^{-1}\cdots P_k^{-1});)

「任意の行列 &math(A); に対して、&math(PA); が階段行列になるような正則 &math(P); が存在する」

と言うこともできる。

後に見るように、そのような &math(P); はただ1つしか無く、
&math(A); を階段化した形 &math(PA); は一意的に決定される。
これは重要な定理であるが、これを証明するには少し準備が必要となる。
この定理は非常に強力であり、以下に見るようにこれを用いて数々の重要な定理を導ける。

以下、少しずつ進めていく。

* 行列の階段化 [#e84747fb]

行列 &math(A); に左から正則行列 &math(P); を掛けて &math(PA); を階段行列にすることを &math(A); を「階段化する」と言う。

* A が正則なら、階段化すると単位行列になる [#t0a8974e]
* ある行列 A を階段化した形は一意に決定される (定理2.11) [#r407ed63]

すなわち階段化の手順は複数ある物の、最終的な階段行列の形は手順に依らない。

「任意の行列 &math(A); に対して、&math(PA); が階段行列になるような正則 &math(P); が''ただ一つ''存在し、階段行列 &math(PA); は一意に定まる」

この定理は重要であるが、時間の都合で割愛する。~
教科書では 定理2.11 として扱われており、その証明は面倒なだけで非常に初等的である。

* A が正則なら、階段化すると単位行列になる(定理2.6の一部) [#t0a8974e]

単位行列は階段行列の一種であることに注意せよ。

さて、正則行列とは逆行列を持つ正方行列であった。

&math(A); を階段化して &math(PA=X); となったとしよう。

&math(A); も &math(P); も正則なので &math(X); も正則である。(∵&math(X^{-1}=A^{-1}P^{-1});)

正則な階段行列は単位行列しかない。

なぜなら、正方行列では
- 全ての列が掃き出されれば単位行列となる
- 掃き出されない列が1つでもあると、最後の行がゼロになる~
→ ゼロ行ベクトルを含む行列は正則行列になり得ない

したがって、&math(A); が正則なら、階段化すると &math(PA=I); となる。

** (補題) ゼロ行ベクトルを含む行列は正則行列になり得ない [#xfa76cc6]

&math(A); の &math(k); 行目がゼロだとすると、
任意の &math(B); について &math(AB); の &math(k); 行目もゼロになってしまう。

&math(AB=\begin{bmatrix}\cdots&\cdots&\cdots\\\cdots&\cdots&\cdots\\0&\cdots&0\\\cdots&\cdots&\cdots\end{bmatrix}B=\begin{bmatrix}\cdots&\cdots&\cdots\\\cdots&\cdots&\cdots\\0&\cdots&0\\\cdots&\cdots&\cdots\end{bmatrix});

したがって、任意の &math(B); について &math(AB\ne I); で、
&math(A); は逆行列を持たない。

* A, B が正方行列の時、AB = I なら BA = I である [#za525b69]
* A, B が正方行列の時、AB = I なら BA = I である (2章問6) [#za525b69]

&math(A); を対角化して &math(PA=X); となったとする。
&math(A); を階段化して &math(PA=X); となったとする。

&math(PAB&=(PA)B=XB\\&=P(AB)=PI=P);~
より

&math(XB=P);

&math(X); は正方なので、もし単位行列でなければ最終行がゼロになる。
&math(X); は階段行列でかつ正方行列なので、もし単位行列でなければ最終行がゼロになる。

&math(X); がゼロ行ベクトルを含む場合、&math(XB); の同じ行がゼロとなり、
&math(P); が正則であるとの条件と矛盾する。

したがって、&math(X); は単位行列である &math(X=I);

すると、&math(XB=IB=B=P); となり、

&math(BA=I); を得る。

つまり、&math(AB=I); であれば、&math(B=A^{-1}); である。

(&math(A^{-1}); の定義は、&math(AA^{-1}=I); と &math(A^{-1}A=I); 
が両方成り立たつことであった。)

* A が正則ならば、A を基本行列の積で表すことができる [#m1920bc7]
* A が正則ならば、A を基本行列の積で表すことができる (定理2.7) [#m1920bc7]

&math(A); を階段化すれば &math(PA=I);

すなわち &math(P=P_k\cdots P_1=A^{-1}); であるから、、

&math(A=P_1^{-1}\cdots P_k^{-1}); と表せる。

基本行列の逆行列は基本行列であり、これは &math(A); 
を基本行列の積として表したことになる。

** 逆行列の求め方 [#w803fe41]

上記考察から、&math(A); が正則であるとき、&math(A); を階段化して
&math(PA=I); と書いた時の &math(P); が逆行列となる。

これを利用して、&math(A); と &math(I); を並べた行列を階段化すれば、

&math(\begin{bmatrix}A&I\end{bmatrix}\sim \begin{bmatrix}PA&P\end{bmatrix}\sim \begin{bmatrix}I&A^{-1}\end{bmatrix});

となり、左側が単位行列になった時、右側に逆行列が得られる。

** 逆行列の求め方(別の見方) [#g4d9e650]

&math(A\bm x=\bm e_1);~
&math(A\bm x=\bm e_2);~
...~
~
&math(A\bm x=\bm e_n);~

を全て解き、その解 &math(\bm x_1, \bm x_2, \cdots, \bm x_n); を横に並べれば、

&math(A\begin{bmatrix}\bm x_1&\bm x_2&\hdots&\bm x_n\end{bmatrix}=\begin{bmatrix}A\bm x_1&A\bm x_2&\hdots&A\bm x_n\end{bmatrix}=\begin{bmatrix}\bm e_1&\bm e_2&\hdots&\bm e_n\end{bmatrix}=I);

となり、これが &math(A^{-1}); となる。

これをまとめて解いているのが上記の方法と見ても良い。

* ある行列 A を階段化した形は一意に決定される [#r407ed63]

この定理は重要であるが、時間の都合で割愛する。

教科書では 定理2.11 として扱われており、その証明はここまでの内容のみを使って行われる。

* 行列の階数 [#o8ed4035]

行列 &math(A); を正則行列 &math(P); を用いて

&math(PA = ); (階段行列)

の形に階段化した際の、階段行列の段数(ゼロでない行数)を「&math(A); の階数」と呼び、

&math({\rm rank}A);

と表す。

すぐ分かるように、
- &math({\rm rank}A); は「掃き出しの行えた数」である

- &math({\rm rank}A\le ); ( A の列数 )
- &math({\rm rank}A\le ); ( A の行数 )

- &math(n);次の正方行列 &math(A); に対して、以下の3つは同値な条件
-- &math(A); は正則
-- &math(PA=I_n);
-- &math({\rm rank}A=n);

- &math(B); が正則なら &math({\rm rank}BA={\rm rank}A);

∵&math(A);を階段化する正則行列&math(P);に対して、~
&math((PB^{-1})BA=PA);は階段行列であり、&math(BA);と&math(A);との階段行列は等しい

** 転置により rank は変化しない [#beb5d621]

この定理を証明するために、教科書では行列の標準形の概念を導入しているが、ここでは割愛する。

- &math({\rm rank}\,{}^t\!\!A={\rm rank}\,A); (定理2.13)

この定理から、&math(B);、&math(C); が正則なとき、
- &math({\rm rank}\,BAC={\rm rank}\,A);

つまり、行列 &math(A); に左右どちらから正則行列を掛けても rank は変化しないことが導かれる。

∵ &math(\rank BAC=\rank AC=\rank \transpose (AC)=\rank (\transpose C \transpose A)=\rank \transpose A=\rank A);~

** 行列の積により rank が減ることはあっても増えることはない [#f3032696]

定理2.13
- &math({\rm rank}\,BA\le{\rm rank}\,A);
- &math({\rm rank}\,BA\le{\rm rank}\,B);

これも重要な定理であるが、証明は割愛して結果のみを示す。

この定理から2つの重量な定理を導いておく。

** 逆行列を持つのは正方行列に限る [#zdedb319]

&math(A); の逆行列 &math(A^{-1}); とは、
&math(AA^{-1}=I);、&math(A^{-1}A=I); を満たす行列として定義された。

&math(A); を &math(m\times n);行列、~
&math(B); を &math(n\times m);行列とすれば、~
&math(m\ne n); であっても、~
&math(m);次正方行列 &math(AB); と~
&math(n);次正方行列 &math(BA); はどちらも定義される。~
しかし、この両方が単位行列になることはありえない。

∵ &math(m<n); のとき、~
&math({\rm rank}\,A\le m);~
&math({\rm rank}\,B\le m);~
より、~
&math({\rm rank}\,BA\le m); ~
である。

一方、&math(n);次単位行列 &math(I_n); の rank は &math(n); だから、
&math(BA=I_n); となることはありえない。

注)&math(m<n); のとき、&math(AB=I_m); となることはあり得る。

例:&math(\begin{bmatrix}1&0&0\\0&1&0\end{bmatrix}\begin{bmatrix}1&0\\0&1\\0&0\end{bmatrix}=\begin{bmatrix}1&0\\0&1\end{bmatrix});

** 正方行列の積が正則であれば、元の行列も正則である [#s001bd94]

&math(n); 次正方行列 &math(A,B); があり、&math(A); が正則でないとする。

すなわち &math({\rm rank}\,A<n);

すると、&math({\rm rank}\,AB\le{\rm rank}\,A<n); となり、&math(AB); も正則でない。

したがって、正方行列 &math(A_1, A_2, \cdots, A_k); の積
&math(A_1 A_2 \cdots A_k); が正則であるなら、元の全ての行列が正則である。

すなわち、正方行列 &math(A_1, A_2, \cdots, A_k); について、次の2つの条件は同値である。
- &math(A_1, A_2, \cdots, A_k); がすべて正則
- &math(A_1 A_2 \cdots A_k); が正則

これらと、次の2つの条件とを比べてみると良い。
- &math(a_1, a_2, \cdots, a_k); がすべてゼロでない
- &math(a_1 a_2 \cdots a_k); がゼロでない

* 行列の階数と連立一次方程式の解 [#r53ca169]

&math(\begin{bmatrix}A&\bm b\end{bmatrix}\sim\begin{bmatrix}PA&P\bm b\end{bmatrix});

で、右辺が階段行列になったとする。~
このとき、&math(PA); も階段行列化されていることに注意。

- &math({\rm rank}\,A<{\rm rank}\,\begin{bmatrix}A&\bm b\end{bmatrix}); ならば
最後の行まで掃き出せてしまい、解なしとなる
- &math({\rm rank}\,A={\rm rank}\,\begin{bmatrix}A&\bm b\end{bmatrix}); ならば
(A の列数)−(rank A) だけパラメータが入った一般解を得る

&math(\bm x=\bm x_0+k_1\bm x_1+k_2\bm x_2+k_3\bm x_3+\cdots);

** 解の自由度 [#rcc4e5a5]

一般解中のパラメータの数を「解の自由度」と呼ぶ。

自由度 = (A の列数)−(rank A)

このように、解の自由度は &math(\bm b); によらず、&math(A); によってのみ決まる。

** 斉次方程式と非斉次方程式 [#pcfa889a]

斉次の「斉」は、一斉とか校歌斉唱とかの斉で、そろっているという意味。

斉次方程式とは、変数の次数がそろっているということで、
今の場合1次方程式なので、0次項がないということ。

- &math(A\bm x=\bm o); は斉次方程式
- &math(A\bm x=\bm b); は非斉次方程式 &math((\bm b\ne \bm o));

*** 斉次方程式の解 [#d82c1b4e]

斉次連立一次方程式 &math(A\bm x=\bm o); は「自明な解」&math(\bm x=\bm o); を持つ。

&math({\rm rank}\,A); が &math(A); の列数より小さければ、自由度が1以上となり、自明な解以外にも解を持つ。

*** 非斉次方程式の解 [#q447dcd7]

斉次方程式 &math(A\bm x=\bm o); の一般解を &math(\bm x_0); とし、~
非斉次方程式 &math(A\bm x=\bm b); の一つの特殊解を &math(\bm x^*); とすると、~
&math(\bm x=\bm x^*+\bm x_0); は非斉次方程式 &math(A\bm x=\bm b); の一般解となる。

∵&math(A\bm x=\bm b=A\bm x^*); ならば、~
&math(A(\bm x-\bm x^*)=\bm o); だから、~
&math(\bm x=\bm x^*+\bm x_0);

すなわち、非斉次方程式の特殊解に斉次方程式の一般解を加えることで非斉次方程式の一般解を作ることができる。

* コメント [#y1cc64e2]

#article_kcaptcha


Counter: 75505 (from 2010/06/03), today: 3, yesterday: 0