線形代数I/内積 のバックアップ(No.3)

更新


線形代数I

(カリキュラムと教科書との間のギャップを調整中の内容です)

実数ベクトルの標準内積

\bm a=\begin{bmatrix}a_1\\a_2\\\vdots\\a_n\end{bmatrix} , \bm b=\begin{bmatrix}b_1\\b_2\\\vdots\\b_n\end{bmatrix}\in \mathbb R^n に対して、その標準内積を

(\bm a,\bm b)=a_1b_1+a_2b_2+\dots+a_nb_n=\sum_{i=1}^na_ib_i

として定義する。

実数ベクトルの内積の性質

標準内積について以下の性質を容易に確かめられる。

  1. (\bm a,\bm b)=(\bm b,\bm a)
  2. (\bm a+\bm b,\bm c)=(\bm a,\bm c)+(\bm b,\bm c)
  3. (k\bm a,\bm b)=k(\bm a,\bm b)
  4. (\bm a,\bm a)\ge 0 かつ (\bm a,\bm a)=0 \bm a=\bm o

数学的にはこの4つの性質を持つような任意の演算を「内積」と考えてよい。
すなわち、内積の定義の仕方には標準内積以外にも様々な物がある。

例: (\bm a,\bm b)=a_1b_1+2a_2b_2+\dots+na_nb_n=\sum_{i=1}^nia_ib_i も内積を定義する。

例:すぐには分かりにくいが、2次のベクトルに対して、
(\bm a,\bm b)=a_1b_1+a_1b_2+a_2b_1+2a_2b_2 も内積を定義する。 (確かめてみよ)

以下で見る内積の性質は上記4つの条件のみを使って定義・証明可能であるから、 標準内積だけでなく、任意の内積について成立する。

内積の定義されたベクトル空間を「内積空間」あるいは「計量空間」と呼ぶ。

(複素数ベクトルについては内積の定義が多少異なるが、以下の議論はそのまま成り立つ)

ベクトルのノルム

内積の持つ性質 (\bm a,\bm a)\ge 0 より、任意の \bm a に対して

\|\bm a\|=\sqrt{(\bm a,\bm a)}\ge 0

を定義することができる。これを \bm a のノルム(長さ・大きさ)と呼ぶ。

内積の定義より、 \|\bm a\|=0 \bm a=\bm o の時のみ生じる。

\|\bm a\|^2=(\bm a,\bm a) の書き換えは頻出するので覚えておくように。

シュワルツ (Schwartz) の不等式

|(\bm a,\bm b)|\le\|\bm a\|\|\bm b\| 内積の絶対値は常に大きさの積以下である

(証明)

\|t\bm a+\bm b\|^2

=(t\bm a+\bm b,t\bm a+\bm b)

=(\bm a,\bm a)t^2+(\bm a,\bm b)t+(\bm b,\bm a)t+(\bm b,\bm b)

=\|\bm a\|^2t^2+2(\bm a,\bm b)t+\|\bm b\|^2\ge 0

この2次式が t の値に依らず負にならないためには、 判別式が負でなければならないから、

(\bm b,\bm a)^2-\|\bm a\|^2\|\bm b\|^2\le 0

(\bm b,\bm a)^2\le\|\bm a\|^2\|\bm b\|^2

両者の正の平方根を取れば、

|(\bm a,\bm b)|\le\|\bm a\|\|\bm b\|

与式を得る。

三角不等式

\|\bm a+\bm b\|\le\|\bm a\|+\|\bm b\|  三角形の一辺は他の二辺の和より短い

(証明)

\|\bm a+\bm b\|^2=(\bm a+\bm b,\bm a+\bm b)

=\|\bm a\|^2+2(\bm b,\bm a)+\|\bm b\|^2

<\|\bm a\|^2+2|(\bm b,\bm a)|+\|\bm b\|^2

<\|\bm a\|^2+2\|\bm a\|\|\bm b\|+\|\bm b\|^2

=\left(\|\bm a\|+\|\bm b\|\right)^2

両辺とも正なので、平方根を取れば与式を得る。

ベクトルの為す角

\bm a,\bm b が共にゼロでないとき、シュワルツの不等式より

-1\le\frac{(\bm a,\bm b)}{\|\bm a\|\|\bm b\|}\le1

そこで、

\frac{(\bm a,\bm b)}{\|\bm a\|\|\bm b\|}=\cos \theta

を満たす \theta ただし 0\le\theta\le\pi がただ一つ決まる。

この \theta \bm a,\bm b の「為す角」と呼ぶ。

(「内積」が標準内積でない場合、通常の角度の定義とは異なった物になるが、 以下の議論には影響しない)

ベクトルの直交

\cos \pi/2=0 より、

内積がゼロ ⇔ \theta=\pi/2=90^\circ

である。

そこで、 (\bm a,\bm b)=0 であることを 「 \bm a,\bm b が直交する」と言う。

実は、 \bm a,\bm b の一方または両方がゼロの時もやはり (\bm a,\bm b)=0 となるが、 \theta は定まらない。

だが、この場合も含めて「直交」を定義する。

(\bm a,\bm b)=0  ⇔  \bm a \perp \bm b

すなわち、ゼロベクトル \bm o は全てのベクトルに直交する。

正規化

ゼロでない任意のベクトル \bm a に対して、 \frac{1}{\|\bm a\|}\bm a のノルムは1になる。

このように、ベクトルをその大きさで割ってノルムを1にすることを「正規化」と呼ぶ。

正規ベクトル:ノルムが1のベクトルのこと

正規直交系

ベクトル \bm a_1,\bm a_2,\dots,\bm a_n が正規直交系である、とは

  • すべてノルムが1である \|\bm a_i\|=1 すなわち (\bm a_i,\bm a_i)=1
  • 互いに直交する i\ne j\rightarrow(\bm a_i,\bm a_j)=0

の条件を満たすこと。

  • 条件はまとめて (\bm a_i,\bm a_j)=\delta_{ij} と書ける。
  • 基本ベクトル \bm e_1,\bm e_2,\dots,\bm e_n は正規直交系である

正規直交系は一次独立である

\bm a_1,\bm a_2,\dots,\bm a_n が正規直交系であるとき、

\sum_{k=1}^nc_k\bm a_k=\bm o が成り立つとすると、両辺と \bm a_i との内積を取ることで、

(\bm a_i,\sum_{k=1}^nc_k\bm a_k)

=\sum_{k=1}^nc_k(\bm a_i,\bm a_k)

=\sum_{k=1}^nc_k\delta_{ik}

=c_i=(\bm a_i,\bm o)=0

したがって、すべての i について c_i=0 となることが導かれる。

成分の導出

同様にして、基本ベクトル \bm e_1,\bm e_2,\dots,\bm e_n は正規直交系であるから、

\bm x=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}=\sum_{k=1}^nx_k\bm e_k

のとき、 \bm x \bm e_k との内積を取ることにより、

(\bm e_i,\bm x) =\sum_{k=1}^nx_k(\bm e_i,\bm e_k) =\sum_{k=1}^nx_k\delta_{ik} =x_i

として \bm e_i 方向の成分を求めることができる。

グラム・シュミットの直交化法

線形代数I/要点/(グラム)シュミットの直交化法

直交変換

任意の \bm x,\bm y に対して、

(f(\bm x),f(\bm y))=(\bm x,\bm y)

を満たす一次変換 f(\bm x)\ :\ \mathbb R^n\rightarrow \mathbb R^n を直交変換と呼ぶ。(なぜ直交?の答えは後ほど)

  • 直交変換は \|f(\bm x)\|=\|\bm x\| を満たす。(定義より、ほぼ明らか)
    こちらを直交変換の定義とする場合もある(同値な条件であるため)

練習:

\|f(\bm x)\|=\|\bm x\| から (f(\bm x),f(\bm y))=(\bm x,\bm y) を導こう。

(証明)

条件より \|f(\bm x-\bm y)\|)=\|\bm x-\bm y\|

(左辺)2

=\|f(\bm x)-f(\bm y)\|^2

=\|f(\bm x)\|^2-2(f(\bm x),f(\bm y))+\|f(\bm y)\|^2

=\|\bm x\|^2-2(f(\bm x),f(\bm y))+\|\bm y\|^2

(右辺)2

=\|\bm x\|^2-2(\bm x,\bm y)+\|\bm y\|^2

したがって、 (f(\bm x),f(\bm y))=(\bm x,\bm y)

合同変換

直交変換はすべてのベクトルの長さを保つから、それはすなわち「合同変換」である。
合同変換 = 回転 ( + 反転 )

∵三角形の3辺の長さが等しければ合同であったのを思い出そう。

Rn にて標準内積を取る場合

\|\bm a\|=\sqrt{a_1^2+a_2^2+\dots+a_n^2} である。

また、

(\bm a,\bm b)=a_1b_1+a_2b_2+\dots+a_nb_n=\transpose \bm a\bm b

と書けるから、

(\bm a,A\bm b)=\transpose \bm a(A\bm b)=\transpose (\transpose \,A\bm a)\bm b=(\transpose A\bm a,\bm b)

ここで、 A が対称行列 \transpose A=A であれば、

(\bm a,A\bm b)=(A\bm a,\bm b)

が成り立つ。

直交行列

標準内積を用いた場合、直交変換の標準行列 R は任意の \bm a,\bm b に対して、

(R\bm a,R\bm b)=(\bm a,\transpose R R\bm b)=(\bm a,\bm b)

を満たす。したがって、2つの基本ベクトルに対して

(\bm e_i,\transpose R R\bm e_j)=(\bm e_i,\bm e_j)=\delta_{ij}

となるが、この左辺は行列 \transpose R R の (i,j) 成分に等しい。

すなわち、

\transpose R R=[\delta_{ij}]

であり、 R

[Math Conversion Error]


を満たす。

この条件を満たす R を直交行列と呼ぶ。

  • 直交変換の表現行列は直交行列である

なぜ直交?

直交行列の列ベクトル分解を

R=\Bigg[\bm r_1\ \bm r_2\ \dots\ \bm r_n\Bigg]

と書くと、

\transpose R R=\begin{bmatrix}\hspace{5mm}\bm r_1\hspace{5mm}\\ \bm r_2\\ \vdots\\ \bm r_n\end{bmatrix}\Bigg[\bm r_1\ \bm r_2\ \dots\ \bm r_n\Bigg]=[\bm r_i,\bm r_j]=[\delta_{ij}]

すなわち、直交行列の列ベクトルは正規直交系を為す。

  • 同様に、行ベクトルも正規直交系を為す

これが直交変換、直交行列の語源である。

コメント





Counter: 132015 (from 2010/06/03), today: 47, yesterday: 0