2次行列方程式の解の研究

今日はかなり専門的な内容なので、数学に興味がある人に読んでほしい。

 

高校の数学のクラスで、自由なテーマで数学の研究をして論文を書くという課題が出た。俺は授業で習った行列について理解を深めたいと思い、2次行列方程式なるもの(名前は自分で考えた)の解について研究した。つまり、2次方程式\(ax^2+bx+c=0\)で変数\(x\)が実数の代わりに行列だったらどうなるのか、ということだ。

 

この記事では、その研究の内容を一般に公表したいと思う。

 

問題

この記事では2次行列方程式

\[ aX^2 + bX + cI = 0\]

を解く。ここで、 \(X\)は\(2 \times 2\)平行列、 \(I\)は\(2 \times 2\)単位行列、\(a,\ b,\ c\)は実数である(\(a \neq 0\))。\(X\)と\(I\)は正方行列である限り行と列の数は任意なのだが、ここでは簡単のため\(2 \times 2\)であると仮定する。

平方完成

実数の2次方程式を解くときに最初にすることは、平方完成である。\(k\)を実数とすると、以下の式が成り立つ。

\begin{align} (X + kI)^2 &= (X + kI)(X + kI) \\ &= X(X + kI) + kI(X + kI) \\ &= X^2 + X(kI) + (kI)X + (kI)^2 \\ &= X^2 + kX + kX + k^2I \\ &= X^2 + 2kX + k^2I \end{align}

よって、実数の2次式と同じように平方完成できる。ここで、\(I\)の代わりに任意の\(2 \times 2\)平方行列\(A\)を用いていたら、行列の乗算は交換法則が成り立たないので上の式は成り立つとは限らない。

さて、問題の2次行列方程式を平方完成してみよう。

\begin{align} aX^2 + bX + cI &= 0 \\ X^2 + \frac{b}{a}X + \frac{c}{a}I &= 0 \\ X^2 + \frac{b}{a}X + \left( \frac{b}{2a}I \right)^2 - \left( \frac{b}{2a}I \right)^2 + \frac{c}{a}I &= 0 \\ \left( X + \frac{b}{2a}I \right)^2 - \frac{b^2}{4a^2}I + \frac{c}{a}I &= 0 \\ \therefore \left( X + \frac{b}{2a}I \right)^2 &= \frac{b^2 - 4ac}{4a^2}I \end{align}

行列の平方根

平方完成ができたので、次のステップは両辺の平方根を取ることだ。その前にまず、行列の平方根とは何か調べる。特にこの記事では、単位行列の実数倍\(mI\)の平方根\(A\)を求める。

\[ A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \]

とすると、

\begin{align} A^2 &= mI \\ \begin{pmatrix} a^2 + bc & ab + bd \\ ac + cd & d^2 + bc \end{pmatrix} &= \begin{pmatrix} m & 0 \\ 0 & m \end{pmatrix} \end{align}

これにより4つの方程式が導かれる。

\begin{align} a^2 + bc &= m \tag{1} \\ ab + bd &= 0 \tag{2} \\ ac + cd &= 0 \tag{3} \\ d^2 + bc &= m \tag{4} \end{align}

\( (1)-(4) \)から

\[ a^2 - d^2 = 0 \\ (a + d) (a - d) = 0 \\ \therefore a + d = 0,\ a - d = 0 \]

\( (2) \)から

\[ ab + bd = 0 \\ b(a + d) = 0 \\ \therefore a + d = 0,\ b = 0 \]

\( (3) \)から

\[ ac + cd = 0 \\ c(a + d) = 0 \\ \therefore a + d = 0, c = 0 \]

以上から

\[ a + d = 0 \] または \[a - d = b = c = 0\]

が成り立つ。

\(a - d = b = c = 0\)のとき

\begin{align} \begin{pmatrix} a^2 & 0 \\ 0 & a^2 \end{pmatrix} &= \begin{pmatrix} m & 0 \\ 0 & m \end{pmatrix} \\ a^2 &= m \\ \therefore a &= \pm \sqrt{m} \end{align}

これでまず平方根が2つ見つかった。

\begin{align} A &= \begin{pmatrix} \pm \sqrt{m} & 0 \\ 0 & \pm \sqrt{m} \end{pmatrix} \\ &=\pm \sqrt{m}I \end{align}

これはとても直感的だ。

\(a + d = 0\)のとき

\begin{align} \begin{pmatrix} a^2 + bc & 0 \\ 0 & a^2 + bc \end{pmatrix} &= \begin{pmatrix} m & 0 \\ 0 & m \end{pmatrix} \\ \therefore a^2 + bc &= m \end{align}

よって、

\[ A =\begin{pmatrix} a & b \\ c & -a \end{pmatrix} \] ここで \[ a^2 + bc = m \]

行列の平方根は無限に存在することになる。

2次行列方程式の解

さて、平方完成した式の両辺の平方根を取って、

\begin{align} \left( X + \frac{b}{2a}I \right)^2 &= \frac{b^2 - 4ac}{4a^2}I \\ X + \frac{b}{2a}I &= \pm \frac{\sqrt{b^2 - 4ac}}{2a}I,\ \begin{pmatrix} p & q \\ r & -p \end{pmatrix} \end{align}

ここで、 \[ p^2 + qr = \frac{b^2 - 4ac}{4a^2} \]

したがって、2次行列方程式の解は

\begin{align} X = &\frac{-b \pm \sqrt{b^2 - 4ac}}{2a}I, \\ &-\frac{b}{2a}I + \begin{pmatrix} p & q \\ r & -p \end{pmatrix} \end{align}

1つ目の解は極めて直感的だ。これを自明な解と呼ぶことにする。対して2つ目の解は実数の2次方程式の解とは似てもつかない形をしている。これを非自明な解と呼ぶことにする。(名前は勝手につけた。リーマン仮説みたいでかっこいいから。)

解の性質

ここで、解の性質をいくつか探っていくことにする。

判別式

2次方程式の判別式\[ D = b^2 - 4ac \]

は2次方程式の解の個数を教えてくれる便利な道具である。2次行列方程式の場合、自明な解の個数は判別式によって変わるが、非自明な解は判別式の値にかかわらず無限にある。

ただ、1つ面白い性質は、\(D = 0\)の時に、自明な解が非自明な解の解集合に含まれることである。\(D = 0\)のとき、非自明な解は、

\[ X = -\frac{b}{2a}I + \begin{pmatrix} p & q \\ r & -p \end{pmatrix} \] ここで、 \[ p^2 + qr = 0 \]

\(p = q = r = 0\)のとき、非自明な解は自明な解と一致する。このようなことが起こるのは\(D = 0\)のときのみである。

行列式

自明な解の行列式は、

\[ \det \left( \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}I \right) = \left( \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \right)^2 \]

自明な解が特異行列のとき、

\begin{align} \left( \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \right)^2 &= 0 \\ -b \pm \sqrt{b^2 - 4ac} &= 0 \\ \pm \sqrt{b^2 - 4ac} &= b \\ b^2 - 4ac &= b^2 \\ \therefore c &= 0 \end{align}

非自明な解の行列式は、

\begin{align} \det \left( -\frac{b}{2a}I + \begin{pmatrix} p & q \\ r & -p \end{pmatrix} \right) &= \det \left( \begin{pmatrix} -\frac{b}{2a} + p & q \\ r & -\frac{b}{2a} - p \end{pmatrix} \right) \\ &= \left( -\frac{b}{2a} + p \right) \left(-\frac{b}{2a} - p \right) - qr \\ &= \frac{b^2}{4a^2} - p^2 - \left( \frac{b^2 - 4ac}{4a^2} - p^2 \right) \\ &= \frac{c}{a} \end{align}

明らかに、\(c = 0\)のとき非自明な解は特異行列である。

以上から、解が特異行列であるときは\(c = 0\)である(逆は成り立たない)。

固有値と固有ベクトル

2次行列方程式の解\(X\)を\(\mathbb{R}^2\)上の線形変換とみる。\(\lambda\)を\(X\)の固有値、\(\boldsymbol{v}\)を\(\lambda\)に対応する固有ベクトルとする。

\(X\)が自明な解のときを考える。

\begin{align} X \boldsymbol{v} &= \lambda \boldsymbol{v} \\ \left( \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}I \right) \boldsymbol{v} &= \lambda \boldsymbol{v} \\ \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \boldsymbol{v} &= \lambda \boldsymbol{v} \\ \therefore \lambda &= \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} \end{align}

よって、固有値\(\lambda\)は2次方程式

\[a\lambda^2 + b\lambda + c = 0\]

の解、固有ベクトル\(\boldsymbol{v}\)は任意の\(\mathbb{R}^2\)上のベクトルである。

\(X\)が非自明な解のときを考える。

\begin{align} \det (X - \lambda I) &= 0 \\ \det \left( -\frac{b}{2a}I + \begin{pmatrix} p & q \\ r & -p \end{pmatrix} - \lambda I \right) &= 0 \\ \det \left( \begin{pmatrix} -\frac{b}{2a} + p - \lambda & q \\ r & -\frac{b}{2a} - p -\lambda \end{pmatrix} \right) &= 0 \\ \left( -\frac{b}{2a} - \lambda \right)^2 - p^2 - qr &= 0 \\ \frac{b^2}{4a^2} + \frac{b}{a} \lambda + \lambda^2 - p^2 - \left( \frac{b^2 - 4ac}{4a^2} - p^2 \right) &= 0 \\ \lambda^2 + \frac{b}{a} \lambda + \frac{c}{a} &= 0 \\ a \lambda^2 + b \lambda + c &= 0 \\ \therefore \lambda &= \frac{-b \pm \sqrt{b^2 - 4ac}}{2a}\end{align}

またしても、固有値\(\lambda\)が

\[a\lambda^2 + b\lambda + c = 0\]

の解となった。これは驚くべき結果である。

固有ベクトル\(\boldsymbol{v}\)は、\[\boldsymbol{v} = \begin{pmatrix} x \\ y \end{pmatrix}\] とすると、

\begin{align} (X - \lambda I) \boldsymbol{v} &= 0 \\ \begin{pmatrix} -\frac{b}{2a} + p - \lambda & q \\ r & -\frac{b}{2a} - p -\lambda \end{pmatrix} \boldsymbol{v} &= 0 \\ \begin{pmatrix} \mp \frac{\sqrt{b^2 - 4ac}}{2a} + p & q \\ r & \mp \frac{\sqrt{b^2 - 4ac}}{2a} - p \end{pmatrix} \boldsymbol{v} &= 0 \\ \therefore \left( \mp \frac{\sqrt{b^2 - 4ac}}{2a} + p \right) x + qy &= 0 \end{align}

\(x = qt\)とすると、

\[ y = \left( \pm \frac{\sqrt{b^2 - 4ac}}{2a} - p \right) t \]

したがって

\[ \boldsymbol{v} = \begin{pmatrix} q \\ \pm \frac{\sqrt{b^2 - 4ac}}{2a} - p \end{pmatrix} t \]

結論

2次行列方程式には自明な解と非自明な解があり、非自明な解は無限に存在する。判別式\(D = 0\)のとき、自明な解は非自明な解の解集合に含まれる。解は特異行列となるとき、\(c = 0\)である。最後に、すべての解の固有値は、2次行列方程式と同じ係数を持つ実数の2次方程式の解に等しい。

 

この研究では以上のような発見が得られたが、さらなる研究も可能である。例えば\(X\)を任意の正方行列に一般化したり、解の、特に非自明な解のさらなる特徴を見出したり、解集合を視覚化したりなどだ。このような研究もぜひしてみたいが、この記事の余白はそれを書くには狭すぎる。(このジョークがわかった人は友達になろう)

 

これはあとで分かったことだが、2次行列方程式と似た概念にケイリー・ハミルトンの定理というものがある。これは、\(2 \times 2\)行列\(A\)を

\[ A = \begin{pmatrix} a & b \\ c & d \end{pmatrix} \]

とすると、

\[ A^2 - (a + d) A + (ad - bc) I = O \]

が成り立つという主張である。これは恒等式であって、\(A\)は定数であるという点が2次行列方程式と異なる点である。もしくはこれは\(A\)から係数を決定しているのに対し、2次行列方程式は係数から\(X\)を決定していると捉えることもできる。

 

なかなか面白い研究ができた。特に固有値がすべて2次方程式の解と一致したのには感動した。やはり、数学は素晴らしい。