定理
定理
\(\lambda\)を正方行列\(A\)の固有値、\(P_A(\lambda)\)を固有方程式とすると、
$$P_A(A)=\large0$$
が成り立つ。
補足
・固有多項式とは以下です。
$$\mathrm{det}(A-\lambda I)$$
・\(P_A(\lambda)\)はスカラーですが、\(P_A(A)\)は\(A\)と同じサイズの行列です。
・\(P_A(\lambda)\)において定数であった項は\(P_A(A)\)ではこれに単位行列を掛けた行列とします。
・証明は後述します。
例
以下の例について考えてみましょう。
$$A=\begin{pmatrix}a&b\\c&d\end{pmatrix}$$
固有多項式は、
\begin{align}
P_A(\lambda)&=\mathrm{det}(A-\lambda I)\\
&=\begin{vmatrix}a-\lambda&b\\c&d-\lambda \end{vmatrix}\\
&=(a-\lambda)(d-\lambda)-bc
\end{align}
\(\lambda\)を\(A\)に置き換えると、ケーリー・ハミルトンの定理により
$$P_A(A)=(a-A)(d-A)-bcI=\large{0}$$
となるはずです。
\(2\times 2\)行列の場合における定理の確認
上記例が\(\large{0}\)となることを確認しましょう。
\begin{align}
&P_A(A)\\
&=A^2-(a+d)A+(ad-bc)I\\
&=\begin{pmatrix}a&b\\c&d\end{pmatrix}^2-\begin{pmatrix}a+d&0\\0&a+d\end{pmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}a^2+bc&ab+bd\\ac+cd&bc+d^2\end{pmatrix}-\begin{pmatrix}a^2+ad&ab+bd\\ac+cd&ad+d^2\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}bc-ad&0\\0&bc-ad\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}0&0\\0&0\end{pmatrix}
\end{align}
やはり、\(\large{0}\)となりました。
応用
1.
\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^3\)を求めよ。
解法
\(A\)が\(m \times m\)行列のときに\(A^m\)を求める場合、
固有多項式を、
$$P_A(\lambda)=\lambda^m + a_{m-1}\lambda^{m-1}+\cdots+a_1\lambda+a_0$$
として\(\lambda\)を\(A\)に置き換え、
\begin{align}
P_A(A)&=A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I\\
&=\large{0}\end{align}
移項し、
$$A^m =-a_{m-1}A^{m-1}+\cdots-a_1A-a_0I$$
とすることにより求めることができます。
解答例
サラスの公式を用いて固有多項式を計算し、
\(\lambda\)を\(A\)に置き換え、
\begin{align}
P_A(A)=-A^3+4A+14I=\large{0}
\end{align}
計算を進めると、
\begin{align}
A^3&=4A+14I\\
&=4\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}+14\begin{pmatrix} 1&0&0\\0&1&0\\0&0&1 \end{pmatrix}\\
&=\begin{pmatrix} 6&8&-4\\4&18&8\\12&4&18\end{pmatrix}
\end{align}
2.
\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^{-1}\)を求めよ。
解法
前項で用いた以下の式の、
$$A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I=\large{0}$$
両辺に左から\(A^{-1}\)を掛けて移項し、
$$A^{-1}=-\frac{1}{a_0}(A^{m-1} + a_{m-1}A^{m-2}+\cdots+ a_1I)$$
とすれば\(A^{-1}\)が計算できます。
解答例
固有方程式の\(\lambda\)を\(A\)に置き換え、
$$P_A(A)=-A^3+4A+14I=\large{0}$$
両辺に左から\(A^{-1}\)を掛けて、
3.
\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^4\)を求めよ。
解法
\(A\)を\(m \times m\)行列、求める行列を\(A^n\)としたときに\(m \lt n\)であった場合、剰余により計算する方法があります。
\(\lambda\)の多項式\(f(\lambda)\)を\(P_A(\lambda)\)で割った商を\(Q(\lambda)\)、剰余を\(R(\lambda)\)とすると、
$$f(\lambda)=Q(\lambda)P_A(\lambda)+R(\lambda)$$
と表すことができます。
したがって\(\lambda\)を\(A\)に置き換えてケーリー・ハミルトンの定理を適用し、
$$A^n=Q(A)P_A(A)+R(A)=R(A)$$
とすることで\(A^n\)を計算できます。
解答例
\(A\)の固有多項式は、
\begin{align}
P_A(\lambda)=-\lambda^3+4\lambda+14
\end{align}
\(\lambda^4\)を固有多項式で割ることにより、
$$\lambda^4 = -\lambda(-\lambda^3+4\lambda+14) + 4\lambda^2+14\lambda$$
\(\lambda\)を\(A\)に置き換えて、
4.
\(A=\begin{pmatrix} 3&4\\1&3\end{pmatrix}\)のときの\(A^n\)を求めよ。
解法
\(n\)が定数ではない場合の\(A^n\)は連立方程式を解くことにより求めることができます。
\(A\)が\(m\times m\)行列であるとすれば、\(p_A(\lambda)\)は\(m\)次の多項式で、固有値に重複(重解)や\(0\)の固有値がないとすればその数は\(m\)です。
前項のように\(\lambda^n\)を\(p_A(\lambda)\)で割ると、その剰余の次数は高々\(m-1\)です。したがってこれを\(A\)に置き換えると、スカラー\(c_0,c_1,\cdots,c_{m-1}\)により次のように表すことができます。
$$A^n = c_{m-1} A^{m-1}+\cdots + c_1 A^1+c_0I$$
固有値を\(\lambda_1,\ \lambda_2,\cdots,\lambda_{m}\)とすると\(p_A(\lambda_1),\ p_A(\lambda_2),\ \cdots,\ p_A(\lambda_{m})\)も\(0\)なので、
\begin{align}
\lambda_1^n &= c_{m-1} \lambda_1^{m-1}+\cdots + c_1 \lambda_1+c_0\\
\lambda_2^n &= c_{m-1} \lambda_2^{m-1}+\cdots + c_1 \lambda_2+c_0\\
\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ &\ \ \ \ \vdots\phantom{\ \ \ \ \ \ \ }\\
\lambda_{m}^n &= c_{m-1} \lambda_{m}^{m-1}+\cdots + c_1 \lambda_{m}+c_0\\
\end{align}
と、\(c_0,\ c_1,\cdots,c_{m-1}\)を未知数とする連立方程式ができますが、未知数と方程式の数がどちらも\(m\)なのでこれらは一意に決まります。
ただし、以上は方程式の係数行列が正則である場合について述べています。正則でない場合については省略します。
解答例
固有多項式は、
\begin{align}
\begin{vmatrix} 3-\lambda&4\\1&3-\lambda\end{vmatrix}
&=(3-\lambda)(3-\lambda)-4\times 1\\
&=\lambda^2 -6\lambda+ 5\\
&=(\lambda-1)(\lambda-5)
\end{align}
より固有値は\(1,\ 5\)なので、以下の連立方程式が立てられます。
\begin{align}
1^n&=1^1 c_1 + 1^0 c_0\\
5^n&=5^1 c_1 + 5^0 c_0\\
\end{align}
解は、
\begin{align}
c_1&=\frac{1}{4}(5^n-1)\\
c_0&=-\frac{1}{4}(5^n-5)\\
\end{align}
したがって以下のように表すことができます。
誤ったケーリー・ハミルトンの証明
$$p_A(\lambda)=\mathrm{det}(A-\lambda I)$$
における\(\lambda\)を\(A\)に置き換え、
$$p_A(A)=\mathrm{det}(A-A I )=\mathrm{det}(\large{0})=\normalsize{0}\tag{1}$$
とすれば、ケーリー・ハミルトンの定理が証明できているのではないでしょうか。しかし実は正しい証明ではありません。何が間違っているのでしょう。
ケーリー・ハミルトンの定理により得られるのは零行列であるのに対し、\((1)\)はスカラーの\(0\)であるからです。ではなぜこの違いが生じているのでしょう。
ケーリー・ハミルトンの定理では行列式を\(\lambda\)で表してから\(A\)に置き換えているのに対し、\((1)\)は\(\lambda\)を\(A\)に置き換えてから行列式を表しているからです。
\(2\times 2\)行列について固有多項式を比較してみましょう。
ケーリー・ハミルトンの定理の通りの場合、
\begin{align}
\begin{vmatrix}
\begin{pmatrix}a&b\\c&d\end{pmatrix} – a\begin{pmatrix}1&0\\0&1\end{pmatrix}&
-b\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
-c\begin{pmatrix}1&0\\0&1\end{pmatrix}&
\begin{pmatrix}a&b\\c&d\end{pmatrix} – d\begin{pmatrix}1&0\\0&1\end{pmatrix}
\end{vmatrix}\\
\end{align}
一方、\((1)\)は、
\begin{align}
\begin{vmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}\begin{pmatrix}1&0\\0&1\end{pmatrix}-\begin{pmatrix}a&b\\c&d\end{pmatrix}\end{vmatrix}\\
\end{align}
と、明らかに\(\lambda\)を\(A\)に置き換えるところが異なります。したがって\((1)\)をもって証明したことにはなりません。
ケーリー・ハミルトンの定理の証明
証明1
\(A\)が正方行列であれば\(T=PAP^{-1}\)が三角行列となる正則行列\(P\)が存在する。\(\ \ ※1\)
\(\lambda_1,\ \lambda_2,\cdots,\lambda_n\)を固有値とすると、固有多項式は
$$p_A(\lambda)=(\lambda_1-\lambda)(\lambda_2-\lambda)\cdots (\lambda_n-\lambda)$$
と表すことができる。
\(\lambda\)を\(A\)に置き換え、
\(A\)と\(T\)の固有値は同じなので\(T\)の対角成分は\(\lambda_1,\ \lambda_2,\cdots,\lambda_n\)になる。\(\ \ ※2\)
\(1\le k \le n\)とすると\(\lambda_k I-T\)は\((k,\ k)\)成分が\(0\)である三角行列になる。
\((\lambda_1I-T)\cdots(\lambda_nI-T)\)を左から順に計算してゆくと、第\(2\)列以降が消去され、行列が\(1\)つになったときは\(\large{0}\)になる。\(\ \ ※3\)
したがって\(P_A(A)=\large{0}\)が成り立つ。
■
補足
\(※1\)
シュール分解・三角化を参照ください。
\(※2\)
\(T=P^{-1}AP\)の関係にあるときの\(A\)と\(T\)は相似(similar)であるといいます。相似な行列の固有値は同一です。三角行列の固有値はそれぞれが対角成分となります。
\(※3\)
\(A\)を\(4\times 4\)の正方行列として、\(P_A(A)=\large{0}\)となることを確認しましょう。
前項の通り\(A\)と\(T\)の固有値は同じなので、\(T\)は以下の三角行列です。
\begin{align}
\small{
\begin{pmatrix}
\lambda_1& *& *& *\\
0&\lambda_2& *& *\\
0& 0&\lambda_3& *\\
0& 0& 0&\lambda_4\\
\end{pmatrix}}
\end{align}
固有多項式の積を左から計算していくと以下のように\(\large{0}\)になります。
\begin{align}
&P_A(A)=(\lambda_1I-T)(\lambda_2I-T)(\lambda_3I-T)(\lambda_4I-T)\\
&=
\small{
\begin{pmatrix}
0& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
\end{align}
証明2
余因子行列と行列式の関係より、
$$(A-\lambda I ) \mathrm{adj}(A-\lambda I) = \mathrm{det}(A-\lambda I) I \ \ ※1$$
\(\mathrm{adj}(A-\lambda I)\)は\(n-1\)次の\(\lambda\)の多項式であるので、
$$\mathrm{adj}(A-\lambda I)=\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0$$
と表すことができる。両辺に左から\(A-\lambda I\)を掛けると、
\begin{align}
&(A-\lambda I) \mathrm{adj}(A-\lambda I)\\
&=(A-\lambda I)(\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0)\\
&=\lambda ^n B_{n-1}+\lambda ^{n-1}(AB_{n-1}-B_{n-2})+\cdots+\lambda(AB_1-B_0)-AB_0\tag{2}
\end{align}
一方、\(\mathrm{det}(A-\lambda I)\)は\(n\)次の\(\lambda\)の多項式であるので、
と表すことができる。
両辺に右から\(I\)を掛けて、
\((2)\)と\((3)\)を比較し、
\begin{align}
B_{n-1}&=I\\
B_{n-2}-AB_{n-1}&=a_{n-1}I\\
B_{n-3}-AB_{n-2}&=a_{n-2}I\\
&\vdots\\
B_0-AB_1&=a_1I\\
-AB_0&=a_0 I
\end{align}
\(1\)行目の式の両辺に左から\(A_n\)、\(2\)行目に\(A_{n-1}\)、以降も同様に行列を掛けると、
\begin{align}
A^n B_{n-1}&=A^n\\
A^{n-1}B_{n-2}-A^nB_{n-1}&=a_{n-1}A^{n-1}\\
A^{n-2}B_{n-3}-A^{n-1} B_{n-2}&=a_{n-2}A^{n-2}\\
&\vdots\\
A B_0-A^2 B_1&=a_1A\\
-A B_0&=a_0
\end{align}
これらの式の左辺を全て足し合わせると\(\large{0}\)であるので、
$$A^n+a_{n-1}A^{n-1}+\cdots + a_1 A + a_0 =\large{0}$$
したがって\(p_A(A)=\large{0}\)が成り立つ。
■
補足
\(※1\)
逆行列と余因子行列では
$$A^{-1}=\frac{1}{\mathrm{det} (A)}\tilde{A}$$
としましたが、\(\tilde{A}\)は、\(\mathrm{adj}(A)\)と同じ意味です。
両辺に左から\(\mathrm{det}(A)A\)を掛けて\(A\)を\(A-\lambda I\)に置き換えるとこの式になります。