線形代数 – ケーリー・ハミルトンの定理

投稿者: | 2025年1月6日

定理

定理

\(\lambda\)を正方行列\(A\)の固有値、\(P_A(\lambda)\)を固有方程式とすると、

$$P_A(A)=\large0$$

が成り立つ。

補足

・固有多項式とは以下です。

$$\mathrm{det}(A-\lambda I)$$

・\(P_A(\lambda)\)はスカラーですが、\(P_A(A)\)は\(A\)と同じサイズの行列です。

・\(P_A(\lambda)\)において定数であった項は\(P_A(A)\)ではこれに単位行列を掛けた行列とします。

・証明は後述します。

以下の例について考えてみましょう。

$$A=\begin{pmatrix}a&b\\c&d\end{pmatrix}$$

固有多項式は、

\begin{align}
P_A(\lambda)&=\mathrm{det}(A-\lambda I)\\
&=\begin{vmatrix}a-\lambda&b\\c&d-\lambda \end{vmatrix}\\
&=(a-\lambda)(d-\lambda)-bc
\end{align}

\(\lambda\)を\(A\)に置き換えると、ケーリー・ハミルトンの定理により

$$P_A(A)=(a-A)(d-A)-bcI=\large{0}$$

となるはずです。

\(2\times 2\)行列の場合における定理の確認

上記例が\(\large{0}\)となることを確認しましょう。

\begin{align}
&P_A(A)\\
&=A^2-(a+d)A+(ad-bc)I\\
&=\begin{pmatrix}a&b\\c&d\end{pmatrix}^2-\begin{pmatrix}a+d&0\\0&a+d\end{pmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}a^2+bc&ab+bd\\ac+cd&bc+d^2\end{pmatrix}-\begin{pmatrix}a^2+ad&ab+bd\\ac+cd&ad+d^2\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}bc-ad&0\\0&bc-ad\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}0&0\\0&0\end{pmatrix}
\end{align}

やはり、\(\large{0}\)となりました。

応用

1.

\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^3\)を求めよ。

解法

\(A\)が\(m \times m\)行列のときに\(A^m\)を求める場合、

固有多項式を、

$$P_A(\lambda)=\lambda^m + a_{m-1}\lambda^{m-1}+\cdots+a_1\lambda+a_0$$

として\(\lambda\)を\(A\)に置き換え、

\begin{align}
P_A(A)&=A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I\\
&=\large{0}\end{align}

移項し、

$$A^m =-a_{m-1}A^{m-1}+\cdots-a_1A-a_0I$$

とすることにより求めることができます。

解答例

サラスの公式を用いて固有多項式を計算し、

\begin{align}
P_A(\lambda)=&
\begin{vmatrix}-2-\lambda&2&-1\\1&1-\lambda&2\\3&1&1-\lambda\end{vmatrix}\\
=&(-2-\lambda)(1-\lambda)(1-\lambda)+2\times2\times3\\
&-1\times1\times1+1\times(1-\lambda)\times3\\
&-2\times1\times(1-\lambda)-(-2-\lambda)\times2\times1\\
=&-\lambda^3+4\lambda+14
\end{align}

\begin{align}
P_A&(\lambda)\\
=&
\begin{vmatrix}-2-\lambda&2&-1\\1&1-\lambda&2\\3&1&1-\lambda\end{vmatrix}\\
=&(-2-\lambda)(1-\lambda)(1-\lambda)+2\times2\times3\\
&-1\times1\times1+1\times(1-\lambda)\times3\\
&-2\times1\times(1-\lambda)-(-2-\lambda)\times2\times1\\
=&-\lambda^3+4\lambda+14
\end{align}

\(\lambda\)を\(A\)に置き換え、

\begin{align}
P_A(A)=-A^3+4A+14I=\large{0}
\end{align}

計算を進めると、

\begin{align}
A^3&=4A+14I\\
&=4\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}+14\begin{pmatrix} 1&0&0\\0&1&0\\0&0&1 \end{pmatrix}\\
&=\begin{pmatrix} 6&8&-4\\4&18&8\\12&4&18\end{pmatrix}
\end{align}

2.

\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^{-1}\)を求めよ。

解法

前項で用いた以下の式の、

$$A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I=\large{0}$$

両辺に左から\(A^{-1}\)を掛けて移項し、

$$A^{-1}=-\frac{1}{a_0}(A^{m-1} + a_{m-1}A^{m-2}+\cdots+ a_1I)$$

とすれば\(A^{-1}\)が計算できます。

解答例

固有方程式の\(\lambda\)を\(A\)に置き換え、

$$P_A(A)=-A^3+4A+14I=\large{0}$$

両辺に左から\(A^{-1}\)を掛けて、

\begin{align}
A^{-1}&=\frac{1}{14}(A^2-4I)\\
&=\frac{1}{14}\left(\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2-4\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\right)\\
&=\frac{1}{14}\begin{pmatrix} -1&-3&5\\5&1&3\\-2&8&-4\end{pmatrix}
\end{align}

\begin{align}
&A^{-1}\\
&=\frac{1}{14}(A^2-4I)\\
&=\frac{1}{14}\left(\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2-4\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\right)\\
&=\frac{1}{14}\begin{pmatrix} -1&-3&5\\5&1&3\\-2&8&-4\end{pmatrix}
\end{align}

3.

\(A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\)のときの\(A^4\)を求めよ。

解法

\(A\)を\(m \times m\)行列、求める行列を\(A^n\)としたときに\(m \lt n\)であった場合、剰余により計算する方法があります。
\(\lambda\)の多項式\(f(\lambda)\)を\(P_A(\lambda)\)で割った商を\(Q(\lambda)\)、剰余を\(R(\lambda)\)とすると、

$$f(\lambda)=Q(\lambda)P_A(\lambda)+R(\lambda)$$

と表すことができます。

したがって\(\lambda\)を\(A\)に置き換えてケーリー・ハミルトンの定理を適用し、

$$A^n=Q(A)P_A(A)+R(A)=R(A)$$

とすることで\(A^n\)を計算できます。

解答例

\(A\)の固有多項式は、

\begin{align}
P_A(\lambda)=-\lambda^3+4\lambda+14
\end{align}

\(\lambda^4\)を固有多項式で割ることにより、

$$\lambda^4 = -\lambda(-\lambda^3+4\lambda+14) + 4\lambda^2+14\lambda$$

筆算

$$\require{enclose}
\begin{align}
-\lambda\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \hspace{0.4em}\\
-\lambda^3+4 \lambda+14\ \enclose{longdiv}{ \ \lambda^4 \phantom{+ 3\lambda + 3} \ \ \ \ \ \ \ \hspace{0.2em}} \\
\phantom{-\lambda^3+4 \lambda+14\ \ \ \ \ \ \ \ \ \ \ \ } \underline{ \,\lambda^4-4 \lambda^2-14\lambda } \\
\phantom{4 \lambda+14\ \ \ \ \ \ \ } \ \ \,\phantom
{\lambda^4+3\lambda^2-} 4\lambda^2+14\lambda \\
\end{align}$$

\(\lambda\)を\(A\)に置き換えて、

\begin{align}
A^4&=-A(-A^3+4A+14I)+4A^2+14A\\
&=4A^2+14A\\
&=4\begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2+14 \begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\\
&=\begin{pmatrix}-16&16&6\\34&34&40\\34&46&14\end{pmatrix}
\end{align}

\begin{align}
&A^4\\
&=-A(-A^3+4A+14I)+4A^2+14A\\
&=4A^2+14A\\
&=4\begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2+14 \begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\\
&=\begin{pmatrix}-16&16&6\\34&34&40\\34&46&14\end{pmatrix}
\end{align}

4.

\(A=\begin{pmatrix} 3&4\\1&3\end{pmatrix}\)のときの\(A^n\)を求めよ。

解法

\(n\)が定数ではない場合の\(A^n\)は連立方程式を解くことにより求めることができます。

\(A\)が\(m\times m\)行列であるとすれば、\(p_A(\lambda)\)は\(m\)次の多項式で、固有値に重複(重解)や\(0\)の固有値がないとすればその数は\(m\)です。

前項のように\(\lambda^n\)を\(p_A(\lambda)\)で割ると、その剰余の次数は高々\(m-1\)です。したがってこれを\(A\)に置き換えると、スカラー\(c_0,c_1,\cdots,c_{m-1}\)により次のように表すことができます。

$$A^n = c_{m-1} A^{m-1}+\cdots + c_1 A^1+c_0I$$

固有値を\(\lambda_1,\ \lambda_2,\cdots,\lambda_{m}\)とすると\(p_A(\lambda_1),\ p_A(\lambda_2),\ \cdots,\ p_A(\lambda_{m})\)も\(0\)なので、

\begin{align}
\lambda_1^n &= c_{m-1} \lambda_1^{m-1}+\cdots + c_1 \lambda_1+c_0\\
\lambda_2^n &= c_{m-1} \lambda_2^{m-1}+\cdots + c_1 \lambda_2+c_0\\
\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ &\ \ \ \ \vdots\phantom{\ \ \ \ \ \ \ }\\
\lambda_{m}^n &= c_{m-1} \lambda_{m}^{m-1}+\cdots + c_1 \lambda_{m}+c_0\\
\end{align}

と、\(c_0,\ c_1,\cdots,c_{m-1}\)を未知数とする連立方程式ができますが、未知数と方程式の数がどちらも\(m\)なのでこれらは一意に決まります。

ただし、以上は方程式の係数行列が正則である場合について述べています。正則でない場合については省略します。

解答例

固有多項式は、

\begin{align}
\begin{vmatrix} 3-\lambda&4\\1&3-\lambda\end{vmatrix}
&=(3-\lambda)(3-\lambda)-4\times 1\\
&=\lambda^2 -6\lambda+ 5\\
&=(\lambda-1)(\lambda-5)
\end{align}

より固有値は\(1,\ 5\)なので、以下の連立方程式が立てられます。

\begin{align}
1^n&=1^1 c_1 + 1^0 c_0\\
5^n&=5^1 c_1 + 5^0 c_0\\
\end{align}

解は、

\begin{align}
c_1&=\frac{1}{4}(5^n-1)\\
c_0&=-\frac{1}{4}(5^n-5)\\
\end{align}

したがって以下のように表すことができます。

\begin{align}
A^n&=\frac{1}{4}(5^n-1)A-\frac{1}{4}(5^n-5)I\\
&=\frac{1}{4}(5^n-1)\begin{pmatrix} 3&4\\1&3\end{pmatrix}-\frac{1}{4}(5^n-5)\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
&=\frac{5^n}{4}\begin{pmatrix} 2&4\\1&2\end{pmatrix}+\frac{1}{4}\begin{pmatrix} 2&-4\\-1&2\end{pmatrix}\\
\end{align}

\begin{align}
&A^n\\
&=\frac{1}{4}(5^n-1)A-\frac{1}{4}(5^n-5)I\\
&=\frac{1}{4}(5^n-1)\begin{pmatrix} 3&4\\1&3\end{pmatrix}-\frac{1}{4}(5^n-5)\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
&=\frac{5^n}{4}\begin{pmatrix} 2&4\\1&2\end{pmatrix}+\frac{1}{4}\begin{pmatrix} 2&-4\\-1&2\end{pmatrix}\\
\end{align}

誤ったケーリー・ハミルトンの証明

$$p_A(\lambda)=\mathrm{det}(A-\lambda I)$$

における\(\lambda\)を\(A\)に置き換え、

$$p_A(A)=\mathrm{det}(A-A I )=\mathrm{det}(\large{0})=\normalsize{0}\tag{1}$$

とすれば、ケーリー・ハミルトンの定理が証明できているのではないでしょうか。しかし実は正しい証明ではありません。何が間違っているのでしょう。

ケーリー・ハミルトンの定理により得られるのは零行列であるのに対し、\((1)\)はスカラーの\(0\)であるからです。ではなぜこの違いが生じているのでしょう。

ケーリー・ハミルトンの定理では行列式を\(\lambda\)で表してから\(A\)に置き換えているのに対し、\((1)\)は\(\lambda\)を\(A\)に置き換えてから行列式を表しているからです。

\(2\times 2\)行列について固有多項式を比較してみましょう。

ケーリー・ハミルトンの定理の通りの場合、

\begin{align}
\begin{vmatrix}
\begin{pmatrix}a&b\\c&d\end{pmatrix} – a\begin{pmatrix}1&0\\0&1\end{pmatrix}&
-b\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
-c\begin{pmatrix}1&0\\0&1\end{pmatrix}&
\begin{pmatrix}a&b\\c&d\end{pmatrix} – d\begin{pmatrix}1&0\\0&1\end{pmatrix}
\end{vmatrix}\\
\end{align}

一方、\((1)\)は、

\begin{align}
\begin{vmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}\begin{pmatrix}1&0\\0&1\end{pmatrix}-\begin{pmatrix}a&b\\c&d\end{pmatrix}\end{vmatrix}\\
\end{align}

と、明らかに\(\lambda\)を\(A\)に置き換えるところが異なります。したがって\((1)\)をもって証明したことにはなりません。

ケーリー・ハミルトンの定理の証明

証明1

\(A\)が正方行列であれば\(T=PAP^{-1}\)が三角行列となる正則行列\(P\)が存在する。\(\ \ ※1\)

\(\lambda_1,\ \lambda_2,\cdots,\lambda_n\)を固有値とすると、固有多項式は

$$p_A(\lambda)=(\lambda_1-\lambda)(\lambda_2-\lambda)\cdots (\lambda_n-\lambda)$$

と表すことができる。

\(\lambda\)を\(A\)に置き換え、

\begin{align}
p_A(A)&=(\lambda_1I-A)\cdots(\lambda_nI-A)\\
&=(\lambda_1I-PTP^{-1})\cdots(\lambda_nI-PTP^{-1})\\
&=(\lambda_1PIP^{-1}-PTP^{-1})\cdots(\lambda_nPIP^{-1}-PTP^{-1})\\
&=P(\lambda_1I-T)P^{-1}P(\lambda_2I-T)P^{-1}\cdots P(\lambda_nI-T)P^{-1}\\
&=P(\lambda_1I-T)(\lambda_2I-T)\cdots(\lambda_nI-T)P^{-1}\\
\end{align}

\begin{align}
&p_A(A)\\
&=(\lambda_1I-A)\cdots(\lambda_nI-A)\\
&=(\lambda_1I-PTP^{-1})\cdots(\lambda_nI-PTP^{-1})\\
&=(\lambda_1PIP^{-1}-PTP^{-1})\cdots(\lambda_nPIP^{-1}-PTP^{-1})\\
&=P(\lambda_1I-T)P^{-1}P(\lambda_2I-T)P^{-1}\cdots P(\lambda_nI-T)P^{-1}\\
&=P(\lambda_1I-T)(\lambda_2I-T)\cdots(\lambda_nI-T)P^{-1}\\
\end{align}

\(A\)と\(T\)の固有値は同じなので\(T\)の対角成分は\(\lambda_1,\ \lambda_2,\cdots,\lambda_n\)になる。\(\ \ ※2\)

\(1\le k \le n\)とすると\(\lambda_k I-T\)は\((k,\ k)\)成分が\(0\)である三角行列になる。

\((\lambda_1I-T)\cdots(\lambda_nI-T)\)を左から順に計算してゆくと、第\(2\)列以降が消去され、行列が\(1\)つになったときは\(\large{0}\)になる。\(\ \ ※3\)

したがって\(P_A(A)=\large{0}\)が成り立つ。

補足

\(※1\)
シュール分解・三角化を参照ください。

\(※2\)
\(T=P^{-1}AP\)の関係にあるときの\(A\)と\(T\)は相似(similar)であるといいます。相似な行列の固有値は同一です。三角行列の固有値はそれぞれが対角成分となります。

\(※3\)
\(A\)を\(4\times 4\)の正方行列として、\(P_A(A)=\large{0}\)となることを確認しましょう。

前項の通り\(A\)と\(T\)の固有値は同じなので、\(T\)は以下の三角行列です。

\begin{align}
\small{
\begin{pmatrix}
\lambda_1& *& *& *\\
0&\lambda_2& *& *\\
0& 0&\lambda_3& *\\
0& 0& 0&\lambda_4\\
\end{pmatrix}}
\end{align}

固有多項式の積を左から計算していくと以下のように\(\large{0}\)になります。

\begin{align}
&P_A(A)=(\lambda_1I-T)(\lambda_2I-T)(\lambda_3I-T)(\lambda_4I-T)\\
&=
\small{
\begin{pmatrix}
0& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
\end{align}

証明2

余因子行列と行列式の関係より、

$$(A-\lambda I ) \mathrm{adj}(A-\lambda I) = \mathrm{det}(A-\lambda I) I \ \ ※1$$

\(\mathrm{adj}(A-\lambda I)\)は\(n-1\)次の\(\lambda\)の多項式であるので、

$$\mathrm{adj}(A-\lambda I)=\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0$$

と表すことができる。両辺に左から\(A-\lambda I\)を掛けると、

\begin{align}
&(A-\lambda I) \mathrm{adj}(A-\lambda I)\\
&=(A-\lambda I)(\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0)\\
&=\lambda ^n B_{n-1}+\lambda ^{n-1}(AB_{n-1}-B_{n-2})+\cdots+\lambda(AB_1-B_0)-AB_0\tag{2}
\end{align}

一方、\(\mathrm{det}(A-\lambda I)\)は\(n\)次の\(\lambda\)の多項式であるので、

\begin{align}
\mathrm{det}(A-\lambda I)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots + a_1 \lambda + a_0
\end{align}

\begin{align}
&\mathrm{det}(A-\lambda I)\\
&=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots + a_1 \lambda + a_0
\end{align}

と表すことができる。

両辺に右から\(I\)を掛けて、

\begin{align}
\mathrm{det}(A-\lambda I )I=\lambda^n I +a_{n-1}\lambda^{n-1} I +\cdots + a_1 \lambda I+ a_0 I\tag{3}
\end{align}

\begin{align}
&\mathrm{det}(A-\lambda I )I\\
&=\lambda^n I +a_{n-1}\lambda^{n-1} I +\cdots + a_1 \lambda I+ a_0 I\tag{3}
\end{align}

\((2)\)と\((3)\)を比較し、

\begin{align}
B_{n-1}&=I\\
B_{n-2}-AB_{n-1}&=a_{n-1}I\\
B_{n-3}-AB_{n-2}&=a_{n-2}I\\
&\vdots\\
B_0-AB_1&=a_1I\\
-AB_0&=a_0 I
\end{align}

\(1\)行目の式の両辺に左から\(A_n\)、\(2\)行目に\(A_{n-1}\)、以降も同様に行列を掛けると、

\begin{align}
A^n B_{n-1}&=A^n\\
A^{n-1}B_{n-2}-A^nB_{n-1}&=a_{n-1}A^{n-1}\\
A^{n-2}B_{n-3}-A^{n-1} B_{n-2}&=a_{n-2}A^{n-2}\\
&\vdots\\
A B_0-A^2 B_1&=a_1A\\
-A B_0&=a_0
\end{align}

これらの式の左辺を全て足し合わせると\(\large{0}\)であるので、

$$A^n+a_{n-1}A^{n-1}+\cdots + a_1 A + a_0 =\large{0}$$

したがって\(p_A(A)=\large{0}\)が成り立つ。

補足

\(※1\)
逆行列と余因子行列では

$$A^{-1}=\frac{1}{\mathrm{det} (A)}\tilde{A}$$

としましたが、\(\tilde{A}\)は、\(\mathrm{adj}(A)\)と同じ意味です。

両辺に左から\(\mathrm{det}(A)A\)を掛けて\(A\)を\(A-\lambda I\)に置き換えるとこの式になります。