線形代数 – ケーリー・ハミルトンの定理

定理

$\lambda$を正方行列$A$の固有値、$P_A(\lambda)$を固有方程式とすると、

$$P_A(A)=\large0$$

が成り立つ。

補足

・固有多項式とは以下です。

$$\mathrm{det}(A-\lambda I)$$

・$P_A(\lambda)$はスカラーですが、$P_A(A)$は$A$と同じサイズの行列です。

・$P_A(\lambda)$において定数であった項は$P_A(A)$ではこれに単位行列を掛けた行列とします。

・証明は後述します。

例

以下の例について考えてみましょう。

$$A=\begin{pmatrix}a&b\\c&d\end{pmatrix}$$

固有多項式は、

\begin{align}
P_A(\lambda)&=\mathrm{det}(A-\lambda I)\\
&=\begin{vmatrix}a-\lambda&b\\c&d-\lambda \end{vmatrix}\\
&=(a-\lambda)(d-\lambda)-bc
\end{align}

$\lambda$を$A$に置き換えると、ケーリー・ハミルトンの定理により

$$P_A(A)=(a-A)(d-A)-bcI=\large{0}$$

となるはずです。

$2\times 2$行列の場合における定理の確認

上記例が$\large{0}$となることを確認しましょう。

\begin{align}
&P_A(A)\\
&=A^2-(a+d)A+(ad-bc)I\\
&=\begin{pmatrix}a&b\\c&d\end{pmatrix}^2-\begin{pmatrix}a+d&0\\0&a+d\end{pmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}a^2+bc&ab+bd\\ac+cd&bc+d^2\end{pmatrix}-\begin{pmatrix}a^2+ad&ab+bd\\ac+cd&ad+d^2\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}bc-ad&0\\0&bc-ad\end{pmatrix}
+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\\
&=\begin{pmatrix}0&0\\0&0\end{pmatrix}
\end{align}

やはり、$\large{0}$となりました。

応用

$A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}$のときの$A^3$を求めよ。

解法

$A$が$m \times m$行列のときに$A^m$を求める場合、

固有多項式を、

$$P_A(\lambda)=\lambda^m + a_{m-1}\lambda^{m-1}+\cdots+a_1\lambda+a_0$$

として$\lambda$を$A$に置き換え、

\begin{align}
P_A(A)&=A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I\\
&=\large{0}\end{align}

移項し、

$$A^m =-a_{m-1}A^{m-1}+\cdots-a_1A-a_0I$$

とすることにより求めることができます。

解答例

サラスの公式を用いて固有多項式を計算し、

\begin{align}
P_A(\lambda)=&
\begin{vmatrix}-2-\lambda&2&-1\\1&1-\lambda&2\\3&1&1-\lambda\end{vmatrix}\\
=&(-2-\lambda)(1-\lambda)(1-\lambda)+2\times2\times3\\
&-1\times1\times1+1\times(1-\lambda)\times3\\
&-2\times1\times(1-\lambda)-(-2-\lambda)\times2\times1\\
=&-\lambda^3+4\lambda+14
\end{align}

\begin{align}
P_A&(\lambda)\\
=&
\begin{vmatrix}-2-\lambda&2&-1\\1&1-\lambda&2\\3&1&1-\lambda\end{vmatrix}\\
=&(-2-\lambda)(1-\lambda)(1-\lambda)+2\times2\times3\\
&-1\times1\times1+1\times(1-\lambda)\times3\\
&-2\times1\times(1-\lambda)-(-2-\lambda)\times2\times1\\
=&-\lambda^3+4\lambda+14
\end{align}

$\lambda$を$A$に置き換え、

\begin{align}
P_A(A)=-A^3+4A+14I=\large{0}
\end{align}

計算を進めると、

\begin{align}
A^3&=4A+14I\\
&=4\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}+14\begin{pmatrix} 1&0&0\\0&1&0\\0&0&1 \end{pmatrix}\\
&=\begin{pmatrix} 6&8&-4\\4&18&8\\12&4&18\end{pmatrix}
\end{align}

$A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}$のときの$A^{-1}$を求めよ。

解法

前項で用いた以下の式の、

$$A^m + a_{m-1}A^{m-1}+\cdots+a_1A+a_0I=\large{0}$$

両辺に左から$A^{-1}$を掛けて移項し、

$$A^{-1}=-\frac{1}{a_0}(A^{m-1} + a_{m-1}A^{m-2}+\cdots+ a_1I)$$

とすれば$A^{-1}$が計算できます。

解答例

固有方程式の$\lambda$を$A$に置き換え、

$$P_A(A)=-A^3+4A+14I=\large{0}$$

両辺に左から$A^{-1}$を掛けて、

\begin{align}
A^{-1}&=\frac{1}{14}(A^2-4I)\\
&=\frac{1}{14}\left(\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2-4\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\right)\\
&=\frac{1}{14}\begin{pmatrix} -1&-3&5\\5&1&3\\-2&8&-4\end{pmatrix}
\end{align}

\begin{align}
&A^{-1}\\
&=\frac{1}{14}(A^2-4I)\\
&=\frac{1}{14}\left(\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2-4\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\right)\\
&=\frac{1}{14}\begin{pmatrix} -1&-3&5\\5&1&3\\-2&8&-4\end{pmatrix}
\end{align}

$A=\begin{pmatrix} -2&2&-1\\1&1&2\\3&1&1\end{pmatrix}$のときの$A^4$を求めよ。

解法

$A$を$m \times m$行列、求める行列を$A^n$としたときに$m \lt n$であった場合、剰余により計算する方法があります。
$\lambda$の多項式$f(\lambda)$を$P_A(\lambda)$で割った商を$Q(\lambda)$、剰余を$R(\lambda)$とすると、

$$f(\lambda)=Q(\lambda)P_A(\lambda)+R(\lambda)$$

と表すことができます。

したがって$\lambda$を$A$に置き換えてケーリー・ハミルトンの定理を適用し、

$$A^n=Q(A)P_A(A)+R(A)=R(A)$$

とすることで$A^n$を計算できます。

解答例

$A$の固有多項式は、

\begin{align}
P_A(\lambda)=-\lambda^3+4\lambda+14
\end{align}

$\lambda^4$を固有多項式で割ることにより、

$$\lambda^4 = -\lambda(-\lambda^3+4\lambda+14) + 4\lambda^2+14\lambda$$

筆算

$$\require{enclose}
\begin{align}
-\lambda\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \hspace{0.4em}\\
-\lambda^3+4 \lambda+14\ \enclose{longdiv}{ \ \lambda^4 \phantom{+ 3\lambda + 3} \ \ \ \ \ \ \ \hspace{0.2em}} \\
\phantom{-\lambda^3+4 \lambda+14\ \ \ \ \ \ \ \ \ \ \ \ } \underline{ \,\lambda^4-4 \lambda^2-14\lambda } \\
\phantom{4 \lambda+14\ \ \ \ \ \ \ } \ \ \,\phantom
{\lambda^4+3\lambda^2-} 4\lambda^2+14\lambda \\
\end{align}$$

$\lambda$を$A$に置き換えて、

\begin{align}
A^4&=-A(-A^3+4A+14I)+4A^2+14A\\
&=4A^2+14A\\
&=4\begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2+14 \begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\\
&=\begin{pmatrix}-16&16&6\\34&34&40\\34&46&14\end{pmatrix}
\end{align}

\begin{align}
&A^4\\
&=-A(-A^3+4A+14I)+4A^2+14A\\
&=4A^2+14A\\
&=4\begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}^2+14 \begin{pmatrix}-2&2&-1\\1&1&2\\3&1&1\end{pmatrix}\\
&=\begin{pmatrix}-16&16&6\\34&34&40\\34&46&14\end{pmatrix}
\end{align}

$A=\begin{pmatrix} 3&4\\1&3\end{pmatrix}$のときの$A^n$を求めよ。

解法

$n$が定数ではない場合の$A^n$は連立方程式を解くことにより求めることができます。

$A$が$m\times m$行列であるとすれば、$p_A(\lambda)$は$m$次の多項式で、固有値に重複（重解）や$0$の固有値がないとすればその数は$m$です。

前項のように$\lambda^n$を$p_A(\lambda)$で割ると、その剰余の次数は高々$m-1$です。したがってこれを$A$に置き換えると、スカラー$c_0,c_1,\cdots,c_{m-1}$により次のように表すことができます。

$$A^n = c_{m-1} A^{m-1}+\cdots + c_1 A^1+c_0I$$

固有値を$\lambda_1,\ \lambda_2,\cdots,\lambda_{m}$とすると$p_A(\lambda_1),\ p_A(\lambda_2),\ \cdots,\ p_A(\lambda_{m})$も$0$なので、

\begin{align}
\lambda_1^n &= c_{m-1} \lambda_1^{m-1}+\cdots + c_1 \lambda_1+c_0\\
\lambda_2^n &= c_{m-1} \lambda_2^{m-1}+\cdots + c_1 \lambda_2+c_0\\
\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ &\ \ \ \ \vdots\phantom{\ \ \ \ \ \ \ }\\
\lambda_{m}^n &= c_{m-1} \lambda_{m}^{m-1}+\cdots + c_1 \lambda_{m}+c_0\\
\end{align}

と、$c_0,\ c_1,\cdots,c_{m-1}$を未知数とする連立方程式ができますが、未知数と方程式の数がどちらも$m$なのでこれらは一意に決まります。

ただし、以上は方程式の係数行列が正則である場合について述べています。正則でない場合については省略します。

解答例

固有多項式は、

\begin{align}
\begin{vmatrix} 3-\lambda&4\\1&3-\lambda\end{vmatrix}
&=(3-\lambda)(3-\lambda)-4\times 1\\
&=\lambda^2 -6\lambda+ 5\\
&=(\lambda-1)(\lambda-5)
\end{align}

より固有値は$1,\ 5$なので、以下の連立方程式が立てられます。

\begin{align}
1^n&=1^1 c_1 + 1^0 c_0\\
5^n&=5^1 c_1 + 5^0 c_0\\
\end{align}

解は、

\begin{align}
c_1&=\frac{1}{4}(5^n-1)\\
c_0&=-\frac{1}{4}(5^n-5)\\
\end{align}

したがって以下のように表すことができます。

\begin{align}
A^n&=\frac{1}{4}(5^n-1)A-\frac{1}{4}(5^n-5)I\\
&=\frac{1}{4}(5^n-1)\begin{pmatrix} 3&4\\1&3\end{pmatrix}-\frac{1}{4}(5^n-5)\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
&=\frac{5^n}{4}\begin{pmatrix} 2&4\\1&2\end{pmatrix}+\frac{1}{4}\begin{pmatrix} 2&-4\\-1&2\end{pmatrix}\\
\end{align}

\begin{align}
&A^n\\
&=\frac{1}{4}(5^n-1)A-\frac{1}{4}(5^n-5)I\\
&=\frac{1}{4}(5^n-1)\begin{pmatrix} 3&4\\1&3\end{pmatrix}-\frac{1}{4}(5^n-5)\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
&=\frac{5^n}{4}\begin{pmatrix} 2&4\\1&2\end{pmatrix}+\frac{1}{4}\begin{pmatrix} 2&-4\\-1&2\end{pmatrix}\\
\end{align}

誤ったケーリー・ハミルトンの証明

$$p_A(\lambda)=\mathrm{det}(A-\lambda I)$$

における$\lambda$を$A$に置き換え、

$$p_A(A)=\mathrm{det}(A-A I )=\mathrm{det}(\large{0})=\normalsize{0}\tag{1}$$

とすれば、ケーリー・ハミルトンの定理が証明できているのではないでしょうか。しかし実は正しい証明ではありません。何が間違っているのでしょう。

ケーリー・ハミルトンの定理により得られるのは零行列であるのに対し、$(1)$はスカラーの$0$であるからです。ではなぜこの違いが生じているのでしょう。

ケーリー・ハミルトンの定理では行列式を$\lambda$で表してから$A$に置き換えているのに対し、$(1)$は$\lambda$を$A$に置き換えてから行列式を表しているからです。

$2\times 2$行列について固有多項式を比較してみましょう。

ケーリー・ハミルトンの定理の通りの場合、

\begin{align}
\begin{vmatrix}
\begin{pmatrix}a&b\\c&d\end{pmatrix} – a\begin{pmatrix}1&0\\0&1\end{pmatrix}&
-b\begin{pmatrix}1&0\\0&1\end{pmatrix}\\
-c\begin{pmatrix}1&0\\0&1\end{pmatrix}&
\begin{pmatrix}a&b\\c&d\end{pmatrix} – d\begin{pmatrix}1&0\\0&1\end{pmatrix}
\end{vmatrix}\\
\end{align}

一方、$(1)$は、

\begin{align}
\begin{vmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}\begin{pmatrix}1&0\\0&1\end{pmatrix}-\begin{pmatrix}a&b\\c&d\end{pmatrix}\end{vmatrix}\\
\end{align}

と、明らかに$\lambda$を$A$に置き換えるところが異なります。したがって$(1)$をもって証明したことにはなりません。

ケーリー・ハミルトンの定理の証明

証明1

$A$が正方行列であれば$T=PAP^{-1}$が三角行列となる正則行列$P$が存在する。$\ \ ※1$

$\lambda_1,\ \lambda_2,\cdots,\lambda_n$を固有値とすると、固有多項式は

$$p_A(\lambda)=(\lambda_1-\lambda)(\lambda_2-\lambda)\cdots (\lambda_n-\lambda)$$

と表すことができる。

$\lambda$を$A$に置き換え、

\begin{align}
p_A(A)&=(\lambda_1I-A)\cdots(\lambda_nI-A)\\
&=(\lambda_1I-PTP^{-1})\cdots(\lambda_nI-PTP^{-1})\\
&=(\lambda_1PIP^{-1}-PTP^{-1})\cdots(\lambda_nPIP^{-1}-PTP^{-1})\\
&=P(\lambda_1I-T)P^{-1}P(\lambda_2I-T)P^{-1}\cdots P(\lambda_nI-T)P^{-1}\\
&=P(\lambda_1I-T)(\lambda_2I-T)\cdots(\lambda_nI-T)P^{-1}\\
\end{align}

\begin{align}
&p_A(A)\\
&=(\lambda_1I-A)\cdots(\lambda_nI-A)\\
&=(\lambda_1I-PTP^{-1})\cdots(\lambda_nI-PTP^{-1})\\
&=(\lambda_1PIP^{-1}-PTP^{-1})\cdots(\lambda_nPIP^{-1}-PTP^{-1})\\
&=P(\lambda_1I-T)P^{-1}P(\lambda_2I-T)P^{-1}\cdots P(\lambda_nI-T)P^{-1}\\
&=P(\lambda_1I-T)(\lambda_2I-T)\cdots(\lambda_nI-T)P^{-1}\\
\end{align}

$A$と$T$の固有値は同じなので$T$の対角成分は$\lambda_1,\ \lambda_2,\cdots,\lambda_n$になる。$\ \ ※2$

$1\le k \le n$とすると$\lambda_k I-T$は$(k,\ k)$成分が$0$である三角行列になる。

$(\lambda_1I-T)\cdots(\lambda_nI-T)$を左から順に計算してゆくと、第$2$列以降が消去され、行列が$1$つになったときは$\large{0}$になる。$\ \ ※3$

したがって$P_A(A)=\large{0}$が成り立つ。

■

補足

$※1$
シュール分解・三角化を参照ください。

$※2$
$T=P^{-1}AP$の関係にあるときの$A$と$T$は相似（similar）であるといいます。相似な行列の固有値は同一です。三角行列の固有値はそれぞれが対角成分となります。

$※3$
$A$を$4\times 4$の正方行列として、$P_A(A)=\large{0}$となることを確認しましょう。

前項の通り$A$と$T$の固有値は同じなので、$T$は以下の三角行列です。

\begin{align}
\small{
\begin{pmatrix}
\lambda_1& *& *& *\\
0&\lambda_2& *& *\\
0& 0&\lambda_3& *\\
0& 0& 0&\lambda_4\\
\end{pmatrix}}
\end{align}

固有多項式の積を左から計算していくと以下のように$\large{0}$になります。

\begin{align}
&P_A(A)=(\lambda_1I-T)(\lambda_2I-T)(\lambda_3I-T)(\lambda_4I-T)\\
&=
\small{
\begin{pmatrix}
0& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& *& *\\
0& 0& *& *\\
0& 0& *& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
0& 0& 0& *\\
\end{pmatrix}
\begin{pmatrix}
*& *& *& *\\
0& *& *& *\\
0& 0& *& *\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
&=
\small{
\begin{pmatrix}
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
0& 0& 0& 0\\
\end{pmatrix}
}\\
\end{align}

証明2

余因子行列と行列式の関係より、

$$(A-\lambda I ) \mathrm{adj}(A-\lambda I) = \mathrm{det}(A-\lambda I) I \ \ ※1$$

$\mathrm{adj}(A-\lambda I)$は$n-1$次の$\lambda$の多項式であるので、

$$\mathrm{adj}(A-\lambda I)=\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0$$

と表すことができる。両辺に左から$A-\lambda I$を掛けると、

\begin{align}
&(A-\lambda I) \mathrm{adj}(A-\lambda I)\\
&=(A-\lambda I)(\lambda ^{n-1}B_{n-1}+\lambda ^{n-2}B_{n-2}+\cdots +\lambda B_1 + B_0)\\
&=\lambda ^n B_{n-1}+\lambda ^{n-1}(AB_{n-1}-B_{n-2})+\cdots+\lambda(AB_1-B_0)-AB_0\tag{2}
\end{align}

一方、$\mathrm{det}(A-\lambda I)$は$n$次の$\lambda$の多項式であるので、

\begin{align}
\mathrm{det}(A-\lambda I)=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots + a_1 \lambda + a_0
\end{align}

\begin{align}
&\mathrm{det}(A-\lambda I)\\
&=\lambda^n+a_{n-1}\lambda^{n-1}+\cdots + a_1 \lambda + a_0
\end{align}

と表すことができる。

両辺に右から$I$を掛けて、

\begin{align}
\mathrm{det}(A-\lambda I )I=\lambda^n I +a_{n-1}\lambda^{n-1} I +\cdots + a_1 \lambda I+ a_0 I\tag{3}
\end{align}

\begin{align}
&\mathrm{det}(A-\lambda I )I\\
&=\lambda^n I +a_{n-1}\lambda^{n-1} I +\cdots + a_1 \lambda I+ a_0 I\tag{3}
\end{align}

$(2)$と$(3)$を比較し、

\begin{align}
B_{n-1}&=I\\
B_{n-2}-AB_{n-1}&=a_{n-1}I\\
B_{n-3}-AB_{n-2}&=a_{n-2}I\\
&\vdots\\
B_0-AB_1&=a_1I\\
-AB_0&=a_0 I
\end{align}

$1$行目の式の両辺に左から$A_n$、$2$行目に$A_{n-1}$、以降も同様に行列を掛けると、

\begin{align}
A^n B_{n-1}&=A^n\\
A^{n-1}B_{n-2}-A^nB_{n-1}&=a_{n-1}A^{n-1}\\
A^{n-2}B_{n-3}-A^{n-1} B_{n-2}&=a_{n-2}A^{n-2}\\
&\vdots\\
A B_0-A^2 B_1&=a_1A\\
-A B_0&=a_0
\end{align}

これらの式の左辺を全て足し合わせると$\large{0}$であるので、

$$A^n+a_{n-1}A^{n-1}+\cdots + a_1 A + a_0 =\large{0}$$

したがって$p_A(A)=\large{0}$が成り立つ。

■

補足

$※1$
逆行列と余因子行列では

$$A^{-1}=\frac{1}{\mathrm{det} (A)}\tilde{A}$$

としましたが、$\tilde{A}$は、$\mathrm{adj}(A)$と同じ意味です。

両辺に左から$\mathrm{det}(A)A$を掛けて$A$を$A-\lambda I$に置き換えるとこの式になります。

定理

例

\(2\times 2\)行列の場合における定理の確認

応用

誤ったケーリー・ハミルトンの証明

ケーリー・ハミルトンの定理の証明