定義
正方行列\(A\)に対し\(D=P^{-1}AP\)となる\(P\)と対角行列\(D\)が存在するとき、\(A\)が対角化可能(diagonalizable)であるといい、この変換を対角化(diagonalization)とよぶ。
補足
・すべての正方行列が対角化可能というわけではありません。\(P\)が正則でなければ\(P^{-1}\)は存在しないのでその場合は対角化可能ではありません。
・対角化は\(1\)通りとは限りません。後述のように\(P\)は固有ベクトルにより構成されると考えられるので、同じ行列でも固有ベクトルの並びや大きさによって\(D\)は変わりますが、いずれも対角化であることには変わりありません。
固有値・固有ベクトルとの関係
定理
\(n\times n\)行列\(A\)に\(n\)個の線形独立な固有ベクトルがあり、それらを列ベクトルとして並べた行列を\(P\)、それぞれの固有ベクトルが属する固有値を対角成分として並べた行列を\(D\)としたとき、かつそのときに限り\(D=P^{-1}AP\)の関係が成り立つ。
対角化可能であれば正方行列\(A\)の固有値の一つが\(\lambda_1\)、この固有値に属する固有ベクトルを\(\boldsymbol{x}_1\)とすると、
\begin{align}
A\boldsymbol{x}_1&=\lambda_1 \boldsymbol{x}_1
\end{align}
と表すことができます。
第\(1\)列が上記左辺および右辺のベクトルで、第\(2\)列以降を\(\boldsymbol{0}\)とした\(n\times n\)行列にします。
\begin{align}
&A\begin{pmatrix}
\boldsymbol{x}_1&\boldsymbol{0}&\boldsymbol{0}&\cdots&\boldsymbol{0}
\end{pmatrix}\\
&=
\begin{pmatrix}
\lambda_1 \boldsymbol{x}_1&\boldsymbol{0}&\boldsymbol{0}&\cdots &\boldsymbol{0}
\end{pmatrix}
\end{align}
右辺を変形し以下のように\(2\)つの行列の積にします。
\begin{align}
&A\begin{pmatrix}
\boldsymbol{x}_1\!&\boldsymbol{0}\!&\boldsymbol{0}\!&\cdots\!&\boldsymbol{0}
\end{pmatrix}\\
&=
\begin{pmatrix}
x_{11}\! & 0 \! & 0\! & \cdots \! & 0\\
x_{21}\! & 0 \! & 0\! & \cdots \! & 0\\
x_{31}\! & 0 \! & 0 \! & \cdots \! &0\\
\vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\
x_{n1}\! & 0 \! & 0 \! & \cdots \! &0\\
\end{pmatrix}
\begin{pmatrix}
\lambda_1\! & 0 \! & 0\! & \cdots \! & 0\\
0\! & 0 \! & 0\! & \cdots \! & 0\\
0\! & 0 \! & 0 \! & \cdots \! &0\\
\vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\
0\! & 0 \! & 0 \! & \cdots \! &0\\
\end{pmatrix}
\end{align}
同様に固有ベクトル\(\boldsymbol{x}_2\)を行列の第\(2\)列に置くと、
\begin{align}
&A\begin{pmatrix}
\boldsymbol{0}\!&\boldsymbol{x}_2\!&\boldsymbol{0}\!&\cdots\!&\boldsymbol{0}
\end{pmatrix}\\
&=
\begin{pmatrix}
0\! & x_{12} \! & 0\! & \cdots \! & 0\\
0\! & x_{22} \! & 0\! & \cdots \! & 0\\
0\! & x_{32} \! & 0 \! & \cdots \! &0\\
\vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\
0\! & x_{n2} \! & 0 \! & \cdots \! &0\\
\end{pmatrix}
\begin{pmatrix}
0\! & 0 \! & 0\! & \cdots \! & 0\\
0\! & \lambda_2 \! & 0\! & \cdots \! & 0\\
0\! & 0 \! & 0 \! & \cdots \! &0\\
\vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\
0\! & 0 \! & 0 \! & \cdots \! &0\\
\end{pmatrix}
\end{align}
さらに第\(n\)列までを同じように表し両辺を辺々足し合わせると、
\begin{align}
&A\begin{pmatrix}
\boldsymbol{x}_1\!&\boldsymbol{x}_2\!&\boldsymbol{x}_3\!&\cdots\!&\boldsymbol{x}_n
\end{pmatrix}\\
&=
\begin{pmatrix}
x_{11}\hspace{-5pt} & x_{12} \hspace{-5pt} & x_{13}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{1n}\\
x_{21}\hspace{-5pt} & x_{22} \hspace{-5pt} & x_{23}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{2n}\\
x_{31}\hspace{-5pt} & x_{32} \hspace{-5pt} & x_{33}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{3n}\\
\vdots \hspace{-5pt} & \vdots \hspace{-5pt} & \vdots \hspace{-6pt}& \ddots \hspace{-6pt} & \vdots\\
x_{n1}\hspace{-5pt} & x_{n2} \hspace{-5pt} & x_{n3} \hspace{-6pt} & \cdots \hspace{-6pt} &x_{nn}\\
\end{pmatrix}
\begin{pmatrix}
\lambda_1 \hspace{-5pt} & 0 \hspace{-5pt} & 0\hspace{-7pt} & \cdots \hspace{-7pt} & 0\\
0\hspace{-5pt} & \lambda_2 \hspace{-5pt} & 0\hspace{-7pt} & \cdots \hspace{-7pt} & 0\\
0\hspace{-5pt} & 0 \hspace{-5pt} & \lambda_3 \hspace{-7pt} & \cdots \hspace{-7pt} &0\\
\vdots \hspace{-5pt} & \vdots \hspace{-5pt} & \vdots \hspace{-7pt}& \ddots \hspace{-7pt} & \vdots\\
0\hspace{-5pt} & 0 \hspace{-5pt} & 0 \hspace{-7pt} & \cdots \hspace{-7pt} &\lambda_n\\
\end{pmatrix}
\end{align}
この固有ベクトルの集まりを\(P\)、対角行列を\(D\)とすると、
$$AP=PD$$
両辺に左から\(P^{-1}\)を掛けて、
$$D=P^{-1}AP$$
となります。
この手順をさかのぼれば逆の命題も成り立つことがわかります。
例
上記の通り、固有値・固有ベクトルを求めることにより\(D,\ P\)が得られます。
以下の行列について計算します。
例1
$$ A=\begin{pmatrix} -1&1\\-6&4 \end{pmatrix}$$
1. \(A-\lambda I \)を求める
$$A-\lambda I =\begin{pmatrix}
-1-\lambda&1\\-6&4-\lambda
\end{pmatrix}$$
2. \(\lambda\)について解く
\begin{align}
&(-1-\lambda)(4-\lambda)-1\cdot(-6)\\
&=\lambda^2-3\lambda+2\\
&=(\lambda-1)(\lambda-2)\\
&=0
\end{align}
$$\lambda=1,\ 2$$
3. 固有値より\(D\)を求める
対角成分を固有値として、
\begin{align}
D&=\begin{pmatrix}
1&0\\0&2
\end{pmatrix}\\
\end{align}
4. \(\lambda=1\)とし\(\boldsymbol{x}\)について解く
4.1 \((A-\lambda I)\boldsymbol{x} = \boldsymbol{0}\)に\(\lambda=1\)を代入する
$$\begin{pmatrix}
-2&1\\-6&3
\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix}$$
4.2 媒介変数により\(x_1,\ x_2\)を表す
\(\ x_2=2t\)とすると、
$$\begin{pmatrix}x_1\\x_2\end{pmatrix}=t\begin{pmatrix}1\\2\end{pmatrix}$$
5. \(\lambda=2\)とし\(\boldsymbol{x}\)について解く
5.1 \((A-\lambda I)\boldsymbol{x} = \boldsymbol{0}\)に\(\lambda=2\)を代入する
$$\begin{pmatrix}
-3&1\\-6&2
\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix}$$
5.2 媒介変数により\(x_1,\ x_2\)を表す
\(\ x_2=3t\)とすると、
$$\begin{pmatrix}x_1\\x_2\end{pmatrix}=t\begin{pmatrix}1\\3\end{pmatrix}$$
6. \(P\)を求める
固有ベクトルを並べ、
$$
P=\begin{pmatrix}
1&1\\2&3
\end{pmatrix}
$$
(参考)\(D\)を\(P^{-1}AP\)より求める
\(※\ \ \)単に\(D\)を求めるだけであれば上記\(3.\ \)の手順でよいのですが、ここでは\(D=P^{-1}AP\)となることを確認します。
\(2\times 2\)行列の逆行列の公式により、
\begin{align}
P^{-1}&=\frac{1}{1\cdot 3-1\cdot 2}\begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\
&=\begin{pmatrix}3&-1\\-2&1\end{pmatrix}
\end{align}
対角成分を固有値として、
\begin{align}
P^{-1}AP&=\begin{pmatrix}
3&-1\\-2&1
\end{pmatrix}
\begin{pmatrix}
-1&1\\-6&4
\end{pmatrix}
\begin{pmatrix}
1&1\\2&3
\end{pmatrix}\\
&=\begin{pmatrix}
3&-1\\-4&2
\end{pmatrix}
\begin{pmatrix}
1&1\\2&3
\end{pmatrix}\\
&=\begin{pmatrix}
1&0\\0&2
\end{pmatrix}\\
\end{align}
上記3 の結果と一致しました。
例2
$$ A=\begin{pmatrix} 2&1&-1\\-1&4&-1\\1&1&0 \end{pmatrix} $$
1. \(A-\lambda I \)を求める
$$A-\lambda I=\begin{pmatrix}2-\lambda&1&-1\\-1&4-\lambda&-1\\1&1&-\lambda\end{pmatrix}$$
2. \(\lambda\)について解く
\begin{align}&(2- \lambda )(4- \lambda )(- \lambda )+1 \cdot (-1) \cdot 1\\&-1 \cdot (-1) \cdot 1+1 \cdot (4- \lambda ) \cdot 1\\&-1 \cdot (-1) \cdot (- \lambda )-(2- \lambda ) \cdot (-1) \cdot 1\\
=&- \lambda ^3+6 \lambda ^2-8 \lambda -1\\&+1- \lambda +4\\&- \lambda – \lambda +2\\
=&- \lambda ^3+6 \lambda ^2-11 \lambda +6\\
=&-( \lambda -1)( \lambda -2)( \lambda -3)\\
=&0\end{align}
$$\lambda = 1,\ 2,\ 3$$
3. 固有値より\(D\)を求める
対角成分を固有値として、
\begin{align}
D&=\begin{pmatrix}
1&0&0\\0&2&0\\0&0&3\\
\end{pmatrix}\\
\end{align}
4. \(\lambda=1\)とし\(\boldsymbol{x}\)について解く
4.1 \((A-\lambda I)\boldsymbol{x}=\boldsymbol{0}\)に\(\lambda=1\)を代入する
$$\begin{pmatrix}1&1&-1\\-1&3&-1\\1&1&-1\end{pmatrix}\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}$$
4.2 媒介変数により\(x_1,\ x_2,\ x_3\)を表す
\(\ x_3=2t\)とすると、$$\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\1\\2\end{pmatrix}$$
5. \(\lambda=2\)とし\(\boldsymbol{x}\)について解く
5.1 \((A-\lambda I)\boldsymbol{x}=\boldsymbol{0}\)に\(\lambda=2\)を代入する
$$\begin{pmatrix}0&1&-1\\-1&2&-1\\1&1&-2\end{pmatrix}$$
5.2 媒介変数により\(x_1,\ x_2,\ x_3\)を表す
\(\ x_3=t\)とすると、
$$\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\1\\1\end{pmatrix}$$
6. \(\lambda=3\)とし\(\boldsymbol{x}\)について解く
6.1 \((A-\lambda I)\boldsymbol{x} = \boldsymbol{0}\)に\(\lambda=3\)を代入する
$$\begin{pmatrix}-1&1&-1\\-1&1&-1\\1&1&-3\end{pmatrix}$$
6.2 媒介変数により\(x_1,\ x_2,\ x_3\)を表す
\(\ x_3=t\)とすると、
$$\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\2\\1\end{pmatrix}$$
7. \(P\)を求める
固有ベクトルを並べ、
$$
P=\begin{pmatrix}
1&1&1\\1&1&2\\2&1&1
\end{pmatrix}
$$
(参考)\(D\)を\(P^{-1}AP\)より求める
\(P=(p_{ij})\)とすると、
\begin{align}
&P^{-1}=\\
&\frac{1}{\mathrm{det}(P)}\begin{pmatrix}
p_{22}p_{33} \hspace{-3pt} -\hspace{-3pt} p_{23}p_{32} & \hspace{-3pt} p_{13}p_{32} \hspace{-0pt} – \hspace{-0pt} p_{12}p_{33} & \hspace{-4pt} p_{12}p_{23} \hspace{-3pt} -\hspace{-3pt} p_{13}p_{22} \\
p_{23}p_{31} \hspace{-3pt} -\hspace{-3pt} p_{21}p_{33} & \hspace{-3pt} p_{11}p_{33} \hspace{-0pt} – \hspace{-0pt} p_{13}p_{31} & \hspace{-4pt} p_{13}p_{21} \hspace{-3pt} -\hspace{-3pt} p_{11}p_{23} \\
p_{21}p_{32} \hspace{-3pt} -\hspace{-3pt} p_{22}p_{31} & \hspace{-3pt} p_{12}p_{31} \hspace{-0pt} – \hspace{-0pt} p_{11}p_{32} & \hspace{-4pt} p_{11}p_{22} \hspace{-3pt} -\hspace{-3pt} p_{12}p_{21} \\
\end{pmatrix}
\end{align}
であるので(3×3行列の逆行列)、
\begin{align}
\mathrm{det}(P)&=1\cdot 1 \cdot 1+ 1\cdot 2 \cdot 2 + 1\cdot 1 \cdot 1\\
&-1\cdot 1\cdot 2 – 1\cdot 1 \cdot 1 – 1\cdot 2 \cdot 1\\
&=1
\end{align}
\begin{align}
p_{22}p_{33}-p_{23}p_{32}=1\cdot 1-2\cdot 1&=-1\\
p_{13}p_{32}-p_{12}p_{33}=1\cdot 1-1\cdot 1&=0\\
p_{12}p_{23}-p_{13}p_{22}=1\cdot 2-1\cdot 1&=1\\
p_{23}p_{31}-p_{21}p_{33}=2\cdot 2-1\cdot 1&=3\\
p_{11}p_{33}-p_{13}p_{31}=1\cdot 1-1\cdot 2&=-1\\
p_{13}p_{21}-p_{11}p_{23}=1\cdot 1-1\cdot 2&=-1\\
p_{21}p_{32}-p_{22}p_{31}=1\cdot 1-1\cdot 2&=-1\\
p_{12}p_{31}-p_{11}p_{32}=1\cdot 2-1\cdot 1&=1\\
p_{11}p_{22}-p_{12}p_{21}=1\cdot 1-1\cdot 1&=0\\
\end{align}
より、
\begin{align}
P^{-1}=\begin{pmatrix}-1&0&1\\3&-1&-1\\-1&1&0\\ \end{pmatrix}
\end{align}
応用
対角化をべき乗の計算に利用することができます。
$$D=P^{-1}AP$$
が対角行列で、\(A^n\)を求める場合、以下のように変形し、
$$A=PDP^{-1}$$
\(n\)乗すると、
\begin{align}
A^n&=PDP^{-1}PDP^{-1}\cdots PDP^{-1}\\
&=PD^nP^{-1}
\end{align}
となりますが、対角行列の\(n\)乗はそれぞれの対角成分を\(n\)乗とした行列なので計算が簡単になります。
前述例1の\(n\)乗は、
\begin{align}
A^n&=PD^nP^{-1}\\
&=\begin{pmatrix}1&1\\2&3\end{pmatrix}
\begin{pmatrix}1&0\\0&2\end{pmatrix}^n
\begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\
&=\begin{pmatrix}1&1\\2&3\end{pmatrix}
\begin{pmatrix}1&0\\0&2^n\end{pmatrix}
\begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\
&=\begin{pmatrix}1&2^n\\2&3\cdot 2^n\end{pmatrix}
\begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\
&=\begin{pmatrix}3-2\cdot 2^n&-1+2^n\\6-6\cdot 2^n &-2+3\cdot 2^n\end{pmatrix}\\
&=\begin{pmatrix}3&-1\\6 &-2\end{pmatrix}+2^n\begin{pmatrix}-2&1\\-6 &3\end{pmatrix}\\
\end{align}
と計算できます。
基底変換としてみた場合の対角化の利点
ある線形写像が表現行列\(A\)で表されているところ、基底の変換行列\(P\)により基底を変換すると、表現行列は\(PAP^{-1}\)に変わります(基底の変換)。
本ページで述べた通り、対角化が可能である場合、\(D=P^{-1}AP\)の関係にあるので、対角化を基底の変換として考えることができます。
基底の変換としてみた場合、対角化にどのような利点があるのかを以下の行列について考えてみましょう。
$$A=\begin{pmatrix}5/2&-3/4\\1&1/2\end{pmatrix}$$
\(D=P^{-1}AP\)が対角行列となる\(P\)と\(D\)を計算により求めます(過程は省略します)。\(P\)は一意には決まらず\(P\)によって基底も変わりますが、ここでは以下とします。
\begin{align}
P&=\begin{pmatrix}3/4&1/2\\1/2&1\end{pmatrix}\\
D&=\begin{pmatrix}2&0\\0&1\end{pmatrix}\\
\end{align}
\(\mathbb{R}^2\)の基底\(\{\boldsymbol{v}_1,\ \boldsymbol{v}_2\}\)とこの基底に関する座標\(\boldsymbol{x}=(x_1,\ x_2)\)により、
\begin{align}
\boldsymbol{u}&=x_1\boldsymbol{v}_1+x_2\boldsymbol{v}_2\\
&=4\boldsymbol{v}_1+4\boldsymbol{v}_2
\end{align}
と表されるベクトルが存在するものとします。
比較のため、このベクトルの写像を基底の変換を行わずに求めた場合と基底の変換を行ってから求めた場合について計算します。
基底の変換を行わずに求めた場合
線形写像により得られたベクトルの座標\(\boldsymbol{y}=(y_1,\ y_2)\)は、
\begin{align}
\boldsymbol{y}&=A\boldsymbol{x}\\
&=\begin{pmatrix}5/2&-3/4\\1&1/2\end{pmatrix}
\begin{pmatrix}4\\4\end{pmatrix}\\
&=\begin{pmatrix}7\\6\end{pmatrix}\end{align}
より、このベクトルを\(\boldsymbol{w}\)とすると、
\begin{align}
\boldsymbol{w}&=y_1\boldsymbol{v}_1+y_2\boldsymbol{v}_2\\&=7\boldsymbol{v}_1+6\boldsymbol{v}_2
\end{align}
このように、座標は単純なスカラー倍にはなりません。
基底の変換を行ってから求めた場合
基底の変換行列が対角化における\(P\)と同一となるよう\(\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}\)を選び、これらで\(\boldsymbol{u}\)と\(\boldsymbol{w}\)を表します。
\(\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}\)に関する\(\boldsymbol{u}\)の座標を\(\boldsymbol{x}’=(x’_1,\ x’_2)\)とすると、
\begin{align}
\boldsymbol{x}’&=P^{-1}\boldsymbol{x}\\
&=\begin{pmatrix}2&-1\\-1&3/2\end{pmatrix}
\begin{pmatrix}4\\4\end{pmatrix}\\
&=\begin{pmatrix}4\\2\end{pmatrix}
\end{align}
となるので、\(\boldsymbol{u}\)は、
\begin{align}
\boldsymbol{u}&=x’_1\boldsymbol{v}’_1+x’_2\boldsymbol{v}’_2\\
&=4\boldsymbol{v}’_1+2\boldsymbol{v}’_2
\end{align}
と表されます。
基底の変換行列を対角化の式における\(P\)と同一としたので、\(A\)も変えないのであれば\(D\)は基底変換後の表現行列でもあり対角行列でもあります。写像によって\(\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}\)に関する座標は、
\begin{align}
\boldsymbol{y}’&=D\boldsymbol{x}’\\
&=\begin{pmatrix}2&0\\0&1\end{pmatrix} \begin{pmatrix}4\\2\end{pmatrix}\\
&=\begin{pmatrix}8\\2\end{pmatrix}
\end{align}
\(\boldsymbol{w}\)は、
\begin{align}
\boldsymbol{w}&=y’_1\boldsymbol{v}’_1+y’_2\boldsymbol{v}’_2\\
&=8\boldsymbol{v}’_1+2\boldsymbol{v}’_2
\end{align}
したがって\(\boldsymbol{v}’_1\)に関する座標を\(2\)倍、\(\boldsymbol{v}’_2\)に関する座標を\(1\)倍にするだけで\(\boldsymbol{w}\)の座標が得られます。
\(\boldsymbol{x}’,\ \boldsymbol{y}’\)は\(\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}\)に関する座標ですが、基底を逆に変換し、
\begin{align}
\boldsymbol{y}&=P\boldsymbol{y}’\\
&=\begin{pmatrix}3/4&1/2\\1/2&1\end{pmatrix} \begin{pmatrix}8\\2\end{pmatrix}\\
&=\begin{pmatrix}7\\6\end{pmatrix}
\end{align}
とすれば前項と同じ\(\{\boldsymbol{v}_1,\ \boldsymbol{v}_2\}\)に関する座標になります。
以上のように、線形写像を基底の変換として考えると、対角化によってそれぞれの座標をスカラー倍するだけで計算できるところが利点と解釈できます。