定義
正方行列Aに対しD=P^{-1}APとなるPと対角行列Dが存在するとき、Aが対角化可能(diagonalizable)であるといい、この変換を対角化(diagonalization)とよぶ。
補足
・すべての正方行列が対角化可能というわけではありません。Pが正則でなければP^{-1}は存在しないのでその場合は対角化可能ではありません。
・対角化は1通りとは限りません。後述のようにPは固有ベクトルにより構成されると考えられるので、同じ行列でも固有ベクトルの並びや大きさによってDは変わりますが、いずれも対角化であることには変わりありません。
固有値・固有ベクトルとの関係
定理
n\times n行列Aにn個の線形独立な固有ベクトルがあり、それらを列ベクトルとして並べた行列をP、それぞれの固有ベクトルが属する固有値を対角成分として並べた行列をDとしたとき、かつそのときに限りD=P^{-1}APの関係が成り立つ。
対角化可能であれば正方行列Aの固有値の一つが\lambda_1、この固有値に属する固有ベクトルを\boldsymbol{x}_1とすると、
\begin{align} A\boldsymbol{x}_1&=\lambda_1 \boldsymbol{x}_1 \end{align}
と表すことができます。
第1列が上記左辺および右辺のベクトルで、第2列以降を\boldsymbol{0}としたn\times n行列にします。
\begin{align} &A\begin{pmatrix} \boldsymbol{x}_1&\boldsymbol{0}&\boldsymbol{0}&\cdots&\boldsymbol{0} \end{pmatrix}\\ &= \begin{pmatrix} \lambda_1 \boldsymbol{x}_1&\boldsymbol{0}&\boldsymbol{0}&\cdots &\boldsymbol{0} \end{pmatrix} \end{align}
右辺を変形し以下のように2つの行列の積にします。
\begin{align} &A\begin{pmatrix} \boldsymbol{x}_1\!&\boldsymbol{0}\!&\boldsymbol{0}\!&\cdots\!&\boldsymbol{0} \end{pmatrix}\\ &= \begin{pmatrix} x_{11}\! & 0 \! & 0\! & \cdots \! & 0\\ x_{21}\! & 0 \! & 0\! & \cdots \! & 0\\ x_{31}\! & 0 \! & 0 \! & \cdots \! &0\\ \vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\ x_{n1}\! & 0 \! & 0 \! & \cdots \! &0\\ \end{pmatrix} \begin{pmatrix} \lambda_1\! & 0 \! & 0\! & \cdots \! & 0\\ 0\! & 0 \! & 0\! & \cdots \! & 0\\ 0\! & 0 \! & 0 \! & \cdots \! &0\\ \vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\ 0\! & 0 \! & 0 \! & \cdots \! &0\\ \end{pmatrix} \end{align}
同様に固有ベクトル\boldsymbol{x}_2を行列の第2列に置くと、
\begin{align} &A\begin{pmatrix} \boldsymbol{0}\!&\boldsymbol{x}_2\!&\boldsymbol{0}\!&\cdots\!&\boldsymbol{0} \end{pmatrix}\\ &= \begin{pmatrix} 0\! & x_{12} \! & 0\! & \cdots \! & 0\\ 0\! & x_{22} \! & 0\! & \cdots \! & 0\\ 0\! & x_{32} \! & 0 \! & \cdots \! &0\\ \vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\ 0\! & x_{n2} \! & 0 \! & \cdots \! &0\\ \end{pmatrix} \begin{pmatrix} 0\! & 0 \! & 0\! & \cdots \! & 0\\ 0\! & \lambda_2 \! & 0\! & \cdots \! & 0\\ 0\! & 0 \! & 0 \! & \cdots \! &0\\ \vdots \! & \vdots \! & \vdots \!& \ddots \! & \vdots\\ 0\! & 0 \! & 0 \! & \cdots \! &0\\ \end{pmatrix} \end{align}
さらに第n列までを同じように表し両辺を辺々足し合わせると、
\begin{align} &A\begin{pmatrix} \boldsymbol{x}_1\!&\boldsymbol{x}_2\!&\boldsymbol{x}_3\!&\cdots\!&\boldsymbol{x}_n \end{pmatrix}\\ &= \begin{pmatrix} x_{11}\hspace{-5pt} & x_{12} \hspace{-5pt} & x_{13}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{1n}\\ x_{21}\hspace{-5pt} & x_{22} \hspace{-5pt} & x_{23}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{2n}\\ x_{31}\hspace{-5pt} & x_{32} \hspace{-5pt} & x_{33}\hspace{-6pt} & \cdots \hspace{-6pt} & x_{3n}\\ \vdots \hspace{-5pt} & \vdots \hspace{-5pt} & \vdots \hspace{-6pt}& \ddots \hspace{-6pt} & \vdots\\ x_{n1}\hspace{-5pt} & x_{n2} \hspace{-5pt} & x_{n3} \hspace{-6pt} & \cdots \hspace{-6pt} &x_{nn}\\ \end{pmatrix} \begin{pmatrix} \lambda_1 \hspace{-5pt} & 0 \hspace{-5pt} & 0\hspace{-7pt} & \cdots \hspace{-7pt} & 0\\ 0\hspace{-5pt} & \lambda_2 \hspace{-5pt} & 0\hspace{-7pt} & \cdots \hspace{-7pt} & 0\\ 0\hspace{-5pt} & 0 \hspace{-5pt} & \lambda_3 \hspace{-7pt} & \cdots \hspace{-7pt} &0\\ \vdots \hspace{-5pt} & \vdots \hspace{-5pt} & \vdots \hspace{-7pt}& \ddots \hspace{-7pt} & \vdots\\ 0\hspace{-5pt} & 0 \hspace{-5pt} & 0 \hspace{-7pt} & \cdots \hspace{-7pt} &\lambda_n\\ \end{pmatrix} \end{align}
この固有ベクトルの集まりをP、対角行列をDとすると、
AP=PD
両辺に左からP^{-1}を掛けて、
D=P^{-1}AP
となります。
この手順をさかのぼれば逆の命題も成り立つことがわかります。
例
上記の通り、固有値・固有ベクトルを求めることによりD,\ Pが得られます。
以下の行列について計算します。
例1
A=\begin{pmatrix} -1&1\\-6&4 \end{pmatrix}
1. A-\lambda I を求める
A-\lambda I =\begin{pmatrix} -1-\lambda&1\\-6&4-\lambda \end{pmatrix}
2. \lambdaについて解く
\begin{align} &(-1-\lambda)(4-\lambda)-1\cdot(-6)\\ &=\lambda^2-3\lambda+2\\ &=(\lambda-1)(\lambda-2)\\ &=0 \end{align}
\lambda=1,\ 2
3. 固有値よりDを求める
対角成分を固有値として、
\begin{align} D&=\begin{pmatrix} 1&0\\0&2 \end{pmatrix}\\ \end{align}
4. \lambda=1とし\boldsymbol{x}について解く
4.1 (A-\lambda I)\boldsymbol{x} = \boldsymbol{0}に\lambda=1を代入する
\begin{pmatrix} -2&1\\-6&3 \end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix}
4.2 媒介変数によりx_1,\ x_2を表す
\ x_2=2tとすると、
\begin{pmatrix}x_1\\x_2\end{pmatrix}=t\begin{pmatrix}1\\2\end{pmatrix}
5. \lambda=2とし\boldsymbol{x}について解く
5.1 (A-\lambda I)\boldsymbol{x} = \boldsymbol{0}に\lambda=2を代入する
\begin{pmatrix} -3&1\\-6&2 \end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}=\begin{pmatrix}0\\0\end{pmatrix}
5.2 媒介変数によりx_1,\ x_2を表す
\ x_2=3tとすると、
\begin{pmatrix}x_1\\x_2\end{pmatrix}=t\begin{pmatrix}1\\3\end{pmatrix}
6. Pを求める
固有ベクトルを並べ、
P=\begin{pmatrix} 1&1\\2&3 \end{pmatrix}
(参考)DをP^{-1}APより求める
※\ \ 単にDを求めるだけであれば上記3.\ の手順でよいのですが、ここではD=P^{-1}APとなることを確認します。
2\times 2行列の逆行列の公式により、
\begin{align} P^{-1}&=\frac{1}{1\cdot 3-1\cdot 2}\begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\ &=\begin{pmatrix}3&-1\\-2&1\end{pmatrix} \end{align}
対角成分を固有値として、
\begin{align} P^{-1}AP&=\begin{pmatrix} 3&-1\\-2&1 \end{pmatrix} \begin{pmatrix} -1&1\\-6&4 \end{pmatrix} \begin{pmatrix} 1&1\\2&3 \end{pmatrix}\\ &=\begin{pmatrix} 3&-1\\-4&2 \end{pmatrix} \begin{pmatrix} 1&1\\2&3 \end{pmatrix}\\ &=\begin{pmatrix} 1&0\\0&2 \end{pmatrix}\\ \end{align}
上記3 の結果と一致しました。
例2
A=\begin{pmatrix} 2&1&-1\\-1&4&-1\\1&1&0 \end{pmatrix}
1. A-\lambda I を求める
A-\lambda I=\begin{pmatrix}2-\lambda&1&-1\\-1&4-\lambda&-1\\1&1&-\lambda\end{pmatrix}
2. \lambdaについて解く
\begin{align}&(2- \lambda )(4- \lambda )(- \lambda )+1 \cdot (-1) \cdot 1\\&-1 \cdot (-1) \cdot 1+1 \cdot (4- \lambda ) \cdot 1\\&-1 \cdot (-1) \cdot (- \lambda )-(2- \lambda ) \cdot (-1) \cdot 1\\ =&- \lambda ^3+6 \lambda ^2-8 \lambda -1\\&+1- \lambda +4\\&- \lambda – \lambda +2\\ =&- \lambda ^3+6 \lambda ^2-11 \lambda +6\\ =&-( \lambda -1)( \lambda -2)( \lambda -3)\\ =&0\end{align}
\lambda = 1,\ 2,\ 3
3. 固有値よりDを求める
対角成分を固有値として、
\begin{align} D&=\begin{pmatrix} 1&0&0\\0&2&0\\0&0&3\\ \end{pmatrix}\\ \end{align}
4. \lambda=1とし\boldsymbol{x}について解く
4.1 (A-\lambda I)\boldsymbol{x}=\boldsymbol{0}に\lambda=1を代入する
\begin{pmatrix}1&1&-1\\-1&3&-1\\1&1&-1\end{pmatrix}\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=\begin{pmatrix}0\\0\\0\end{pmatrix}
4.2 媒介変数によりx_1,\ x_2,\ x_3を表す
\ x_3=2tとすると、\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\1\\2\end{pmatrix}
5. \lambda=2とし\boldsymbol{x}について解く
5.1 (A-\lambda I)\boldsymbol{x}=\boldsymbol{0}に\lambda=2を代入する
\begin{pmatrix}0&1&-1\\-1&2&-1\\1&1&-2\end{pmatrix}
5.2 媒介変数によりx_1,\ x_2,\ x_3を表す
\ x_3=tとすると、
\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\1\\1\end{pmatrix}
6. \lambda=3とし\boldsymbol{x}について解く
6.1 (A-\lambda I)\boldsymbol{x} = \boldsymbol{0}に\lambda=3を代入する
\begin{pmatrix}-1&1&-1\\-1&1&-1\\1&1&-3\end{pmatrix}
6.2 媒介変数によりx_1,\ x_2,\ x_3を表す
\ x_3=tとすると、
\begin{pmatrix}x_1\\x_2\\x_3\end{pmatrix}=t\begin{pmatrix}1\\2\\1\end{pmatrix}
7. Pを求める
固有ベクトルを並べ、
P=\begin{pmatrix} 1&1&1\\1&1&2\\2&1&1 \end{pmatrix}
(参考)DをP^{-1}APより求める
P=(p_{ij})とすると、
\begin{align} &P^{-1}=\\ &\frac{1}{\mathrm{det}(P)}\begin{pmatrix} p_{22}p_{33} \hspace{-3pt} -\hspace{-3pt} p_{23}p_{32} & \hspace{-3pt} p_{13}p_{32} \hspace{-0pt} – \hspace{-0pt} p_{12}p_{33} & \hspace{-4pt} p_{12}p_{23} \hspace{-3pt} -\hspace{-3pt} p_{13}p_{22} \\ p_{23}p_{31} \hspace{-3pt} -\hspace{-3pt} p_{21}p_{33} & \hspace{-3pt} p_{11}p_{33} \hspace{-0pt} – \hspace{-0pt} p_{13}p_{31} & \hspace{-4pt} p_{13}p_{21} \hspace{-3pt} -\hspace{-3pt} p_{11}p_{23} \\ p_{21}p_{32} \hspace{-3pt} -\hspace{-3pt} p_{22}p_{31} & \hspace{-3pt} p_{12}p_{31} \hspace{-0pt} – \hspace{-0pt} p_{11}p_{32} & \hspace{-4pt} p_{11}p_{22} \hspace{-3pt} -\hspace{-3pt} p_{12}p_{21} \\ \end{pmatrix} \end{align}
であるので(3×3行列の逆行列)、
\begin{align} \mathrm{det}(P)&=1\cdot 1 \cdot 1+ 1\cdot 2 \cdot 2 + 1\cdot 1 \cdot 1\\ &-1\cdot 1\cdot 2 – 1\cdot 1 \cdot 1 – 1\cdot 2 \cdot 1\\ &=1 \end{align}
\begin{align} p_{22}p_{33}-p_{23}p_{32}=1\cdot 1-2\cdot 1&=-1\\ p_{13}p_{32}-p_{12}p_{33}=1\cdot 1-1\cdot 1&=0\\ p_{12}p_{23}-p_{13}p_{22}=1\cdot 2-1\cdot 1&=1\\ p_{23}p_{31}-p_{21}p_{33}=2\cdot 2-1\cdot 1&=3\\ p_{11}p_{33}-p_{13}p_{31}=1\cdot 1-1\cdot 2&=-1\\ p_{13}p_{21}-p_{11}p_{23}=1\cdot 1-1\cdot 2&=-1\\ p_{21}p_{32}-p_{22}p_{31}=1\cdot 1-1\cdot 2&=-1\\ p_{12}p_{31}-p_{11}p_{32}=1\cdot 2-1\cdot 1&=1\\ p_{11}p_{22}-p_{12}p_{21}=1\cdot 1-1\cdot 1&=0\\ \end{align}
より、
\begin{align} P^{-1}=\begin{pmatrix}-1&0&1\\3&-1&-1\\-1&1&0\\ \end{pmatrix} \end{align}
応用
対角化をべき乗の計算に利用することができます。
D=P^{-1}AP
が対角行列で、A^nを求める場合、以下のように変形し、
A=PDP^{-1}
n乗すると、
\begin{align} A^n&=PDP^{-1}PDP^{-1}\cdots PDP^{-1}\\ &=PD^nP^{-1} \end{align}
となりますが、対角行列のn乗はそれぞれの対角成分をn乗とした行列なので計算が簡単になります。
前述例1のn乗は、
\begin{align} A^n&=PD^nP^{-1}\\ &=\begin{pmatrix}1&1\\2&3\end{pmatrix} \begin{pmatrix}1&0\\0&2\end{pmatrix}^n \begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\ &=\begin{pmatrix}1&1\\2&3\end{pmatrix} \begin{pmatrix}1&0\\0&2^n\end{pmatrix} \begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\ &=\begin{pmatrix}1&2^n\\2&3\cdot 2^n\end{pmatrix} \begin{pmatrix}3&-1\\-2&1\end{pmatrix}\\ &=\begin{pmatrix}3-2\cdot 2^n&-1+2^n\\6-6\cdot 2^n &-2+3\cdot 2^n\end{pmatrix}\\ &=\begin{pmatrix}3&-1\\6 &-2\end{pmatrix}+2^n\begin{pmatrix}-2&1\\-6 &3\end{pmatrix}\\ \end{align}
と計算できます。
基底変換としてみた場合の対角化の利点
ある線形写像が表現行列Aで表されているところ、基底の変換行列Pにより基底を変換すると、表現行列はPAP^{-1}に変わります(基底の変換)。
本ページで述べた通り、対角化が可能である場合、D=P^{-1}APの関係にあるので、対角化を基底の変換として考えることができます。
基底の変換としてみた場合、対角化にどのような利点があるのかを以下の行列について考えてみましょう。
A=\begin{pmatrix}5/2&-3/4\\1&1/2\end{pmatrix}
D=P^{-1}APが対角行列となるPとDを計算により求めます(過程は省略します)。Pは一意には決まらずPによって基底も変わりますが、ここでは以下とします。
\begin{align} P&=\begin{pmatrix}3/4&1/2\\1/2&1\end{pmatrix}\\ D&=\begin{pmatrix}2&0\\0&1\end{pmatrix}\\ \end{align}
\mathbb{R}^2の基底\{\boldsymbol{v}_1,\ \boldsymbol{v}_2\}とこの基底に関する座標\boldsymbol{x}=(x_1,\ x_2)により、
\begin{align} \boldsymbol{u}&=x_1\boldsymbol{v}_1+x_2\boldsymbol{v}_2\\ &=4\boldsymbol{v}_1+4\boldsymbol{v}_2 \end{align}
と表されるベクトルが存在するものとします。
比較のため、このベクトルの写像を基底の変換を行わずに求めた場合と基底の変換を行ってから求めた場合について計算します。
基底の変換を行わずに求めた場合
線形写像により得られたベクトルの座標\boldsymbol{y}=(y_1,\ y_2)は、
\begin{align} \boldsymbol{y}&=A\boldsymbol{x}\\ &=\begin{pmatrix}5/2&-3/4\\1&1/2\end{pmatrix} \begin{pmatrix}4\\4\end{pmatrix}\\ &=\begin{pmatrix}7\\6\end{pmatrix}\end{align}
より、このベクトルを\boldsymbol{w}とすると、
\begin{align} \boldsymbol{w}&=y_1\boldsymbol{v}_1+y_2\boldsymbol{v}_2\\&=7\boldsymbol{v}_1+6\boldsymbol{v}_2 \end{align}
このように、座標は単純なスカラー倍にはなりません。
基底の変換を行ってから求めた場合
基底の変換行列が対角化におけるPと同一となるよう\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}を選び、これらで\boldsymbol{u}と\boldsymbol{w}を表します。
\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}に関する\boldsymbol{u}の座標を\boldsymbol{x}’=(x’_1,\ x’_2)とすると、
\begin{align} \boldsymbol{x}’&=P^{-1}\boldsymbol{x}\\ &=\begin{pmatrix}2&-1\\-1&3/2\end{pmatrix} \begin{pmatrix}4\\4\end{pmatrix}\\ &=\begin{pmatrix}4\\2\end{pmatrix} \end{align}
となるので、\boldsymbol{u}は、
\begin{align} \boldsymbol{u}&=x’_1\boldsymbol{v}’_1+x’_2\boldsymbol{v}’_2\\ &=4\boldsymbol{v}’_1+2\boldsymbol{v}’_2 \end{align}
と表されます。
基底の変換行列を対角化の式におけるPと同一としたので、Aも変えないのであればDは基底変換後の表現行列でもあり対角行列でもあります。写像によって\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}に関する座標は、
\begin{align} \boldsymbol{y}’&=D\boldsymbol{x}’\\ &=\begin{pmatrix}2&0\\0&1\end{pmatrix} \begin{pmatrix}4\\2\end{pmatrix}\\ &=\begin{pmatrix}8\\2\end{pmatrix} \end{align}
\boldsymbol{w}は、
\begin{align} \boldsymbol{w}&=y’_1\boldsymbol{v}’_1+y’_2\boldsymbol{v}’_2\\ &=8\boldsymbol{v}’_1+2\boldsymbol{v}’_2 \end{align}
したがって\boldsymbol{v}’_1に関する座標を2倍、\boldsymbol{v}’_2に関する座標を1倍にするだけで\boldsymbol{w}の座標が得られます。
\boldsymbol{x}’,\ \boldsymbol{y}’は\{\boldsymbol{v}’_1,\ \boldsymbol{v}’_2\}に関する座標ですが、基底を逆に変換し、
\begin{align} \boldsymbol{y}&=P\boldsymbol{y}’\\ &=\begin{pmatrix}3/4&1/2\\1/2&1\end{pmatrix} \begin{pmatrix}8\\2\end{pmatrix}\\ &=\begin{pmatrix}7\\6\end{pmatrix} \end{align}
とすれば前項と同じ\{\boldsymbol{v}_1,\ \boldsymbol{v}_2\}に関する座標になります。
以上のように、線形写像を基底の変換として考えると、対角化によってそれぞれの座標をスカラー倍するだけで計算できるところが利点と解釈できます。