Matrix decomposition
線型代数学 において 、 固有値分解 とは 行列 を 正準形式 に 分解することであり、行列は 固有値と固有ベクトル を用いて表されます 。この方法では、 対角化可能な行列 のみが分解可能です。分解される行列が 正規行列 または実 対称行列である場合、この分解は スペクトル定理 に由来する「スペクトル分解」と呼ばれます 。
行列の固有ベクトルと固有値の基礎理論 N 次元の (非零)ベクトル vが正方 N × N 行列 A の固有ベクトルであるとは、 あるスカラー λ に対して、次の形式の 線形方程式を 満たす場合を言う 。λ は v に対応する固有値と呼ばれる。幾何学的に言えば、 A の固有ベクトルとは、 A が 単に伸長または縮小するベクトルであり 、その伸長/縮小量が固有値である。上記の方程式は固有値方程式または固有値問題と呼ばれる。 A v = λ v {\displaystyle \mathbf {A} \mathbf {v} =\lambda \mathbf {v} }
これにより、固有値に関する方程式が得られる 。p ( λ ) を特性 多項式 と呼ぶ 。この方程式は特性方程式と呼ばれ、未知数 λに関する N 次多項式方程式である。この方程式には N λ 個 の異なる解が 存在する( 1 ≤ N λ ≤ N) 。解の集合、すなわち固有値は A の スペクトル と呼ばれる。 [1] [2] [3] p ( λ ) = det ( A − λ I ) = 0. {\displaystyle p\left(\lambda \right)=\det \left(\mathbf {A} -\lambda \mathbf {I} \right)=0.}
スカラー体が 代数的に閉じている 場合、 p を 因数分解する と、
整数 n i は 固有値λ i の 代数的重複度 と 呼ばれる 。代数的重複度の和は N となる。 p ( λ ) = ( λ − λ 1 ) n 1 ( λ − λ 2 ) n 2 ⋯ ( λ − λ N λ ) n N λ = 0. {\displaystyle p(\lambda )=\left(\lambda -\lambda _{1}\right)^{n_{1}}\left(\lambda -\lambda _{2}\right)^{n_{2}}\cdots \left(\lambda -\lambda _{N_{\lambda }}\right)^{n_{N_{\lambda }}}=0.} ∑ i = 1 N λ n i = N . {\textstyle \sum _{i=1}^{N_{\lambda }}{n_{i}}=N.}
各固有値 λ i に対して、特定の固有値方程式が成り立ちます
。各固有値方程式には、 1 ≤ m i ≤ n i 個 の線形独立な 解
が存在します。 m i 個の解の線形結合 (零ベクトルを与えるものを除く)は、固有値 λ i に関連付けられた固有ベクトルです。整数 m i は 、 λ i の 幾何学的重複度 と呼ばれます 。代数的重複度 n i と幾何学的重複度 m i は 等しくなることもあれば、そうでないこともありますが、常に m i ≤ n i となります。最も単純なケースは、もちろん、 m i = n i = 1 のときです。線形独立な固有ベクトルの総数 N v は、幾何学的重複度を合計することで計算できます
。 ( A − λ i I ) v = 0. {\displaystyle \left(\mathbf {A} -\lambda _{i}\mathbf {I} \right)\mathbf {v} =0.} ∑ i = 1 N λ m i = N v . {\displaystyle \sum _{i=1}^{N_{\lambda }}{m_{i}}=N_{\mathbf {v} }.}
固有ベクトルは、固有値でインデックス付けすることができます。この場合、 v ij は i 番目の固有値に対する j 番目の固有ベクトルです。また、より単純な表記法である v k (k = 1, 2, ..., N v ) で インデックス付けすることもできます 。
行列の固有分解 A を n × n の正方行列 とし、 n 個 の線形独立な固有ベクトル q i ( i = 1, ..., n )を持つものと する。A は次 の ように 因数分解 できる。ここで Q は A の i 列 目に固有ベクトル q i を持つ正方 n × n 行列であり 、 Λ は 対角要素が対応する固有値 Λ ii = λ i である対角行列 である 。ただし、この方法で因数分解できるのは 対角化可能な行列 のみである。例えば、 欠陥行列 (せん断 行列 )は対角化できない。 A = Q Λ Q − 1 {\displaystyle \mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}} [ 1 1 0 1 ] {\displaystyle \left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]}
n 個の 固有ベクトル q i は 通常は正規化されますが、必ずしもそうである必要はありません。 n 個 の固有ベクトルの正規化されていないセット v i を Q の列として使用することもできます。これは、 Q の固有ベクトルの大きさが Q −1 の存在によって分解でキャンセルされることに注目すれば理解できます 。固有値 λ i の 1 つに複数の線形独立な固有ベクトルがある場合 (つまり、 λ i の幾何学的重複度が 1 より大きい場合)、この固有値 λ i のこれらの固有ベクトルは相互に直交する ように選択できます 。ただし、2 つの固有ベクトルが異なる 2 つの固有値に属する場合、それらを互いに直交させるのは不可能な場合があります (以下の例を参照)。 1 つの特別なケースとして、 A が正規行列の場合、スペクトル定理により、直交基底 {q i } で A を 対角化することが常に可能です 。
この分解は、固有ベクトルの基本特性から導かれます。つまり、 非零の固有値を持つ 線形独立な固有ベクトル q i は、 x ∈ C n に対して、すべての可能な積 A x の基底(必ずしも直交とは限らない)を形成します。これは、 対応する 行列変換の 像 (または 値域 )と、 行列 A の列空間に等しくなります。非零の固有値を持つ線形独立な固有ベクトル q i の数は、 行列 A の階数 、対応する行列変換の像(または値域)の次元、およびその列空間に 等しくなります。 A v = λ v A Q = Q Λ A = Q Λ Q − 1 . {\displaystyle {\begin{aligned}\mathbf {A} \mathbf {v} &=\lambda \mathbf {v} \\\mathbf {A} \mathbf {Q} &=\mathbf {Q} \mathbf {\Lambda } \\\mathbf {A} &=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}.\end{aligned}}}
固有値がゼロである線形独立な固有ベクトル q i は、行列変換 A のヌル空間 (カーネルとも呼ばれる) の基底(直交するように選択できる)を形成します 。
例 2×2実行行列 Aは、特異でない行列 Q の乗算によって対角行列に分解できる。 A = [ 1 0 1 3 ] {\displaystyle \mathbf {A} ={\begin{bmatrix}1&0\\1&3\\\end{bmatrix}}} Q = [ a b c d ] ∈ R 2 × 2 . {\displaystyle \mathbf {Q} ={\begin{bmatrix}a&b\\c&d\end{bmatrix}}\in \mathbb {R} ^{2\times 2}.}
次に、 ある実対角行列について考えます 。 [ a b c d ] − 1 [ 1 0 1 3 ] [ a b c d ] = [ x 0 0 y ] , {\displaystyle {\begin{bmatrix}a&b\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}={\begin{bmatrix}x&0\\0&y\end{bmatrix}},} [ x 0 0 y ] {\displaystyle \left[{\begin{smallmatrix}x&0\\0&y\end{smallmatrix}}\right]}
左辺の方程式の両辺に Q を 掛けると、 次の式は 2 つの 連立方程式 に分解できます。 固有値 x と y を 因数分解すると、 次
の 2 つのベクトル方程式が得られます 。
また、 これは 、2 つの解を固有値として含む単一のベクトル方程式で表すことができます。 ここで、 λ は 2 つの固有値 x と y を表し、 u は ベクトル a と b を表します。 [ 1 0 1 3 ] [ a b c d ] = [ a b c d ] [ x 0 0 y ] . {\displaystyle {\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}={\begin{bmatrix}a&b\\c&d\end{bmatrix}}{\begin{bmatrix}x&0\\0&y\end{bmatrix}}.} { [ 1 0 1 3 ] [ a c ] = [ a x c x ] [ 1 0 1 3 ] [ b d ] = [ b y d y ] . {\displaystyle {\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}={\begin{bmatrix}ax\\cx\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}={\begin{bmatrix}by\\dy\end{bmatrix}}\end{cases}}.} { [ 1 0 1 3 ] [ a c ] = x [ a c ] [ 1 0 1 3 ] [ b d ] = y [ b d ] {\displaystyle {\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=x{\begin{bmatrix}a\\c\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=y{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}} a = [ a c ] , b = [ b d ] , {\displaystyle \mathbf {a} ={\begin{bmatrix}a\\c\end{bmatrix}},\quad \mathbf {b} ={\begin{bmatrix}b\\d\end{bmatrix}},} { A a = x a A b = y b {\displaystyle {\begin{cases}\mathbf {A} \mathbf {a} =x\mathbf {a} \\\mathbf {A} \mathbf {b} =y\mathbf {b} \end{cases}}} A u = λ u {\displaystyle \mathbf {A} \mathbf {u} =\lambda \mathbf {u} }
λ u を 左辺に シフトし、 u を 因数分解
すると、 Q は 非特異な ので、 u が非ゼロであることが必須です。したがって、 行列 A の固有値の解は λ = 1 または λ = 3 となり、 A の固有分解から得られる対角行列は となります 。 ( A − λ I ) u = 0 {\displaystyle \left(\mathbf {A} -\lambda \mathbf {I} \right)\mathbf {u} =\mathbf {0} } det ( A − λ I ) = 0 {\displaystyle \det(\mathbf {A} -\lambda \mathbf {I} )=0} ( 1 − λ ) ( 3 − λ ) = 0 {\displaystyle (1-\lambda )(3-\lambda )=0} [ 1 0 0 3 ] {\displaystyle \left[{\begin{smallmatrix}1&0\\0&3\end{smallmatrix}}\right]}
解を上記の連立方程式に戻すと { [ 1 0 1 3 ] [ a c ] = 1 [ a c ] [ 1 0 1 3 ] [ b d ] = 3 [ b d ] {\displaystyle {\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=1{\begin{bmatrix}a\\c\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=3{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}}
方程式を解くと、次の式が得られます
。したがって、 A の固有分解に必要な 行列 Q は 次のように
なります 。 実数の集合から数 0 を除外することは、 行列 が非特異であることを保証するために必要です。 a = − 2 c and b = 0 , c , d ∈ R ∖ { 0 } . {\displaystyle a=-2c\quad {\text{and}}\quad b=0,\qquad c,d\in \mathbb {R} \setminus \{0\}.} Q = [ − 2 c 0 c d ] , c , d ∈ R ∖ { 0 } , {\displaystyle \mathbf {Q} ={\begin{bmatrix}-2c&0\\c&d\end{bmatrix}},\qquad c,d\in \mathbb {R} \setminus \{0\},} [ − 2 c 0 c d ] − 1 [ 1 0 1 3 ] [ − 2 c 0 c d ] = [ 1 0 0 3 ] , c , d ∈ R ∖ { 0 } . {\displaystyle {\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}={\begin{bmatrix}1&0\\0&3\end{bmatrix}},\qquad c,d\in \mathbb {R} \setminus \{0\}.} R {\displaystyle \mathbb {R} } Q {\displaystyle \mathbf {Q} }
固有分解による逆行列 行列 A が 固有分解可能であり、かつその固有値がいずれもゼロでない場合、 A は 可逆行列 であり 、その逆行列は で与えられます
。 が対称行列である 場合、 は の固有ベクトルから形成される ため 、は 直交行列 であることが保証されます。 したがって、となります。さらに、 Λ は 対角行列 である ため 、その逆行列は簡単に計算できます。 A − 1 = Q Λ − 1 Q − 1 {\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}} A {\displaystyle \mathbf {A} } Q {\displaystyle \mathbf {Q} } A {\displaystyle \mathbf {A} } Q {\displaystyle \mathbf {Q} } Q − 1 = Q T {\displaystyle \mathbf {Q} ^{-1}=\mathbf {Q} ^{\mathrm {T} }} [ Λ − 1 ] i i = 1 λ i {\displaystyle \left[\mathbf {\Lambda } ^{-1}\right]_{ii}={\frac {1}{\lambda _{i}}}}
実用的な意味合い 実測データ 行列に固有値分解を用いる場合 、すべての固有値を上記の形でそのまま用いると、 逆行列 の妥当性が低下する可能性があります。これは、固有値が比較的小さくなるにつれて、逆行列への寄与が大きくなるためです。ゼロ付近、あるいは測定システムの「ノイズ」にある固有値は過度の影響を与え、逆行列を用いた解(検出)を阻害する可能性があります。 [4]
2つの緩和策が提案されています。1つは小さい固有値またはゼロの固有値を切り捨てること、もう1つは最も信頼できる固有値をそれ以下の固有値まで拡張することです。また、統計的根拠に基づくもののバイアスのある手法として、ノイズの影響が大きくなるにつれて固有値をロールオフする ティホノフ正則化も 参照してください。
最初の緩和方法は、元の行列のスパースサンプルに似ており、重要でないと考えられる成分を削除します。ただし、解または検出プロセスがノイズレベルに近い場合、切り捨てによって目的の解に影響を与える成分が削除される可能性があります。
2 番目の緩和策では、固有値が拡張され、低い値は反転に対してあまり影響を及ぼさなくなりますが、それでも寄与は残るため、ノイズに近い解が依然として見つかります。
非常に類似した低い値の固有値が測定ノイズ(ほとんどのシステムでは低いと想定されます)を適切に表していると仮定することで、信頼性の高い固有値を見つけることができます。
固有値が値によってランク付けされている場合、信頼できる固有値は、ソート された固有値の ラプラシアンを最小化することで見つけることができます。 [5] ここで、固有値にはソートされていることを示すために添え字 s が付けられます。最小化の位置は、最も低い信頼できる固有値です。測定システムでは、この信頼できる固有値の平方根が、システムのコンポーネント全体の平均ノイズとなります。 min | ∇ 2 λ s | {\displaystyle \min \left|\nabla ^{2}\lambda _{\mathrm {s} }\right|}
関数微積分 固有値分解により、 行列の 冪級数の計算がはるかに容易になります。f ( x ) が で与えられる
場合 、 Λ は 対角行列 である ため 、 Λ の関数は非常に簡単に計算できます。 f ( x ) = a 0 + a 1 x + a 2 x 2 + ⋯ {\displaystyle f(x)=a_{0}+a_{1}x+a_{2}x^{2}+\cdots } f ( A ) = Q f ( Λ ) Q − 1 {\displaystyle f\!\left(\mathbf {A} \right)=\mathbf {Q} \,f\!\left(\mathbf {\Lambda } \right)\mathbf {Q} ^{-1}} [ f ( Λ ) ] i i = f ( λ i ) {\displaystyle \left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)}
f ( Λ ) の非対角要素は ゼロです。つまり、 f ( Λ ) も対角行列です。したがって、 f ( A ) の計算は、各固有値上の関数を計算するだけで済みます。
同様の手法は、より一般的には、上記の を用いて、 正則関数計算 にも適用できる
。ここでも、 A − 1 = Q Λ − 1 Q − 1 {\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}} [ f ( Λ ) ] i i = f ( λ i ) {\displaystyle \left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)}
例 A 2 = ( Q Λ Q − 1 ) ( Q Λ Q − 1 ) = Q Λ ( Q − 1 Q ) Λ Q − 1 = Q Λ 2 Q − 1 A n = Q Λ n Q − 1 exp A = Q exp ( Λ ) Q − 1 {\displaystyle {\begin{aligned}\mathbf {A} ^{2}&=\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)=\mathbf {Q} \mathbf {\Lambda } \left(\mathbf {Q} ^{-1}\mathbf {Q} \right)\mathbf {\Lambda } \mathbf {Q} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{2}\mathbf {Q} ^{-1}\\[1.2ex]\mathbf {A} ^{n}&=\mathbf {Q} \mathbf {\Lambda } ^{n}\mathbf {Q} ^{-1}\\[1.2ex]\exp \mathbf {A} &=\mathbf {Q} \exp(\mathbf {\Lambda } )\mathbf {Q} ^{-1}\end{aligned}}} これらは関数 の例です 。さらに、は 指数行列 です 。 f ( x ) = x 2 , f ( x ) = x n , f ( x ) = exp x {\displaystyle f(x)=x^{2},\;f(x)=x^{n},\;f(x)=\exp {x}} exp A {\displaystyle \exp {\mathbf {A} }}
スペクトル行列の分解 スペクトル行列は、異なる固有値と完全な固有ベクトルを持つ行列です。この特性により、スペクトル行列は完全に対角化可能であり、固有値分解を用いてより単純な形に分解することができます。この分解プロセスは、特に量子力学、信号処理、数値解析などの分野において、行列の構造と挙動に関する基本的な知見をもたらします。 [6]
正規行列 複素数値正方行列 が 正規行列 (つまり 、 、ここで は共役 転置 )である場合、かつそれが と分解できる場合のみ 、 は ユニタリ 行列 (つまり )、 diag( ) は 対角行列 である。 [7] の 列は 直交基底 を形成し 、 の固有ベクトル で、対応する固有値を持つ 。 [8] A {\displaystyle A} A ∗ A = A A ∗ {\displaystyle \mathbf {A} ^{*}\mathbf {A} =\mathbf {A} \mathbf {A} ^{*}} A ∗ {\displaystyle \mathbf {A} ^{*}} A = U Λ U ∗ {\displaystyle \mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}} U {\displaystyle \mathbf {U} } U ∗ = U − 1 {\displaystyle \mathbf {U} ^{*}=\mathbf {U} ^{-1}} Λ = {\displaystyle \mathbf {\Lambda } =} λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}} u 1 , ⋯ , u n {\displaystyle \mathbf {u} _{1},\cdots ,\mathbf {u} _{n}} U {\displaystyle \mathbf {U} } A {\displaystyle \mathbf {A} } λ 1 , … , λ n {\displaystyle \lambda _{1},\ldots ,\lambda _{n}}
たとえば、2 x 2 の正規行列を考えます 。 A = [ 1 2 2 1 ] {\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\2&1\end{bmatrix}}}
固有値は および です 。 λ 1 = 3 {\displaystyle \lambda _{1}=3} λ 2 = − 1 {\displaystyle \lambda _{2}=-1}
これらの固有値に対応する(正規化された)固有ベクトルは、 およびです 。 u 1 = 1 2 [ 1 1 ] {\displaystyle \mathbf {u} _{1}={\frac {1}{\sqrt {2}}}{\begin{bmatrix}1\\1\end{bmatrix}}} u 2 = 1 2 [ − 1 1 ] {\displaystyle \mathbf {u} _{2}={\frac {1}{\sqrt {2}}}{\begin{bmatrix}-1\\1\end{bmatrix}}}
対角化は ( 、 、 )です 。 A = U Λ U ∗ {\displaystyle \mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}} U = [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] {\displaystyle \mathbf {U} ={\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}} Λ = {\displaystyle \mathbf {\Lambda } =} [ 3 0 0 − 1 ] {\displaystyle {\begin{bmatrix}3&0\\0&-1\end{bmatrix}}} U ∗ = U − 1 = {\displaystyle \mathbf {U} ^{*}=\mathbf {U} ^{-1}=} [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] {\displaystyle {\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}}
検証は です 。 U Λ U ∗ = {\displaystyle \mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}=} [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] {\displaystyle {\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}} [ 3 0 0 − 1 ] {\displaystyle {\begin{bmatrix}3&0\\0&-1\end{bmatrix}}} [ 1 / 2 1 / 2 1 / 2 − 1 / 2 ] {\displaystyle {\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}} = [ 1 2 2 1 ] = A {\displaystyle ={\begin{bmatrix}1&2\\2&1\end{bmatrix}}=\mathbf {A} }
この例では、固有値と固有ベクトルを求め、ユニタリ行列 と対角行列を形成し 、分解を検証すること によって 、正規行列を対角化するプロセスを示します。 A {\displaystyle \mathbf {A} } U {\displaystyle \mathbf {U} } Λ {\displaystyle \mathbf {\Lambda } }
重要な行列のクラスのサブセット
実対称行列 特別な場合として、任意の n × n 実 対称行列 に対して、固有値は実数であり、固有ベクトルは実数かつ直交 とすることができる 。 したがって、実対称行列 A はと分解することができる 。ここで、 Q は A の実数かつ直交する固有ベクトルを列とする 直交行列 であり 、 Λは A の固有値を要素とする対角行列である 。 [9] A = Q Λ Q T {\displaystyle \mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{\mathsf {T}}}
対角化可能な行列 対角化可能な 行列は、線形独立な固有ベクトルの完全な集合を持つ限り、固有分解を用いて分解することができる。これらは と表される。 ここで、 は の列が の固有ベクトルである行列であり 、 は の対応する固有値からなる対角行列である 。 [8] A = P D P − 1 {\displaystyle \mathbf {A} =\mathbf {P} \mathbf {D} \mathbf {P} ^{-1}} P {\displaystyle \mathbf {P} } A {\displaystyle \mathbf {A} } D {\displaystyle \mathbf {D} } A {\displaystyle \mathbf {A} }
正定値行列 正 定値行列とは、すべての固有値が正である行列である。 コレスキー分解 ( は 下三角行列) を用いて と分解することができる。 [10] A = L L T {\displaystyle \mathbf {A} =\mathbf {L} \mathbf {L} ^{\mathsf {T}}} L {\displaystyle \mathbf {L} }
ユニタリ行列とエルミート行列 ユニタリ行列は (実数の場合)または (複素数の場合) を満たす。ここで、は 共役転置 、は 共役転置を表す。これらはユニタリ変換を用いて対角化される 。 [ 8 ] U U ∗ = I {\displaystyle \mathbf {U} \mathbf {U} ^{*}=\mathbf {I} } U U † = I {\displaystyle \mathbf {U} \mathbf {U} ^{\dagger }=\mathbf {I} } U ∗ {\displaystyle \mathbf {U} ^{*}} U † {\displaystyle \mathbf {U} ^{\dagger }}
エルミート行列は を満たす 。ここで は 共役転置を表す。これらはユニタリ行列または 直交行列 を用いて対角化できる。 [8] H = H † {\displaystyle \mathbf {H} =\mathbf {H} ^{\dagger }} H † {\displaystyle \mathbf {H} ^{\dagger }}
役立つ事実
固有値に関する有用な事実 固有値の積は、 A の 行列式 に等しくなります。各固有値は、 代数的重複度である n i 乗されることに注意してください 。 det ( A ) = ∏ i = 1 N λ λ i n i {\displaystyle \det \left(\mathbf {A} \right)=\prod _{i=1}^{N_{\lambda }}{\lambda _{i}^{n_{i}}}} 固有値の合計は、 A の トレース に等しくなります。各固有値には、 代数的重複度 n i が乗算されることに注意してください 。 tr ( A ) = ∑ i = 1 N λ n i λ i {\displaystyle \operatorname {tr} \left(\mathbf {A} \right)=\sum _{i=1}^{N_{\lambda }}{{n_{i}}\lambda _{i}}} A の固有値が λ i で 、 Aが逆行列を持つ場合、 A −1 の固有値 は単に λ −1 i 。 A の固有値が λ i であれば、 任意の正則関数 f に対して、 f ( A ) の固有値は 単に f ( λ i ) になります。
固有ベクトルに関する有用な事実 A がエルミート 行列かつフルランク行列である 場合 、固有ベクトルの基底は互いに 直交する ように選択することができる。固有値は実数である。 A −1 の固有ベクトルは A の固有ベクトルと同じです 。 固有ベクトルは乗法定数までしか定義されません。つまり、 Av = λ v ならば、 任意のスカラー c ≠ 0に対して c v も固有ベクトルとなります。特に、 − v と e iθ v (任意の θ に対して)も固有ベクトルとなります。 退化した固有値(複数の固有ベクトルを持つ固有値)の場合、固有ベクトルには線形変換の自由度が追加されます。つまり、(退化した部分空間内の)固有値を共有する固有ベクトルの任意の線形(直交)組み合わせは、それ自体が(部分空間内の)固有ベクトルになります。
固有値分解に関する有用な事実 Aは 、線形独立な固有ベクトルの数 N v が固有ベクトルの次元に等しい場合にのみ、固有分解できる: N v = N スカラー体が代数的に閉じており、 p ( λ ) に重根がない場合、つまり、 A は 固有分解できます。 N λ = N , {\displaystyle N_{\lambda }=N,} 「 A は 固有分解できる」 という記述は、 一部の固有値がゼロになる可能性があり、逆変換できないため、 A に逆が存在することを意味するもので はありません。 「 A には逆行列が存在する」 という記述は、 A が 固有分解可能であることを意味しませ ん 。反例として 、逆行列である 欠陥行列 が挙げられます。 [ 1 1 0 1 ] {\displaystyle \left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]}
逆行列に関する有用な事実 A は 、すべての固有値がゼロでない 場合にのみ 反転できます λ i ≠ 0 ∀ i {\displaystyle \lambda _{i}\neq 0\quad \forall \,i} λ i ≠ 0 かつ N v = N の場合 、逆関数は次のように表される。 A − 1 = Q Λ − 1 Q − 1 {\displaystyle \mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}}
数値計算
固有値の数値計算 与えられた行列の固有値を計算したいとします。行列が小さい場合は、 特性多項式 を用いて記号的に計算できます。しかし、大きな行列ではこれが不可能な場合が多く、その場合は 数値計算法 を 使用する必要があります 。
実際には、大きな行列の固有値は特性多項式を用いて計算されません。多項式の計算自体がコストが高く、高次多項式の正確な(記号的な)根を計算して表現することは困難です。 アーベル・ルフィニの定理 によれば、高次(5次以上)の多項式の根は、一般に単純に n乗根を用いて表現することはできません。したがって、固有ベクトルと固有値を求める一般的なアルゴリズムは 反復的 です 。
ニュートン法 など、多項式の根を近似する反復数値アルゴリズムは存在する が、一般的には特性多項式を計算してからこれらの手法を適用するのは現実的ではない。その理由の一つは、特性多項式の係数における小さな 丸め誤差が、 固有値と固有ベクトルに大きな誤差をもたらす可能性があることである。根は 係数の極めて 条件の悪い関数であるからである。 [11]
単純かつ正確な反復法は べき乗法 である。 ランダム ベクトル v が選択され、単位ベクトル の列が 次のように計算される。 A v ‖ A v ‖ , A 2 v ‖ A 2 v ‖ , A 3 v ‖ A 3 v ‖ , … {\displaystyle {\frac {\mathbf {A} \mathbf {v} }{\left\|\mathbf {A} \mathbf {v} \right\|}},{\frac {\mathbf {A} ^{2}\mathbf {v} }{\left\|\mathbf {A} ^{2}\mathbf {v} \right\|}},{\frac {\mathbf {A} ^{3}\mathbf {v} }{\left\|\mathbf {A} ^{3}\mathbf {v} \right\|}},\ldots }
この シーケンスは、 v が 固有ベクトルの基底にこの固有ベクトルの非ゼロ成分を持つ 場合(また、最大の大きさの固有値が 1 つだけである場合)、 ほぼ常に 最大の大きさの固有値に対応する固有ベクトルに収束します。 この単純なアルゴリズムは、いくつかの実用的なアプリケーションで役立ちます。たとえば、 Google は、 検索エンジンでドキュメントの ページランクを 計算するためにこれを使用しています。 [12] また、べき乗法は、多くのより洗練されたアルゴリズムの出発点です。 たとえば、シーケンスの最後のベクトルだけでなく、シーケンス内の すべての ベクトルの 範囲 を調べることで、固有ベクトルのより良い(より速く収束する)近似値を取得できます。このアイデアは、 アーノルディ反復法 の基礎となっています。 [11] また、重要な QR アルゴリズム も、べき乗法の微妙な変換に基づいています。 [11]
固有ベクトルの数値計算 固有値が計算されると、 ガウス消去法 または 行列方程式を解く 他の方法を 使用して方程式を 解くことによって、固有ベクトルを計算できます 。 ( A − λ i I ) v i , j = 0 {\displaystyle \left(\mathbf {A} -\lambda _{i}\mathbf {I} \right)\mathbf {v} _{i,j}=\mathbf {0} }
しかし、実用的な大規模固有値法では、固有ベクトルは通常、固有値計算の副産物として他の方法で計算されます。 たとえば、 べき乗反復法 では、固有ベクトルは実際には固有値(通常は固有ベクトルの レイリー商によって計算されます)の前に計算されます。 [11] エルミート行列 (または任意の正規行列) のQRアルゴリズムでは、直交固有ベクトルは アルゴリズムの手順から Q 行列の積として得られます。 [11] (より一般的な行列の場合、QRアルゴリズムは最初に シュアー分解を生成し、そこから バックサブスティ テューション手順によって固有ベクトルを取得できます 。 [13] )エルミート行列の場合、固有ベクトルと固有値の両方が必要な場合、 分割統治固有値アルゴリズムは QRアルゴリズムよりも効率的です。 [11]
追加トピック
一般化固有空間 固有値の 幾何学的重複度は、関連する固有空間、つまり λ I − A の ヌル 空間の次元として記述できることを思い出してください 。代数的重複度も次元として考えることができます。これは、十分 に 大きい任意の k に対する行列( λ I − A ) k のヌル空間である、関連する 一般化固有空間 (第 1 の意味) の次元です。つまり、 一般化固有ベクトル の空間(第 1 の意味) であり、一般化固有ベクトルとは、 λ I − A を 十分な回数連続して適用した場合に 最終的に 0 になる任意のベクトルです。任意の固有ベクトルは一般化固有ベクトルであるため、各固有空間は関連する一般化固有空間に含まれます。これにより、幾何学的重複度は常に代数的重複度以下であることが簡単に証明されます。
この用法は、以下で説明する一般化固有値問題 と混同しないでください 。
共役固有ベクトル 共役固有ベクトル または 共役 ベクトル は、その共役のスカラー倍に変換された後に送られるベクトルであり、スカラーは線形変換の 共役固有値 または 共役固有値 と呼ばれます。共役ベクトルと共役値は、通常の固有ベクトルおよび固有値と本質的に同じ情報と意味を表しますが、代替座標系が使用される場合に発生します。対応する方程式は、 たとえば、コヒーレント電磁散乱理論では、線形変換 A は散乱物体によって実行されるアクションを表し、固有ベクトルは電磁波の偏光状態を表します。 光学 では、座標系は波の観点から定義され、 前方散乱アライメント (FSA) と呼ばれ、通常の固有値方程式が生成されますが、 レーダー では、座標系はレーダーの観点から定義され、 後方散乱アライメント (BSA) と呼ばれ、共役値方程式が生成されます。 A v = λ v ∗ . {\displaystyle \mathbf {A} \mathbf {v} =\lambda \mathbf {v} ^{*}.}
一般化固有値問題 一般 化固有値問題 (第二の意味)とは、 A と B が行列である とき、次式に 従う
(非零)ベクトル v を求める問題である。v が この式に従い、ある λ を仮定するとき、 v を A と B の(第二の意味における) 一般 化固有ベクトル と呼び 、 λ を A と B の (第二の意味における) 一般化固有値 と呼び、これは一般化固有ベクトル v に対応する。λ の取り得る値は、 次 の式に従う必要がある
。 A v = λ B v {\displaystyle \mathbf {A} \mathbf {v} =\lambda \mathbf {B} \mathbf {v} } det ( A − λ B ) = 0. {\displaystyle \det(\mathbf {A} -\lambda \mathbf {B} )=0.}
もし n個 の線形独立ベクトル { v 1 , …, v n } が見つかり、任意の i ∈ {1, …, n } に対して、 Av i = λ i Bv iが 成り立つとすると、行列P と Dを次 のように 定義する。 すると次の等式が成り立つ。 そして証明は P = [ | | v 1 ⋯ v n | | ] ≡ [ ( v 1 ) 1 ⋯ ( v n ) 1 ⋮ ⋮ ( v 1 ) n ⋯ ( v n ) n ] {\displaystyle P={\begin{bmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{bmatrix}}\equiv {\begin{bmatrix}(\mathbf {v} _{1})_{1}&\cdots &(\mathbf {v} _{n})_{1}\\\vdots &&\vdots \\(\mathbf {v} _{1})_{n}&\cdots &(\mathbf {v} _{n})_{n}\end{bmatrix}}} ( D ) i j = { λ i , if i = j 0 , otherwise {\displaystyle (D)_{ij}={\begin{cases}\lambda _{i},&{\text{if }}i=j\\0,&{\text{otherwise}}\end{cases}}} A = B P D P − 1 {\displaystyle \mathbf {A} =\mathbf {B} \mathbf {P} \mathbf {D} \mathbf {P} ^{-1}} A P = A [ | | v 1 ⋯ v n | | ] = [ | | A v 1 ⋯ A v n | | ] = [ | | λ 1 B v 1 ⋯ λ n B v n | | ] = [ | | B v 1 ⋯ B v n | | ] D = B P D {\displaystyle \mathbf {A} \mathbf {P} =\mathbf {A} {\begin{bmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\\lambda _{1}B\mathbf {v} _{1}&\cdots &\lambda _{n}B\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\B\mathbf {v} _{1}&\cdots &B\mathbf {v} _{n}\\|&&|\end{bmatrix}}\mathbf {D} =\mathbf {B} \mathbf {P} \mathbf {D} }
そして、 P は逆数であるため、右からの方程式にその逆数を掛け合わせると、証明が完了します。
A − λ B ( λ は複素数) の形式の行列の集合は行列 ペンシル と呼ばれます。行列 ペンシル という用語は、行列のペア ( A 、 B ) を指すこともあります。 [14]
B が逆行列を持つ場合 、元の問題は 標準的な固有値問題の形で表すことができます。しかし、ほとんどの場合、逆行列を求めるのではなく、元の一般化固有値問題を解く方が望ましいでしょう。これは、 A と B が エルミート行列 である場合に特に重要です 。この場合、 B −1 A は 一般にエルミート行列ではなく、解の重要な性質はもはや明らかではないからです。 B − 1 A v = λ v {\displaystyle \mathbf {B} ^{-1}\mathbf {A} \mathbf {v} =\lambda \mathbf {v} }
A と Bが ともに対称行列またはエルミート行列であり、 B も正定値行列 である 場合 、固有値 λ i は 実数であり、 異なる固有値を持つ固有ベクトル v 1 と v 2は B 直交( v 1 * Bv 2 = 0 )である。 [15] この場合、上で定義した行列 Pが または を満たす
ように固有ベクトルを選択でき、一般化固有ベクトルの 基底 が存在する(これは 欠陥 問題ではない )。 [14] この場合は、 エルミート定値ペンシル または 定値ペンシル と呼ばれることもある。 [14] P ∗ B P = I {\displaystyle \mathbf {P} ^{*}\mathbf {B} \mathbf {P} =\mathbf {I} } P P ∗ B = I , {\displaystyle \mathbf {P} \mathbf {P} ^{*}\mathbf {B} =\mathbf {I} ,}
参照
注記 ^ Golub, Gene H.; Van Loan, Charles F. (1996), Matrix Computations (第3版), ボルチモア: Johns Hopkins University Press , p. 310, ISBN 978-0-8018-5414-9 ^ Kreyszig, Erwin (1972), Advanced Engineering Mathematics (第3版), New York: Wiley , p. 273, ISBN 978-0-471-50728-4 ^ Nering, Evar D. (1970). 線形代数と行列理論 (第2版). ニューヨーク: Wiley . p. 270. LCCN 76091646. ^ Hayde, AF; Twede, DR (2002). Shen, Sylvia S. (編). 「固有値、機器ノイズ、および検出性能の関係に関する考察」. Imaging Spectrometry VIII . Proceedings of SPIE. 4816 : 355. Bibcode :2002SPIE.4816..355H. doi :10.1117/12.453777. S2CID 120953647. ^ Twede, DR; Hayden, AF (2004). Shen, Sylvia S; Lewis, Paul E (編). 「共分散行列逆行列の拡張法の正規化による改良と一般化」. Imaging Spectrometry IX . Proceedings of SPIE. 5159 : 299. Bibcode :2004SPIE.5159..299T. doi :10.1117/12.506993. S2CID 123123072. ^ アレール、グレゴワール (2008)。数値線形代数。スプリンガー。 ISBN 978-0-387-34159-0 。 ^ ホーン&ジョンソン 1985、p. 133、定理2.5.3 ^ abcd Shores, Thomas S (2006). 「応用線形代数と行列解析」 ^ ホーン&ジョンソン 1985、136ページ、補論2.5.11 ^ Carl D. Meyer (2023). 行列解析と応用線形代数 (第2版). Society for Industrial and Applied Mathematics. ISBN 9781611977431 。 ^ abcdef トレフェセン、ロイド N. ;バウ、デヴィッド (1997)。 数値線形代数 。サイアム。 ISBN 978-0-89871-361-9 。 ^ Ipsen, Ilse 、および Rebecca M. Wills、「 Google の PageRank の分析と計算」、2018 年 9 月 21 日に Wayback Machine にアーカイブ、第 7 回 IMACS 国際科学計算反復法シンポジウム、フィールズ研究所、トロント、カナダ、2005 年 5 月 5 ~ 8 日。 ^ クアルテローニ、アルフィオ ;サッコ、リッカルド。サレリ、ファウスト (2000)。 「セクション5.8.2」。数値数学。スプリンガー。 p. 15.ISBN 978-0-387-98959-4 。 ^ abc Bai、Z.; デメル、J .ドンガラ、J.ルーエ、A. Van Der Vorst、H. 編(2000年)。 「一般化エルミート固有値問題」。代数固有値問題の解決のためのテンプレート: 実践ガイド。フィラデルフィア:サイアム。 ISBN 978-0-89871-471-5 . 2010年8月21日時点のオリジナルよりアーカイブ 。 2022年9月9日 閲覧。 ^ パーレット、ベレスフォード・N. (1998). 対称固有値問題(再版). フィラデルフィア: 産業応用数学協会. p. 345. doi :10.1137/1.9781611971163. ISBN 978-0-89871-402-9 。
参考文献
外部リンク スペクトル分解のインタラクティブなプログラムとチュートリアル。