Matrix operation generalizing exponentiation of scalar numbers
数学 において 、 指数行列は 、通常の 指数 関数に類似した正方 行列上の 行列関数 である 。これは、線形微分方程式系を解く際に用いられる。リー群の理論において、指数行列は、 行列 リー代数 と対応する リー群との間の 指数写像 を与える。
X を n × n の 実数 または 複素 行列 と する 。X の指数関数は e X または exp( X ) で表され 、 次のべき 級数で与えられる n × n行列である。
e X = ∑ k = 0 ∞ 1 k ! X k {\displaystyle e^{X}=\sum _{k=0}^{\infty }{\frac {1}{k!}}X^{k}}
ここで、は 、およびと 同じ 次元の 単位 行列として定義されます 。 [1]この級数は常に収束するため、 X の指数は 明確に定義されます。 X 0 {\displaystyle X^{0}} I {\displaystyle I} X {\displaystyle X} X k = X X k − 1 {\displaystyle X^{k}=XX^{k-1}}
同様に、 e X = lim k → ∞ ( I + X k ) k {\displaystyle e^{X}=\lim _{k\rightarrow \infty }\left(I+{\frac {X}{k}}\right)^{k}}
整数値の k の場合、 Iは n × n 単位行列 です 。
同様に、行列指数関数は(行列)微分方程式の 解によって与えられる。 Y ( t ) = e X t {\displaystyle Y(t)=e^{Xt}}
d d t Y ( t ) = X Y ( t ) , Y ( 0 ) = I . {\displaystyle {\frac {d}{dt}}Y(t)=X\,\,Y(t),\quad Y(0)=I.}
X が n × n 対角行列 の場合、 exp( X )は n × n 対角行列になり、各対角要素は X の対応する対角要素に適用された 通常の 指数 に等しくなります 。
プロパティ
基本的な性質 X と Y を n × n 複素行列とし、 a と b を 任意 の複素数とする。n×n単位行列をI、零行列を0で表す。 指数 行列 は 以下 の 性質 を 満たす。 [2]
まず、べき級数としての定義から直接得られる特性から始めます。
e 0 = 私 exp( X T ) = (exp X ) T 、ここで X Tは X の 転置を 表します 。 exp( X ∗ ) = (exp X ) ∗ 、ここで X ∗ は X の 共役転置 を表します 。 Y が逆関数 の 場合、 e YXY −1 = Ye X Y −1 となります 。 次の重要な結果は次のとおりです。
もし そうなら 。 X Y = Y X {\displaystyle XY=YX} e X e Y = e X + Y {\displaystyle e^{X}e^{Y}=e^{X+Y}} この恒等式の証明は、実数の指数関数の対応する恒等式を求める標準的な冪級数の議論と同じです。つまり、 と が 可換である 限り X {\displaystyle X} Y {\displaystyle Y} 、と が数であるか行列で あるかは議論に何ら影響を与えません。ただし 、 と が可換でない 場合、この恒等式は一般に成立しないことに注意することが重要です (下記のゴールデン・トンプソン不等式を参照)。 X {\displaystyle X} Y {\displaystyle Y} X {\displaystyle X} Y {\displaystyle Y}
前述のアイデンティティの結果は次のとおりです。
e aX e bX = e ( a + b ) X e X e − X = I 上記の結果を用いることで、以下の主張を容易に検証できる。Xが対称ならば e X も 対称 で あり 、 X が 歪対称 ならば e X は直交で ある 。Xがエルミートなら ば e X も エルミート で あり、 X が 歪エルミート ならば e X はユニタリで ある 。
最後に、 行列指数の ラプラス変換は、 s の十分に大きい正の値すべてに対して 、 解決子 に相当します。 ∫ 0 ∞ e − t s e t X d t = ( s I − X ) − 1 {\displaystyle \int _{0}^{\infty }e^{-ts}e^{tX}\,dt=(sI-X)^{-1}}
線形微分方程式系 行列指数関数が重要な理由の一つは、線形常微分方程式 系を解くのに使えることです。A を 定数 行列、 y を列ベクトルとすると、 の解は
次のように与えられます。 d d t y ( t ) = A y ( t ) , y ( 0 ) = y 0 , {\displaystyle {\frac {d}{dt}}y(t)=Ay(t),\quad y(0)=y_{0},} y ( t ) = e A t y 0 . {\displaystyle y(t)=e^{At}y_{0}.}
行列指数は不同次方程式を解くのにも使用できます。 例については、以下の応用のセクションを参照してください。 d d t y ( t ) = A y ( t ) + z ( t ) , y ( 0 ) = y 0 . {\displaystyle {\frac {d}{dt}}y(t)=Ay(t)+z(t),\quad y(0)=y_{0}.}
A が定数ではない
形式 の微分方程式には閉じた形の解は存在しません が、 マグヌス級数は 解を無限和として与えます。 d d t y ( t ) = A ( t ) y ( t ) , y ( 0 ) = y 0 , {\displaystyle {\frac {d}{dt}}y(t)=A(t)\,y(t),\quad y(0)=y_{0},}
行列指数の行列式 ヤコビの公式 によれば 、任意の複素正方行列に対して次の トレース恒等式 が成り立つ: [3]
det ( e A ) = e tr ( A ) . {\displaystyle \det \left(e^{A}\right)=e^{\operatorname {tr} (A)}~.}
この式は計算ツールを提供するだけでなく、指数行列が常に 逆行列で あることを示しています。これは、上式の右辺が常に非ゼロであり、したがって det( e A ) ≠ 0 で あるという事実から導かれ、 e A は 必ず逆行列であることを意味します。
実数値の場合、前述の複素数の場合とは対照的に、この式は写像が 射影的 でないことも示しています 。これは、実数値行列の場合、式の右辺は常に正であるのに対し、負の行列式を持つ逆行列が存在するという事実から導き出されます。 exp : M n ( R ) → G L ( n , R ) {\displaystyle \exp \colon M_{n}(\mathbb {R} )\to \mathrm {GL} (n,\mathbb {R} )}
実対称行列 実対称行列の指数行列は正定値行列である。n × n の 実対称行列と 列ベクトル をそれぞれとする。指数行列と対称行列の基本的な性質を用いると、以下の式が得られる。 S {\displaystyle S} x ∈ R n {\displaystyle x\in \mathbb {R} ^{n}}
x T e S x = x T e S / 2 e S / 2 x = x T ( e S / 2 ) T e S / 2 x = ( e S / 2 x ) T e S / 2 x = ‖ e S / 2 x ‖ 2 ≥ 0. {\displaystyle x^{T}e^{S}x=x^{T}e^{S/2}e^{S/2}x=x^{T}(e^{S/2})^{T}e^{S/2}x=(e^{S/2}x)^{T}e^{S/2}x=\lVert e^{S/2}x\rVert ^{2}\geq 0.}
は可逆なので 、等式は に対してのみ成立し 、 すべての非ゼロ に対して が成立します 。したがって、 は正定値です。 e S / 2 {\displaystyle e^{S/2}} x = 0 {\displaystyle x=0} x T e S x > 0 {\displaystyle x^{T}e^{S}x>0} x {\displaystyle x} e S {\displaystyle e^{S}}
和の指数 任意の実数(スカラー) x と y に対して、指数関数は e x + y = e x e y を満たすことが知られています。これは可換行列についても当てはまります。行列 X と Y が 可換(つまり XY = YX )である場合、 e X + Y = e X e Y . {\displaystyle e^{X+Y}=e^{X}e^{Y}.}
ただし、交換されない行列の場合、上記の等式は必ずしも成立しません。
X と Y が交換可能でなくても 、指数関数 e X + Y はリー積の公式 [4] によって計算できる。 e X + Y = lim k → ∞ ( e 1 k X e 1 k Y ) k . {\displaystyle e^{X+Y}=\lim _{k\to \infty }\left(e^{{\frac {1}{k}}X}e^{{\frac {1}{k}}Y}\right)^{k}.}
上記を近似するために 大きな有限 kを使用することは、 数値時間発展 でよく使用される鈴木-トロッター展開の基礎です。
逆に、 X と Y が十分に小さい(ただし必ずしも可換である必要はない)行列であれば、次式が成り立ちます。 ここで Zは、 ベイカー・キャンベル・ハウスドルフの公式 を用いて 、 X と Y の 交換子 の級数として計算できます。 [5]ここで、残りの項はすべて X と Y を含む繰り返し交換子です 。X と Y が 可換であれば、すべての交換子はゼロとなり、 Z = X + Y となります。 e X e Y = e Z , {\displaystyle e^{X}e^{Y}=e^{Z},} Z = X + Y + 1 2 [ X , Y ] + 1 12 [ X , [ X , Y ] ] − 1 12 [ Y , [ X , Y ] ] + ⋯ , {\displaystyle Z=X+Y+{\frac {1}{2}}[X,Y]+{\frac {1}{12}}[X,[X,Y]]-{\frac {1}{12}}[Y,[X,Y]]+\cdots ,}
エルミート行列の指数関数の不等式 エルミート行列 の場合、 行列指数の トレース に関連した注目すべき定理があります。
A と B がエルミート行列である 場合、 [6] tr exp ( A + B ) ≤ tr [ exp ( A ) exp ( B ) ] . {\displaystyle \operatorname {tr} \exp(A+B)\leq \operatorname {tr} \left[\exp(A)\exp(B)\right].}
交換可能性は要求されない。ゴールデン・トンプソン不等式は3つの行列には拡張できないことを示す反例があり、いずれにせよ、 tr(exp( A )exp( B )exp( C ))がエルミート行列 A 、 B 、 C に対して実数であるとは保証されない 。しかし、 リープは [7] [8] 、式を次のように変形すれば3つの行列に一般化できることを 証明した。 tr exp ( A + B + C ) ≤ ∫ 0 ∞ d t tr [ e A ( e − B + t ) − 1 e C ( e − B + t ) − 1 ] . {\displaystyle \operatorname {tr} \exp(A+B+C)\leq \int _{0}^{\infty }\mathrm {d} t\,\operatorname {tr} \left[e^{A}\left(e^{-B}+t\right)^{-1}e^{C}\left(e^{-B}+t\right)^{-1}\right].}
指数マップ 行列の指数は常に 可逆行列です。 e X の逆行列は e − X で与えられます 。これは、複素数の指数が常に非ゼロであるという事実に類似しています。したがって、行列指数は、
すべての n × n 行列 の空間から n 次 一般線型群 、つまり すべての n × n 可逆行列の 群 への写像を与えます。実際、この写像は 射影的 であり、つまりすべての可逆行列は他の行列の指数として表すことができます [9] (このためには、複素数の体 Cを考慮し、 R を 考慮することが不可欠です )。 exp : M n ( C ) → G L ( n , C ) {\displaystyle \exp \colon M_{n}(\mathbb {C} )\to \mathrm {GL} (n,\mathbb {C} )}
任意の2つの行列 X と Y について、 ‖ e X + Y − e X ‖ ≤ ‖ Y ‖ e ‖ X ‖ e ‖ Y ‖ , {\displaystyle \left\|e^{X+Y}-e^{X}\right\|\leq \|Y\|e^{\|X\|}e^{\|Y\|},}
ここで ‖ · ‖ は任意の 行列ノルム を表す。したがって、指数写像は M n ( C ) の コンパクト 部分集合上で 連続 かつ リプシッツ連続 となる。
この写像は
、一般線型群において t = 0 で単位元を通過する 滑らかな 曲線
を定義します 。 t ↦ e t X , t ∈ R {\displaystyle t\mapsto e^{tX},\qquad t\in \mathbb {R} }
実際、これは 一般線型群の 1パラメータ部分群を与える。 e t X e s X = e ( t + s ) X . {\displaystyle e^{tX}e^{sX}=e^{(t+s)X}.}
この曲線(または接線ベクトル )の点 t における微分は 次のように与えられる。
d d t e t X = X e t X = e t X X . {\displaystyle {\frac {d}{dt}}e^{tX}=Xe^{tX}=e^{tX}X.} 1
t = 0 における導関数は 行列 X そのもので、つまり X は この 1 パラメータ サブグループを生成します。
より一般的には、 [10] 一般的な t 依存指数 X ( t ) に対して、
d d t e X ( t ) = ∫ 0 1 e α X ( t ) d X ( t ) d t e ( 1 − α ) X ( t ) d α . {\displaystyle {\frac {d}{dt}}e^{X(t)}=\int _{0}^{1}e^{\alpha X(t)}{\frac {dX(t)}{dt}}e^{(1-\alpha )X(t)}\,d\alpha ~.}
上記の式 e X ( t ) を積分符号の外側に置き、アダマールの補題 を用いて積分関数を展開すると、 行列指数の導関数を表す次の便利な式が得られる。 [11] e − X ( t ) ( d d t e X ( t ) ) = d d t X ( t ) − 1 2 ! [ X ( t ) , d d t X ( t ) ] + 1 3 ! [ X ( t ) , [ X ( t ) , d d t X ( t ) ] ] − ⋯ {\displaystyle e^{-X(t)}\left({\frac {d}{dt}}e^{X(t)}\right)={\frac {d}{dt}}X(t)-{\frac {1}{2!}}\left[X(t),{\frac {d}{dt}}X(t)\right]+{\frac {1}{3!}}\left[X(t),\left[X(t),{\frac {d}{dt}}X(t)\right]\right]-\cdots }
上記の式の係数は指数関数に現れる係数とは異なります。閉じた形式については、 指数関数写像の微分を 参照してください。
エルミート行列に限定した場合の方向微分 を異なる固有値を持つエルミート 行列とする 。 をその固有分解とする。ここで はユニタリ行列で 、その列は の固有ベクトル、 はその共役転置、 は 対応する固有値のベクトルである。すると、 任意のエルミート行列 に対して 、 方向における の 方向 微分は [12] [13] となる
。 ここで 、演算子は アダマール積を表し、すべての に対して 、行列 は と定義される。 さらに、 任意のエルミート行列に対して、 方向 および 方向の2次方向微分は [13] となる。 ここで、行列値関数は、すべて の
に対して 、
次のように 定義される。 X {\displaystyle X} n × n {\displaystyle n\times n} X = E diag ( Λ ) E ∗ {\displaystyle X=E{\textrm {diag}}(\Lambda )E^{*}} E {\displaystyle E} X {\displaystyle X} E ∗ {\displaystyle E^{*}} Λ = ( λ 1 , … , λ n ) {\displaystyle \Lambda =\left(\lambda _{1},\ldots ,\lambda _{n}\right)} n × n {\displaystyle n\times n} V {\displaystyle V} exp : X → e X {\displaystyle \exp :X\to e^{X}} X {\displaystyle X} V {\displaystyle V} D exp ( X ) [ V ] ≜ lim ϵ → 0 1 ϵ ( e X + ϵ V − e X ) = E ( G ⊙ V ¯ ) E ∗ {\displaystyle D\exp(X)[V]\triangleq \lim _{\epsilon \to 0}{\frac {1}{\epsilon }}\left(\displaystyle e^{X+\epsilon V}-e^{X}\right)=E(G\odot {\bar {V}})E^{*}} V ¯ = E ∗ V E {\displaystyle {\bar {V}}=E^{*}VE} ⊙ {\displaystyle \odot } 1 ≤ i , j ≤ n {\displaystyle 1\leq i,j\leq n} G {\displaystyle G} G i , j = { e λ i − e λ j λ i − λ j if i ≠ j , e λ i otherwise . {\displaystyle G_{i,j}=\left\{{\begin{aligned}&{\frac {e^{\lambda _{i}}-e^{\lambda _{j}}}{\lambda _{i}-\lambda _{j}}}&{\text{ if }}i\neq j,\\&e^{\lambda _{i}}&{\text{ otherwise}}.\\\end{aligned}}\right.} n × n {\displaystyle n\times n} U {\displaystyle U} U {\displaystyle U} V {\displaystyle V} D 2 exp ( X ) [ U , V ] ≜ lim ϵ u → 0 lim ϵ v → 0 1 4 ϵ u ϵ v ( e X + ϵ u U + ϵ v V − e X − ϵ u U + ϵ v V − e X + ϵ u U − ϵ v V + e X − ϵ u U − ϵ v V ) = E F ( U , V ) E ∗ {\displaystyle D^{2}\exp(X)[U,V]\triangleq \lim _{\epsilon _{u}\to 0}\lim _{\epsilon _{v}\to 0}{\frac {1}{4\epsilon _{u}\epsilon _{v}}}\left(\displaystyle e^{X+\epsilon _{u}U+\epsilon _{v}V}-e^{X-\epsilon _{u}U+\epsilon _{v}V}-e^{X+\epsilon _{u}U-\epsilon _{v}V}+e^{X-\epsilon _{u}U-\epsilon _{v}V}\right)=EF(U,V)E^{*}} F {\displaystyle F} 1 ≤ i , j ≤ n {\displaystyle 1\leq i,j\leq n} F ( U , V ) i , j = ∑ k = 1 n ϕ i , j , k ( U ¯ i k V ¯ j k ∗ + V ¯ i k U ¯ j k ∗ ) {\displaystyle F(U,V)_{i,j}=\sum _{k=1}^{n}\phi _{i,j,k}({\bar {U}}_{ik}{\bar {V}}_{jk}^{*}+{\bar {V}}_{ik}{\bar {U}}_{jk}^{*})} ϕ i , j , k = { G i k − G j k λ i − λ j if i ≠ j , G i i − G i k λ i − λ k if i = j and k ≠ i , G i i 2 if i = j = k . {\displaystyle \phi _{i,j,k}=\left\{{\begin{aligned}&{\frac {G_{ik}-G_{jk}}{\lambda _{i}-\lambda _{j}}}&{\text{ if }}i\neq j,\\&{\frac {G_{ii}-G_{ik}}{\lambda _{i}-\lambda _{k}}}&{\text{ if }}i=j{\text{ and }}k\neq i,\\&{\frac {G_{ii}}{2}}&{\text{ if }}i=j=k.\\\end{aligned}}\right.}
行列指数の計算 行列指数を計算するための信頼性が高く正確な方法を見つけることは困難であり、これは数学と数値解析の分野で現在も盛んに研究されているテーマです。Matlab 、 GNU Octave 、 R 、 SciPyは すべて パデ近似 を使用します。 [14] [15] [16] [17] このセクションでは、原理的には任意の行列に適用でき、小さな行列に対しても明示的に実行できる方法について説明します。 [18] 以降のセクションでは、大きな行列の数値評価に適した方法について説明します。
対角化可能な場合 行列が 対角 行列の場合、 その指数は主対角線上の各要素を指数化することで得られます。 A = [ a 1 0 ⋯ 0 0 a 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ a n ] , {\displaystyle A={\begin{bmatrix}a_{1}&0&\cdots &0\\0&a_{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &a_{n}\end{bmatrix}},} e A = [ e a 1 0 ⋯ 0 0 e a 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ e a n ] . {\displaystyle e^{A}={\begin{bmatrix}e^{a_{1}}&0&\cdots &0\\0&e^{a_{2}}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &e^{a_{n}}\end{bmatrix}}.}
この結果から、 対角化可能な行列 を指数化することもできる。
A = UDU −1
それから
e A = Ue D U −1 、
これは、 D が対角の場合に特に簡単に計算できます 。
シルベスターの公式 を適用しても 同じ結果が得られます。(これを理解するには、対角行列の加算と乗算、つまり累乗は、要素ごとの加算と乗算、つまり累乗と同等であることに注意してください。特に、対角行列の場合、「1次元」の累乗は要素ごとに行われます。)
例: 対角化可能 例えば、行列は 次のように対角化できる。 A = [ 1 4 1 1 ] {\displaystyle A={\begin{bmatrix}1&4\\1&1\\\end{bmatrix}}} [ − 2 2 1 1 ] [ − 1 0 0 3 ] [ − 2 2 1 1 ] − 1 . {\displaystyle {\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}{\begin{bmatrix}-1&0\\0&3\\\end{bmatrix}}{\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}^{-1}.}
したがって、 e A = [ − 2 2 1 1 ] e [ − 1 0 0 3 ] [ − 2 2 1 1 ] − 1 = [ − 2 2 1 1 ] [ 1 e 0 0 e 3 ] [ − 2 2 1 1 ] − 1 = [ e 4 + 1 2 e e 4 − 1 e e 4 − 1 4 e e 4 + 1 2 e ] . {\displaystyle e^{A}={\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}e^{\begin{bmatrix}-1&0\\0&3\\\end{bmatrix}}{\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}^{-1}={\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}{\begin{bmatrix}{\frac {1}{e}}&0\\0&e^{3}\\\end{bmatrix}}{\begin{bmatrix}-2&2\\1&1\\\end{bmatrix}}^{-1}={\begin{bmatrix}{\frac {e^{4}+1}{2e}}&{\frac {e^{4}-1}{e}}\\{\frac {e^{4}-1}{4e}}&{\frac {e^{4}+1}{2e}}\\\end{bmatrix}}.}
べき乗ケース 行列 N が べき零で ある とは、 ある整数 qに対して N q = 0 と なる場合である。この場合、級数は有限個の項で終了するため、級数展開から直接行列指数 e N を計算することができる。
e N = I + N + 1 2 N 2 + 1 6 N 3 + ⋯ + 1 ( q − 1 ) ! N q − 1 . {\displaystyle e^{N}=I+N+{\frac {1}{2}}N^{2}+{\frac {1}{6}}N^{3}+\cdots +{\frac {1}{(q-1)!}}N^{q-1}~.}
この級数は有限個のステップを持つため、効率的に計算 できる行列多項式です 。
一般的なケース
ジョルダン・シュヴァレー分解を用いる ジョルダン・シュヴァレー分解 により 、任意の複素要素を持つ 行列 Xは 次のように表される。 ここで n × n {\displaystyle n\times n} X = A + N {\displaystyle X=A+N}
これは、前の 2 つのケースに還元することで X の指数を計算できることを意味します。 e X = e A + N = e A e N . {\displaystyle e^{X}=e^{A+N}=e^{A}e^{N}.}
最後のステップが機能するには、 A と N の可換性が必要であることに注意してください。
これによく似た方法として、体が 代数的に閉じている場合、 X の ジョルダン形式 を扱う方法がある 。X = PJP −1 と仮定し、 Jは X のジョルダン形式である とする 。すると、 e X = P e J P − 1 . {\displaystyle e^{X}=Pe^{J}P^{-1}.}
また、 J = J a 1 ( λ 1 ) ⊕ J a 2 ( λ 2 ) ⊕ ⋯ ⊕ J a n ( λ n ) , e J = exp ( J a 1 ( λ 1 ) ⊕ J a 2 ( λ 2 ) ⊕ ⋯ ⊕ J a n ( λ n ) ) = exp ( J a 1 ( λ 1 ) ) ⊕ exp ( J a 2 ( λ 2 ) ) ⊕ ⋯ ⊕ exp ( J a n ( λ n ) ) . {\displaystyle {\begin{aligned}J&=J_{a_{1}}(\lambda _{1})\oplus J_{a_{2}}(\lambda _{2})\oplus \cdots \oplus J_{a_{n}}(\lambda _{n}),\\e^{J}&=\exp {\big (}J_{a_{1}}(\lambda _{1})\oplus J_{a_{2}}(\lambda _{2})\oplus \cdots \oplus J_{a_{n}}(\lambda _{n}){\big )}\\&=\exp {\big (}J_{a_{1}}(\lambda _{1}){\big )}\oplus \exp {\big (}J_{a_{2}}(\lambda _{2}){\big )}\oplus \cdots \oplus \exp {\big (}J_{a_{n}}(\lambda _{n}){\big )}.\end{aligned}}}
したがって、ジョルダンブロック の指数行列を計算する方法さえ知っていればよい 。しかし、各ジョルダンブロックは次のような形式である。 J a ( λ ) = λ I + N ⇒ e J a ( λ ) = e λ I + N = e λ e N . {\displaystyle {\begin{aligned}&&J_{a}(\lambda )&=\lambda I+N\\&\Rightarrow &e^{J_{a}(\lambda )}&=e^{\lambda I+N}=e^{\lambda }e^{N}.\end{aligned}}}
ここで N は特殊冪零行列である。Jの行列指数 は次のように与えられる 。 e J = e λ 1 e N a 1 ⊕ e λ 2 e N a 2 ⊕ ⋯ ⊕ e λ n e N a n {\displaystyle e^{J}=e^{\lambda _{1}}e^{N_{a_{1}}}\oplus e^{\lambda _{2}}e^{N_{a_{2}}}\oplus \cdots \oplus e^{\lambda _{n}}e^{N_{a_{n}}}}
投影ケース P が 射影行列 (つまり べき等 : P 2 = P )の場合 、その行列指数は次のようになります。
eP = I + ( e −1) P です 。
これを指数関数の展開によって導くと、 Pの各べき乗は P に減算され 、これが合計の共通因数になります。 e P = ∑ k = 0 ∞ P k k ! = I + ( ∑ k = 1 ∞ 1 k ! ) P = I + ( e − 1 ) P . {\displaystyle e^{P}=\sum _{k=0}^{\infty }{\frac {P^{k}}{k!}}=I+\left(\sum _{k=1}^{\infty }{\frac {1}{k!}}\right)P=I+(e-1)P~.}
回転ケース 直交する単位ベクトルa と bが 平面を指定する 単純な回転の場合、 [19] 回転 行列 Rは、 生成元 G と角度 θ を含む同様の指数関数で表すことができます 。 [20] [21] G = b a T − a b T P = − G 2 = a a T + b b T P 2 = P P G = G = G P , {\displaystyle {\begin{aligned}G&=\mathbf {ba} ^{\mathsf {T}}-\mathbf {ab} ^{\mathsf {T}}&P&=-G^{2}=\mathbf {aa} ^{\mathsf {T}}+\mathbf {bb} ^{\mathsf {T}}\\P^{2}&=P&PG&=G=GP~,\end{aligned}}} R ( θ ) = e G θ = I + G sin ( θ ) + G 2 ( 1 − cos ( θ ) ) = I − P + P cos ( θ ) + G sin ( θ ) . {\displaystyle {\begin{aligned}R\left(\theta \right)=e^{G\theta }&=I+G\sin(\theta )+G^{2}(1-\cos(\theta ))\\&=I-P+P\cos(\theta )+G\sin(\theta )~.\\\end{aligned}}}
指数関数の公式は、 級数展開における Gのべき乗を簡約し、 G 2 と Gのそれぞれの級数係数をそれぞれ −cos( θ ) と sin( θ ) と同一視することで得られる。ここでの e Gθ の2番目の式は、 生成子 の導出を含む論文の R ( θ ) の式、 R ( θ ) = e Gθ と同じである 。
2 次元では、 およびの場合 、、、 は 平面 回転の標準行列に簡約されます。 a = [ 1 0 ] {\displaystyle a=\left[{\begin{smallmatrix}1\\0\end{smallmatrix}}\right]} b = [ 0 1 ] {\displaystyle b=\left[{\begin{smallmatrix}0\\1\end{smallmatrix}}\right]} G = [ 0 − 1 1 0 ] {\displaystyle G=\left[{\begin{smallmatrix}0&-1\\1&0\end{smallmatrix}}\right]} G 2 = [ − 1 0 0 − 1 ] {\displaystyle G^{2}=\left[{\begin{smallmatrix}-1&0\\0&-1\end{smallmatrix}}\right]} R ( θ ) = [ cos ( θ ) − sin ( θ ) sin ( θ ) cos ( θ ) ] = I cos ( θ ) + G sin ( θ ) {\displaystyle R(\theta )={\begin{bmatrix}\cos(\theta )&-\sin(\theta )\\\sin(\theta )&\cos(\theta )\end{bmatrix}}=I\cos(\theta )+G\sin(\theta )}
行列 P = − G 2 はベクトルを ab平面に 投影し 、回転はベクトルのこの部分にのみ影響します。これを示す例として、 a と b が張る平面における 30° = π/6 の回転が挙げられます。
a = [ 1 0 0 ] b = 1 5 [ 0 1 2 ] {\displaystyle {\begin{aligned}\mathbf {a} &={\begin{bmatrix}1\\0\\0\\\end{bmatrix}}&\mathbf {b} &={\frac {1}{\sqrt {5}}}{\begin{bmatrix}0\\1\\2\\\end{bmatrix}}\end{aligned}}} G = 1 5 [ 0 − 1 − 2 1 0 0 2 0 0 ] P = − G 2 = 1 5 [ 5 0 0 0 1 2 0 2 4 ] P [ 1 2 3 ] = 1 5 [ 5 8 16 ] = a + 8 5 b R ( π 6 ) = 1 10 [ 5 3 − 5 − 2 5 5 8 + 3 − 4 + 2 3 2 5 − 4 + 2 3 2 + 4 3 ] {\displaystyle {\begin{aligned}G={\frac {1}{\sqrt {5}}}&{\begin{bmatrix}0&-1&-2\\1&0&0\\2&0&0\\\end{bmatrix}}&P=-G^{2}&={\frac {1}{5}}{\begin{bmatrix}5&0&0\\0&1&2\\0&2&4\\\end{bmatrix}}\\P{\begin{bmatrix}1\\2\\3\\\end{bmatrix}}={\frac {1}{5}}&{\begin{bmatrix}5\\8\\16\\\end{bmatrix}}=\mathbf {a} +{\frac {8}{\sqrt {5}}}\mathbf {b} &R\left({\frac {\pi }{6}}\right)&={\frac {1}{10}}{\begin{bmatrix}5{\sqrt {3}}&-{\sqrt {5}}&-2{\sqrt {5}}\\{\sqrt {5}}&8+{\sqrt {3}}&-4+2{\sqrt {3}}\\2{\sqrt {5}}&-4+2{\sqrt {3}}&2+4{\sqrt {3}}\\\end{bmatrix}}\\\end{aligned}}}
N = I - P とする と、 N 2 = Nとなり、 P および G との積はゼロになります。これにより、 R のべき乗を評価できます 。
R ( π 6 ) = N + P 3 2 + G 1 2 R ( π 6 ) 2 = N + P 1 2 + G 3 2 R ( π 6 ) 3 = N + G R ( π 6 ) 6 = N − P R ( π 6 ) 12 = N + P = I {\displaystyle {\begin{aligned}R\left({\frac {\pi }{6}}\right)&=N+P{\frac {\sqrt {3}}{2}}+G{\frac {1}{2}}\\R\left({\frac {\pi }{6}}\right)^{2}&=N+P{\frac {1}{2}}+G{\frac {\sqrt {3}}{2}}\\R\left({\frac {\pi }{6}}\right)^{3}&=N+G\\R\left({\frac {\pi }{6}}\right)^{6}&=N-P\\R\left({\frac {\pi }{6}}\right)^{12}&=N+P=I\\\end{aligned}}}
ローラン級数による評価 ケーリー・ハミルトン定理 により、行列指数は n −1次多項式として表現できます 。
P と Q t が 1 変数の非ゼロ多項式で、 P ( A ) = 0 であり 、 有理 型 関数 が 完全である場合 、 これ を 証明 するには、上記の 2 つの等式の最初のものに P ( z ) を掛け、 z を A に置き換えます 。 f ( z ) = e t z − Q t ( z ) P ( z ) {\displaystyle f(z)={\frac {e^{tz}-Q_{t}(z)}{P(z)}}} e t A = Q t ( A ) . {\displaystyle e^{tA}=Q_{t}(A).}
このような多項式 Q t ( z ) は 次のようにして求められます( シルベスターの公式 を参照)。 a を P の根とすると 、 Q a,t ( z )は、 a における f の ローラン級数 の 主部分 と P の積から解かれます 。これは、関連する フロベニウス共変量に比例します。次に、 Q a,t の 合計 S t ( aが P のすべての根にわたる) を 、特定の Q t として取ることができます。その他すべての Q t は 、 P の倍数を S t ( z ) に追加することで得られます 。特に、 ラグランジュ・シルベスター多項式 S t ( z ) は、次数が P の次数よりも小さい 唯一の Q t です。
例:任意の 2×2 行列の場合を考えます 。 A := [ a b c d ] . {\displaystyle A:={\begin{bmatrix}a&b\\c&d\end{bmatrix}}.}
指数行列 e tA は 、ケーリー・ハミルトン定理 により 、次の形式となる。 e t A = s 0 ( t ) I + s 1 ( t ) A . {\displaystyle e^{tA}=s_{0}(t)\,I+s_{1}(t)\,A.}
(任意の複素数 z と任意の C 代数 Bについて、 z と単位 B の積を再び z で表します 。)
α と βを A の 特性多項式 の根と すると 、 P ( z ) = z 2 − ( a + d ) z + a d − b c = ( z − α ) ( z − β ) . {\displaystyle P(z)=z^{2}-(a+d)\ z+ad-bc=(z-\alpha )(z-\beta )~.}
すると 、 S t ( z ) = e α t z − β α − β + e β t z − α β − α , {\displaystyle S_{t}(z)=e^{\alpha t}{\frac {z-\beta }{\alpha -\beta }}+e^{\beta t}{\frac {z-\alpha }{\beta -\alpha }}~,} s 0 ( t ) = α e β t − β e α t α − β , s 1 ( t ) = e α t − e β t α − β {\displaystyle {\begin{aligned}s_{0}(t)&={\frac {\alpha \,e^{\beta t}-\beta \,e^{\alpha t}}{\alpha -\beta }},&s_{1}(t)&={\frac {e^{\alpha t}-e^{\beta t}}{\alpha -\beta }}\end{aligned}}}
α ≠ β の場合 ;一方、 α = β の場合、 S t ( z ) = e α t ( 1 + t ( z − α ) ) , {\displaystyle S_{t}(z)=e^{\alpha t}(1+t(z-\alpha ))~,}
となることによって s 0 ( t ) = ( 1 − α t ) e α t , s 1 ( t ) = t e α t . {\displaystyle {\begin{aligned}s_{0}(t)&=(1-\alpha \,t)\,e^{\alpha t},&s_{1}(t)&=t\,e^{\alpha t}~.\end{aligned}}}
定義 s ≡ α + β 2 = tr A 2 , q ≡ α − β 2 = ± − det ( A − s I ) , {\displaystyle {\begin{aligned}s&\equiv {\frac {\alpha +\beta }{2}}={\frac {\operatorname {tr} A}{2}}~,&q&\equiv {\frac {\alpha -\beta }{2}}=\pm {\sqrt {-\det \left(A-sI\right)}},\end{aligned}}}
我々は持っています s 0 ( t ) = e s t ( cosh ( q t ) − s sinh ( q t ) q ) , s 1 ( t ) = e s t sinh ( q t ) q , {\displaystyle {\begin{aligned}s_{0}(t)&=e^{st}\left(\cosh(qt)-s{\frac {\sinh(qt)}{q}}\right),&s_{1}(t)&=e^{st}{\frac {\sinh(qt)}{q}},\end{aligned}}}
ここで sin( qt )/ qは、 t = 0 の場合には 0 、 q = 0 の場合には t に なります。
したがって、
e t A = e s t ( ( cosh ( q t ) − s sinh ( q t ) q ) I + sinh ( q t ) q A ) . {\displaystyle e^{tA}=e^{st}\left(\left(\cosh(qt)-s{\frac {\sinh(qt)}{q}}\right)~I~+{\frac {\sinh(qt)}{q}}A\right)~.}
したがって、上で示したように、行列 Aは 互いに可換な2つの部分、すなわちトレース部分とトレースなし部分の和に分解され、 A = s I + ( A − s I ) , {\displaystyle A=sI+(A-sI)~,}
行列指数関数は、それぞれの2つの部分の指数関数の単純な積に簡約されます。これは物理学でよく用いられる公式で、 パウリスピン行列 に対する オイラーの公式、つまり SU(2) 群の二重項表現の回転に相当するため、よく用いられます 。
多項式 S t に は、次の「 補間 」特性を与えることもできます。 e t ( z ) ≡ e tz 、 n ≡ deg P と定義します。すると、 S t ( z ) は、 k が P の根としての a の重複度より小さい ときに 必ず S t ( k ) ( a ) = e t ( k ) ( a ) を満たす唯一の次数 < n の多項式です 。 当然 のことですが、 Pは A の 最小多項式 であると仮定します 。さらに、 Aは 対角化可能な行列 であると仮定します。特に、 P の根は 単純であり、「 補間」特性から S t はラグランジュの補間 式で与えられ 、したがって ラグランジュ−シルベスター多項式 であることが示されます 。
一方、 P = ( z - a ) n の場合には、 S t = e a t ∑ k = 0 n − 1 t k k ! ( z − a ) k . {\displaystyle S_{t}=e^{at}\ \sum _{k=0}^{n-1}\ {\frac {t^{k}}{k!}}\ (z-a)^{k}~.}
上記の観察でカバーされていない最も単純なケースは、 a ≠ b のときであり 、これは次の式を与える。 P = ( z − a ) 2 ( z − b ) {\displaystyle P=(z-a)^{2}\,(z-b)} S t = e a t z − b a − b ( 1 + ( t + 1 b − a ) ( z − a ) ) + e b t ( z − a ) 2 ( b − a ) 2 . {\displaystyle S_{t}=e^{at}\ {\frac {z-b}{a-b}}\ \left(1+\left(t+{\frac {1}{b-a}}\right)(z-a)\right)+e^{bt}\ {\frac {(z-a)^{2}}{(b-a)^{2}}}.}
上記の実用的かつ迅速な計算は、以下の迅速な手順に簡略化されます。前述のように、 n × n 行列 exp( tA )は 、ケーリー・ハミルトン定理 により、 A の最初の n −1 乗の線形結合に相当します 。 対角化可能な 行列の場合、例えば 2 × 2 の場合、 シルベスターの公式は exp( tA ) = B α exp( tα ) + B β exp( tβ ) となります 。ここで、 Bは A の フロベニウス共変量 です 。
ただし、この式と t = 0でのその 1 次導関数を A と I について評価して、これらの B を直接解くだけで、 上記と同じ答えが得られるのが最も簡単です。
しかし、この単純な手順は、 ブッフハイムによる一般化により、 欠陥のある行列にも適用できます。 [22] ここでは、 対角化できず 、 Bが射影行列ではない 4×4 行列の例でこれを示します 。
固有値 λ 1 = 3/4 と λ 2 = 1 (それぞれ重複度2)
を 考えます
。 A = [ 1 1 0 0 0 1 1 0 0 0 1 − 1 8 0 0 1 2 1 2 ] , {\displaystyle A={\begin{bmatrix}1&1&0&0\\0&1&1&0\\0&0&1&-{\frac {1}{8}}\\0&0&{\frac {1}{2}}&{\frac {1}{2}}\end{bmatrix}}~,}
各固有値の指数関数 t を exp( λ i t ) で表す。指数関数で表された各固有値に、対応する未定係数行列 B i を乗じる。固有値の代数的重複度が1より大きい場合は、この処理を繰り返し、各繰り返しごとに t を乗じて線形独立性を確保する。
(1 つの固有値の重複度が 3 の場合、 という 3 つの項があります 。対照的に、すべての固有値が異なる場合、 Bは フロベニウス共変量 にすぎず、以下のようにそれらを解くことは、これら 4 つの固有値の ヴァンデルモンド行列 の逆行列を求めることに相当します 。) B i 1 e λ i t , B i 2 t e λ i t , B i 3 t 2 e λ i t {\displaystyle B_{i_{1}}e^{\lambda _{i}t},~B_{i_{2}}te^{\lambda _{i}t},~B_{i_{3}}t^{2}e^{\lambda _{i}t}}
そのような項をすべて合計します。ここでは4つの項です。 e A t = B 1 1 e λ 1 t + B 1 2 t e λ 1 t + B 2 1 e λ 2 t + B 2 2 t e λ 2 t , e A t = B 1 1 e 3 4 t + B 1 2 t e 3 4 t + B 2 1 e 1 t + B 2 2 t e 1 t . {\displaystyle {\begin{aligned}e^{At}&=B_{1_{1}}e^{\lambda _{1}t}+B_{1_{2}}te^{\lambda _{1}t}+B_{2_{1}}e^{\lambda _{2}t}+B_{2_{2}}te^{\lambda _{2}t},\\e^{At}&=B_{1_{1}}e^{{\frac {3}{4}}t}+B_{1_{2}}te^{{\frac {3}{4}}t}+B_{2_{1}}e^{1t}+B_{2_{2}}te^{1t}~.\end{aligned}}}
未知の行列B のすべてを A の最初の3つのべき乗と恒等式で解くには4つの方程式が必要であり、上記の方程式は t = 0における方程式の1つである。さらにこれを t について微分すると 、 A e A t = 3 4 B 1 1 e 3 4 t + ( 3 4 t + 1 ) B 1 2 e 3 4 t + 1 B 2 1 e 1 t + ( 1 t + 1 ) B 2 2 e 1 t , {\displaystyle Ae^{At}={\frac {3}{4}}B_{1_{1}}e^{{\frac {3}{4}}t}+\left({\frac {3}{4}}t+1\right)B_{1_{2}}e^{{\frac {3}{4}}t}+1B_{2_{1}}e^{1t}+\left(1t+1\right)B_{2_{2}}e^{1t}~,}
そしてまた、 A 2 e A t = ( 3 4 ) 2 B 1 1 e 3 4 t + ( ( 3 4 ) 2 t + ( 3 4 + 1 ⋅ 3 4 ) ) B 1 2 e 3 4 t + B 2 1 e 1 t + ( 1 2 t + ( 1 + 1 ⋅ 1 ) ) B 2 2 e 1 t = ( 3 4 ) 2 B 1 1 e 3 4 t + ( ( 3 4 ) 2 t + 3 2 ) B 1 2 e 3 4 t + B 2 1 e t + ( t + 2 ) B 2 2 e t , {\displaystyle {\begin{aligned}A^{2}e^{At}&=\left({\frac {3}{4}}\right)^{2}B_{1_{1}}e^{{\frac {3}{4}}t}+\left(\left({\frac {3}{4}}\right)^{2}t+\left({\frac {3}{4}}+1\cdot {\frac {3}{4}}\right)\right)B_{1_{2}}e^{{\frac {3}{4}}t}+B_{2_{1}}e^{1t}+\left(1^{2}t+(1+1\cdot 1)\right)B_{2_{2}}e^{1t}\\&=\left({\frac {3}{4}}\right)^{2}B_{1_{1}}e^{{\frac {3}{4}}t}+\left(\left({\frac {3}{4}}\right)^{2}t+{\frac {3}{2}}\right)B_{1_{2}}e^{{\frac {3}{4}}t}+B_{2_{1}}e^{t}+\left(t+2\right)B_{2_{2}}e^{t}~,\end{aligned}}}
そしてもう一度、 A 3 e A t = ( 3 4 ) 3 B 1 1 e 3 4 t + ( ( 3 4 ) 3 t + ( ( 3 4 ) 2 + ( 3 2 ) ⋅ 3 4 ) ) B 1 2 e 3 4 t + B 2 1 e 1 t + ( 1 3 t + ( 1 + 2 ) ⋅ 1 ) B 2 2 e 1 t = ( 3 4 ) 3 B 1 1 e 3 4 t + ( ( 3 4 ) 3 t + 27 16 ) B 1 2 e 3 4 t + B 2 1 e t + ( t + 3 ⋅ 1 ) B 2 2 e t . {\displaystyle {\begin{aligned}A^{3}e^{At}&=\left({\frac {3}{4}}\right)^{3}B_{1_{1}}e^{{\frac {3}{4}}t}+\left(\left({\frac {3}{4}}\right)^{3}t+\left(\left({\frac {3}{4}}\right)^{2}+\left({\frac {3}{2}}\right)\cdot {\frac {3}{4}}\right)\right)B_{1_{2}}e^{{\frac {3}{4}}t}+B_{2_{1}}e^{1t}+\left(1^{3}t+(1+2)\cdot 1\right)B_{2_{2}}e^{1t}\\&=\left({\frac {3}{4}}\right)^{3}B_{1_{1}}e^{{\frac {3}{4}}t}\!+\left(\left({\frac {3}{4}}\right)^{3}t\!+{\frac {27}{16}}\right)B_{1_{2}}e^{{\frac {3}{4}}t}\!+B_{2_{1}}e^{t}\!+\left(t+3\cdot 1\right)B_{2_{2}}e^{t}~.\end{aligned}}}
(一般的なケースでは、 n −1 回の導関数を取る必要があります。)
これらの4つの方程式でt = 0と設定すると 、4つの係数行列 B sは次のように解ける。 I = B 1 1 + B 2 1 A = 3 4 B 1 1 + B 1 2 + B 2 1 + B 2 2 A 2 = ( 3 4 ) 2 B 1 1 + 3 2 B 1 2 + B 2 1 + 2 B 2 2 A 3 = ( 3 4 ) 3 B 1 1 + 27 16 B 1 2 + B 2 1 + 3 B 2 2 , {\displaystyle {\begin{aligned}I&=B_{1_{1}}+B_{2_{1}}\\A&={\frac {3}{4}}B_{1_{1}}+B_{1_{2}}+B_{2_{1}}+B_{2_{2}}\\A^{2}&=\left({\frac {3}{4}}\right)^{2}B_{1_{1}}+{\frac {3}{2}}B_{1_{2}}+B_{2_{1}}+2B_{2_{2}}\\A^{3}&=\left({\frac {3}{4}}\right)^{3}B_{1_{1}}+{\frac {27}{16}}B_{1_{2}}+B_{2_{1}}+3B_{2_{2}}~,\end{aligned}}}
譲る B 1 1 = 128 A 3 − 366 A 2 + 288 A − 80 I B 1 2 = 16 A 3 − 44 A 2 + 40 A − 12 I B 2 1 = − 128 A 3 + 366 A 2 − 288 A + 80 I B 2 2 = 16 A 3 − 40 A 2 + 33 A − 9 I . {\displaystyle {\begin{aligned}B_{1_{1}}&=128A^{3}-366A^{2}+288A-80I\\B_{1_{2}}&=16A^{3}-44A^{2}+40A-12I\\B_{2_{1}}&=-128A^{3}+366A^{2}-288A+80I\\B_{2_{2}}&=16A^{3}-40A^{2}+33A-9I~.\end{aligned}}}
A の値を代入すると 係数行列が得られる。 B 1 1 = [ 0 0 48 − 16 0 0 − 8 2 0 0 1 0 0 0 0 1 ] B 1 2 = [ 0 0 4 − 2 0 0 − 1 1 2 0 0 1 4 − 1 8 0 0 1 2 − 1 4 ] B 2 1 = [ 1 0 − 48 16 0 1 8 − 2 0 0 0 0 0 0 0 0 ] B 2 2 = [ 0 1 8 − 2 0 0 0 0 0 0 0 0 0 0 0 0 ] {\displaystyle {\begin{aligned}B_{1_{1}}&={\begin{bmatrix}0&0&48&-16\\0&0&-8&2\\0&0&1&0\\0&0&0&1\end{bmatrix}}\\B_{1_{2}}&={\begin{bmatrix}0&0&4&-2\\0&0&-1&{\frac {1}{2}}\\0&0&{\frac {1}{4}}&-{\frac {1}{8}}\\0&0&{\frac {1}{2}}&-{\frac {1}{4}}\end{bmatrix}}\\B_{2_{1}}&={\begin{bmatrix}1&0&-48&16\\0&1&8&-2\\0&0&0&0\\0&0&0&0\end{bmatrix}}\\B_{2_{2}}&={\begin{bmatrix}0&1&8&-2\\0&0&0&0\\0&0&0&0\\0&0&0&0\end{bmatrix}}\end{aligned}}}
最終的な答えは e t A = [ e t t e t ( 8 t − 48 ) e t + ( 4 t + 48 ) e 3 4 t ( 16 − 2 t ) e t + ( − 2 t − 16 ) e 3 4 t 0 e t 8 e t + ( − t − 8 ) e 3 4 t − 2 e t + t + 4 2 e 3 4 t 0 0 t + 4 4 e 3 4 t − t 8 e 3 4 t 0 0 t 2 e 3 4 t − t − 4 4 e 3 4 t . ] {\displaystyle e^{tA}={\begin{bmatrix}e^{t}&te^{t}&\left(8t-48\right)e^{t}\!+\left(4t+48\right)e^{{\frac {3}{4}}t}&\left(16-2\,t\right)e^{t}\!+\left(-2t-16\right)e^{{\frac {3}{4}}t}\\0&e^{t}&8e^{t}\!+\left(-t-8\right)e^{{\frac {3}{4}}t}&-2e^{t}+{\frac {t+4}{2}}e^{{\frac {3}{4}}t}\\0&0&{\frac {t+4}{4}}e^{{\frac {3}{4}}t}&-{\frac {t}{8}}e^{{\frac {3}{4}}t}\\0&0&{\frac {t}{2}}e^{{\frac {3}{4}}t}&-{\frac {t-4}{4}}e^{{\frac {3}{4}}t}~.\end{bmatrix}}}
この手順は、このような場合に時々使用される Putzer のアルゴリズム よりもはるかに短くなります。
イラスト の指数を計算したいとします。 B = [ 21 17 6 − 5 − 1 − 6 4 4 16 ] . {\displaystyle B={\begin{bmatrix}21&17&6\\-5&-1&-6\\4&4&16\end{bmatrix}}.}
その ジョルダン形式 は 行列 P が次のように与えられる。 J = P − 1 B P = [ 4 0 0 0 16 1 0 0 16 ] , {\displaystyle J=P^{-1}BP={\begin{bmatrix}4&0&0\\0&16&1\\0&0&16\end{bmatrix}},} P = [ − 1 4 2 5 4 1 4 − 2 − 1 4 0 4 0 ] . {\displaystyle P={\begin{bmatrix}-{\frac {1}{4}}&2&{\frac {5}{4}}\\{\frac {1}{4}}&-2&-{\frac {1}{4}}\\0&4&0\end{bmatrix}}.}
まずexp( J )を計算してみましょう。 J = J 1 ( 4 ) ⊕ J 2 ( 16 ) {\displaystyle J=J_{1}(4)\oplus J_{2}(16)}
1×1 行列の指数関数は 、行列の1つの要素の指数関数に等しいので、 exp ( J 1 (4)) = [ e 4 ]となる。J 2 (16)の指数関数は、前述の式 e (λ I + N ) = e λ e N で計算でき 、次の式が得られる [23]。
exp ( [ 16 1 0 16 ] ) = e 16 exp ( [ 0 1 0 0 ] ) = = e 16 ( [ 1 0 0 1 ] + [ 0 1 0 0 ] + 1 2 ! [ 0 0 0 0 ] + ⋯ ) = [ e 16 e 16 0 e 16 ] . {\displaystyle {\begin{aligned}&\exp \left({\begin{bmatrix}16&1\\0&16\end{bmatrix}}\right)=e^{16}\exp \left({\begin{bmatrix}0&1\\0&0\end{bmatrix}}\right)=\\[6pt]{}={}&e^{16}\left({\begin{bmatrix}1&0\\0&1\end{bmatrix}}+{\begin{bmatrix}0&1\\0&0\end{bmatrix}}+{1 \over 2!}{\begin{bmatrix}0&0\\0&0\end{bmatrix}}+\cdots {}\right)={\begin{bmatrix}e^{16}&e^{16}\\0&e^{16}\end{bmatrix}}.\end{aligned}}}
したがって、元の行列B の指数 は exp ( B ) = P exp ( J ) P − 1 = P [ e 4 0 0 0 e 16 e 16 0 0 e 16 ] P − 1 = 1 4 [ 13 e 16 − e 4 13 e 16 − 5 e 4 2 e 16 − 2 e 4 − 9 e 16 + e 4 − 9 e 16 + 5 e 4 − 2 e 16 + 2 e 4 16 e 16 16 e 16 4 e 16 ] . {\displaystyle {\begin{aligned}\exp(B)&=P\exp(J)P^{-1}=P{\begin{bmatrix}e^{4}&0&0\\0&e^{16}&e^{16}\\0&0&e^{16}\end{bmatrix}}P^{-1}\\[6pt]&={1 \over 4}{\begin{bmatrix}13e^{16}-e^{4}&13e^{16}-5e^{4}&2e^{16}-2e^{4}\\-9e^{16}+e^{4}&-9e^{16}+5e^{4}&-2e^{16}+2e^{4}\\16e^{16}&16e^{16}&4e^{16}\end{bmatrix}}.\end{aligned}}}
アプリケーション
線形微分方程式 行列指数関数は 線形微分方程式 系に応用できます。( 行列微分方程式 も参照してください。)この記事の前半で述べたように、 形式の 同次 微分方程式
は解 e At y (0) を持ちます。 y ′ = A y {\displaystyle \mathbf {y} '=A\mathbf {y} }
ベクトルを考えると、 非同次 連立線形微分 方程式は次のように表すことができます。e − At の 積分係数を使用するという 仮定 を立て 、全体に掛け合わせると、 y ( t ) = [ y 1 ( t ) ⋮ y n ( t ) ] , {\displaystyle \mathbf {y} (t)={\begin{bmatrix}y_{1}(t)\\\vdots \\y_{n}(t)\end{bmatrix}}~,} y ′ ( t ) = A y ( t ) + b ( t ) . {\displaystyle \mathbf {y} '(t)=A\mathbf {y} (t)+\mathbf {b} (t).} e − A t y ′ − e − A t A y = e − A t b ⇒ e − A t y ′ − A e − A t y = e − A t b ⇒ d d t ( e − A t y ) = e − A t b . {\displaystyle {\begin{aligned}&&e^{-At}\mathbf {y} '-e^{-At}A\mathbf {y} &=e^{-At}\mathbf {b} \\&\Rightarrow &e^{-At}\mathbf {y} '-Ae^{-At}\mathbf {y} &=e^{-At}\mathbf {b} \\&\Rightarrow &{\frac {d}{dt}}\left(e^{-At}\mathbf {y} \right)&=e^{-At}\mathbf {b} ~.\end{aligned}}}
2番目のステップは、 AB = BA ならば e At B = Be At となるという事実によって可能になります 。したがって、 e At を計算すると、3番目のステップをt に関して単純に積分することで、系の解が得られます 。
この解は、 を積分し、 を掛けて 左辺の指数を消すことで得られます。 は行列ですが、行列指数関数型であるため、 と表現できることに注意してください 。言い換えると、 です 。 e A t {\displaystyle e^{{\textbf {A}}t}} e A t {\displaystyle e^{{\textbf {A}}t}} e A t e − A t = I {\displaystyle e^{{\textbf {A}}t}e^{-{\textbf {A}}t}=I} exp A t = exp ( − A t ) − 1 {\displaystyle \exp {{\textbf {A}}t}=\exp {{(-{\textbf {A}}t)}^{-1}}}
例(均質) システムを検討する x ′ = 2 x − y + z y ′ = 3 y − 1 z z ′ = 2 x + y + 3 z . {\displaystyle {\begin{matrix}x'&=&2x&-y&+z\\y'&=&&3y&-1z\\z'&=&2x&+y&+3z\end{matrix}}~.}
関連する 欠陥マトリックス は A = [ 2 − 1 1 0 3 − 1 2 1 3 ] . {\displaystyle A={\begin{bmatrix}2&-1&1\\0&3&-1\\2&1&3\end{bmatrix}}~.}
行列指数は e t A = 1 2 [ e 2 t ( 1 + e 2 t − 2 t ) − 2 t e 2 t e 2 t ( − 1 + e 2 t ) − e 2 t ( − 1 + e 2 t − 2 t ) 2 ( t + 1 ) e 2 t − e 2 t ( − 1 + e 2 t ) e 2 t ( − 1 + e 2 t + 2 t ) 2 t e 2 t e 2 t ( 1 + e 2 t ) ] , {\displaystyle e^{tA}={\frac {1}{2}}{\begin{bmatrix}e^{2t}\left(1+e^{2t}-2t\right)&-2te^{2t}&e^{2t}\left(-1+e^{2t}\right)\\-e^{2t}\left(-1+e^{2t}-2t\right)&2(t+1)e^{2t}&-e^{2t}\left(-1+e^{2t}\right)\\e^{2t}\left(-1+e^{2t}+2t\right)&2te^{2t}&e^{2t}\left(1+e^{2t}\right)\end{bmatrix}}~,}
したがって、同次系の一般解は [ x y z ] = x ( 0 ) 2 [ e 2 t ( 1 + e 2 t − 2 t ) − e 2 t ( − 1 + e 2 t − 2 t ) e 2 t ( − 1 + e 2 t + 2 t ) ] + y ( 0 ) 2 [ − 2 t e 2 t 2 ( t + 1 ) e 2 t 2 t e 2 t ] + z ( 0 ) 2 [ e 2 t ( − 1 + e 2 t ) − e 2 t ( − 1 + e 2 t ) e 2 t ( 1 + e 2 t ) ] , {\displaystyle {\begin{bmatrix}x\\y\\z\end{bmatrix}}={\frac {x(0)}{2}}{\begin{bmatrix}e^{2t}\left(1+e^{2t}-2t\right)\\-e^{2t}\left(-1+e^{2t}-2t\right)\\e^{2t}\left(-1+e^{2t}+2t\right)\end{bmatrix}}+{\frac {y(0)}{2}}{\begin{bmatrix}-2te^{2t}\\2(t+1)e^{2t}\\2te^{2t}\end{bmatrix}}+{\frac {z(0)}{2}}{\begin{bmatrix}e^{2t}\left(-1+e^{2t}\right)\\-e^{2t}\left(-1+e^{2t}\right)\\e^{2t}\left(1+e^{2t}\right)\end{bmatrix}}~,}
相当する 2 x = x ( 0 ) e 2 t ( 1 + e 2 t − 2 t ) + y ( 0 ) ( − 2 t e 2 t ) + z ( 0 ) e 2 t ( − 1 + e 2 t ) 2 y = x ( 0 ) ( − e 2 t ) ( − 1 + e 2 t − 2 t ) + y ( 0 ) 2 ( t + 1 ) e 2 t + z ( 0 ) ( − e 2 t ) ( − 1 + e 2 t ) 2 z = x ( 0 ) e 2 t ( − 1 + e 2 t + 2 t ) + y ( 0 ) 2 t e 2 t + z ( 0 ) e 2 t ( 1 + e 2 t ) . {\displaystyle {\begin{aligned}2x&=x(0)e^{2t}\left(1+e^{2t}-2t\right)+y(0)\left(-2te^{2t}\right)+z(0)e^{2t}\left(-1+e^{2t}\right)\\[2pt]2y&=x(0)\left(-e^{2t}\right)\left(-1+e^{2t}-2t\right)+y(0)2(t+1)e^{2t}+z(0)\left(-e^{2t}\right)\left(-1+e^{2t}\right)\\[2pt]2z&=x(0)e^{2t}\left(-1+e^{2t}+2t\right)+y(0)2te^{2t}+z(0)e^{2t}\left(1+e^{2t}\right)~.\end{aligned}}}
例(不均質) 不均質なシステムを考えてみましょう x ′ = 2 x − y + z + e 2 t y ′ = 3 y − z z ′ = 2 x + y + 3 z + e 2 t . {\displaystyle {\begin{matrix}x'&=&2x&-&y&+&z&+&e^{2t}\\y'&=&&&3y&-&z&\\z'&=&2x&+&y&+&3z&+&e^{2t}\end{matrix}}~.}
私たちはまた A = [ 2 − 1 1 0 3 − 1 2 1 3 ] , {\displaystyle A=\left[{\begin{array}{rrr}2&-1&1\\0&3&-1\\2&1&3\end{array}}\right]~,}
そして b = e 2 t [ 1 0 1 ] . {\displaystyle \mathbf {b} =e^{2t}{\begin{bmatrix}1\\0\\1\end{bmatrix}}.}
既に同次方程式の一般解は得られています。同次解と特殊解を足し合わせると非同次問題の一般解が得られるので、あとは特殊解を求めるだけです。
上記により、 パラメータを変化させることで必要な特殊解が得られるため、これをさらに簡略化することができます。c = y p (0) に注意してください 。 より 厳密 な 一般化については、以下の一般化を参照してください。 y p = e t A ∫ 0 t e ( − u ) A [ e 2 u 0 e 2 u ] d u + e t A c = e t A ∫ 0 t [ 2 e u − 2 u e 2 u − 2 u e 2 u 0 − 2 e u + 2 ( u + 1 ) e 2 u 2 ( u + 1 ) e 2 u 0 2 u e 2 u 2 u e 2 u 2 e u ] [ e 2 u 0 e 2 u ] d u + e t A c = e t A ∫ 0 t [ e 2 u ( 2 e u − 2 u e 2 u ) e 2 u ( − 2 e u + 2 ( 1 + u ) e 2 u ) 2 e 3 u + 2 u e 4 u ] d u + e t A c = e t A [ − 1 24 e 3 t ( 3 e t ( 4 t − 1 ) − 16 ) 1 24 e 3 t ( 3 e t ( 4 t + 4 ) − 16 ) 1 24 e 3 t ( 3 e t ( 4 t − 1 ) − 16 ) ] + [ 2 e t − 2 t e 2 t − 2 t e 2 t 0 − 2 e t + 2 ( t + 1 ) e 2 t 2 ( t + 1 ) e 2 t 0 2 t e 2 t 2 t e 2 t 2 e t ] [ c 1 c 2 c 3 ] , {\displaystyle {\begin{aligned}\mathbf {y} _{p}&=e^{tA}\int _{0}^{t}e^{(-u)A}{\begin{bmatrix}e^{2u}\\0\\e^{2u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} \\[6pt]&=e^{tA}\int _{0}^{t}{\begin{bmatrix}2e^{u}-2ue^{2u}&-2ue^{2u}&0\\-2e^{u}+2(u+1)e^{2u}&2(u+1)e^{2u}&0\\2ue^{2u}&2ue^{2u}&2e^{u}\end{bmatrix}}{\begin{bmatrix}e^{2u}\\0\\e^{2u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} \\[6pt]&=e^{tA}\int _{0}^{t}{\begin{bmatrix}e^{2u}\left(2e^{u}-2ue^{2u}\right)\\e^{2u}\left(-2e^{u}+2(1+u)e^{2u}\right)\\2e^{3u}+2ue^{4u}\end{bmatrix}}\,du+e^{tA}\mathbf {c} \\[6pt]&=e^{tA}{\begin{bmatrix}-{1 \over 24}e^{3t}\left(3e^{t}(4t-1)-16\right)\\{1 \over 24}e^{3t}\left(3e^{t}(4t+4)-16\right)\\{1 \over 24}e^{3t}\left(3e^{t}(4t-1)-16\right)\end{bmatrix}}+{\begin{bmatrix}2e^{t}-2te^{2t}&-2te^{2t}&0\\-2e^{t}+2(t+1)e^{2t}&2(t+1)e^{2t}&0\\2te^{2t}&2te^{2t}&2e^{t}\end{bmatrix}}{\begin{bmatrix}c_{1}\\c_{2}\\c_{3}\end{bmatrix}}~,\end{aligned}}}
不均質なケースの一般化:パラメータの変化 非同次な場合には、積分係数( パラメータの変化 に似た手法) を用いることができる。y p ( t ) = exp( tA ) z ( t ) という 形の特異解を求める 。 y p ′ ( t ) = ( e t A ) ′ z ( t ) + e t A z ′ ( t ) = A e t A z ( t ) + e t A z ′ ( t ) = A y p ( t ) + e t A z ′ ( t ) . {\displaystyle {\begin{aligned}\mathbf {y} _{p}'(t)&=\left(e^{tA}\right)'\mathbf {z} (t)+e^{tA}\mathbf {z} '(t)\\[6pt]&=Ae^{tA}\mathbf {z} (t)+e^{tA}\mathbf {z} '(t)\\[6pt]&=A\mathbf {y} _{p}(t)+e^{tA}\mathbf {z} '(t)~.\end{aligned}}}
y p が解となる ためには、 e t A z ′ ( t ) = b ( t ) z ′ ( t ) = ( e t A ) − 1 b ( t ) z ( t ) = ∫ 0 t e − u A b ( u ) d u + c . {\displaystyle {\begin{aligned}e^{tA}\mathbf {z} '(t)&=\mathbf {b} (t)\\[6pt]\mathbf {z} '(t)&=\left(e^{tA}\right)^{-1}\mathbf {b} (t)\\[6pt]\mathbf {z} (t)&=\int _{0}^{t}e^{-uA}\mathbf {b} (u)\,du+\mathbf {c} ~.\end{aligned}}}
したがって、 c は 問題の初期条件によって決まります。 y p ( t ) = e t A ∫ 0 t e − u A b ( u ) d u + e t A c = ∫ 0 t e ( t − u ) A b ( u ) d u + e t A c , {\displaystyle {\begin{aligned}\mathbf {y} _{p}(t)&=e^{tA}\int _{0}^{t}e^{-uA}\mathbf {b} (u)\,du+e^{tA}\mathbf {c} \\&=\int _{0}^{t}e^{(t-u)A}\mathbf {b} (u)\,du+e^{tA}\mathbf {c} ~,\end{aligned}}}
より正確には、次の式を考えてみましょう Y ′ − A Y = F ( t ) {\displaystyle Y'-A\ Y=F(t)}
初期条件は Y ( t 0 ) = Y 0 であり、
Aは n 行 n 列の複素行列であり 、 Fは、ある開区間 Iから C n までの 連続関数であり 、 t 0 {\displaystyle t_{0}} はI の点で あり、 Y 0 {\displaystyle Y_{0}} はC n のベクトルです 。 上記の等式を e −tA で左乗すると次の式が得られる。 Y ( t ) = e ( t − t 0 ) A Y 0 + ∫ t 0 t e ( t − x ) A F ( x ) d x . {\displaystyle Y(t)=e^{(t-t_{0})A}\ Y_{0}+\int _{t_{0}}^{t}e^{(t-x)A}\ F(x)\ dx~.}
我々は、方程式の解は P ( d / d t ) y = f ( t ) {\displaystyle P(d/dt)\ y=f(t)}
0 ≤ k < n の 初期条件 は y ( k ) ( t 0 ) = y k {\displaystyle y^{(k)}(t_{0})=y_{k}} y ( t ) = ∑ k = 0 n − 1 y k s k ( t − t 0 ) + ∫ t 0 t s n − 1 ( t − x ) f ( x ) d x , {\displaystyle y(t)=\sum _{k=0}^{n-1}\ y_{k}\ s_{k}(t-t_{0})+\int _{t_{0}}^{t}s_{n-1}(t-x)\ f(x)\ dx~,}
ここでの表記は次のようになります。
P ∈ C [ X ] {\displaystyle P\in \mathbb {C} [X]} は次数n > 0 の単項多項式であり 、 fは、ある開区間 I 上で定義された連続複素数値関数であり 、 t 0 {\displaystyle t_{0}} はI の点です 、 y k {\displaystyle y_{k}} は複素数であり、 s k ( t ) は、上記のローラン級数による評価の項 で で表される多項式 の係数です X k {\displaystyle X^{k}} S t ∈ C [ X ] {\displaystyle S_{t}\in \mathbb {C} [X]}
この主張を正当化するために、通常の 一次方程式への簡約によって、 n 次スカラー方程式を 1 次ベクトル方程式に変換します 。ベクトル方程式は、 A が P の 転置 行列 である形をとります 。この方程式を上記のように解き、上記のシルベスターの公式を適用することで、サブセクション「評価」で観察された点に基づいて行列指数を計算します。 d Y d t − A Y = F ( t ) , Y ( t 0 ) = Y 0 , {\displaystyle {\frac {dY}{dt}}-A\ Y=F(t),\quad Y(t_{0})=Y_{0},}
n = 2の場合、 次の式が得られます。 y ″ − ( α + β ) y ′ + α β y = f ( t ) , y ( t 0 ) = y 0 , y ′ ( t 0 ) = y 1 {\displaystyle y''-(\alpha +\beta )\ y'+\alpha \,\beta \ y=f(t),\quad y(t_{0})=y_{0},\quad y'(t_{0})=y_{1}}
は y ( t ) = y 0 s 0 ( t − t 0 ) + y 1 s 1 ( t − t 0 ) + ∫ t 0 t s 1 ( t − x ) f ( x ) d x , {\displaystyle y(t)=y_{0}\ s_{0}(t-t_{0})+y_{1}\ s_{1}(t-t_{0})+\int _{t_{0}}^{t}s_{1}(t-x)\,f(x)\ dx,}
ここで関数 s 0 と s 1 は上記のローラン級数によるサブセクションの評価と同じです。
参照
参考文献 ^ ホール 2015 式 2.1 ^ ホール 2015 命題 2.3 ^ ホール 2015 定理 2.12 ^ ホール 2015 定理 2.11 ^ ホール 2015 第5章 ^ Bhatia, R. (1997). 行列解析 . 大学院数学テキスト. 第169巻. Springer. ISBN 978-0-387-94846-1 。 ^ Lieb, Elliott H. (1973). 「凸トレース関数とウィグナー・ヤナセ・ダイソン予想」. Advances in Mathematics . 11 (3): 267– 288. doi : 10.1016/0001-8708(73)90011-X . ^ H. Epstein (1973). 「E. Liebの2つの定理に関する考察」. Communications in Mathematical Physics . 31 (4): 317– 325. Bibcode :1973CMaPh..31..317E. doi :10.1007/BF01646492. S2CID 120096681. ^ ホール 2015 演習 2.9 および 2.10 ^ RM Wilcox (1967). 「量子物理学における指数演算子とパラメータ微分化」. Journal of Mathematical Physics . 8 (4): 962– 982. Bibcode :1967JMP.....8..962W. doi :10.1063/1.1705306. ^ ホール 2015 定理 5.4 ^ Lewis, Adrian S.; Sendov, Hristo S. (2001). 「2回微分可能なスペクトル関数」 (PDF) . SIAM Journal on Matrix Analysis and Applications . 23 (2): 368– 386. doi :10.1137/S089547980036838X. 定理3.3を参照。 ^ ab Deledalle, Charles-Alban; Denis, Loïc; Tupin, Florence (2022). 「合成開口レーダー画像のための行列対数領域におけるスペックル低減」. Journal of Mathematical Imaging and Vision . 64 (3): 298– 320. Bibcode :2022JMIV...64..298D. doi : 10.1007/s10851-022-01067-1 . 命題1と命題2を参照してください。 ^ "Matrix exponential – MATLAB expm – MathWorks Deutschland". Mathworks.de. 2011年4月30日. 2013年6月5日 閲覧 。 ^ 「GNU Octave – 行列の関数」Network-theory.co.uk. 2007年1月11日. 2015年5月29日時点のオリジナルよりアーカイブ 。 2013年6月5日 閲覧。 ^ “R - pkg {Matrix}: Matrix Exponential”. 2005年2月28日. 2023年7月17日 閲覧 。 ^ "scipy.linalg.expm 関数ドキュメント". SciPyコミュニティ. 2015年1月18日. 2015年5月29日 閲覧 。 ^ Hall 2015 セクション2.2を参照 ^ ユークリッド空間における ^ ワイル、ヘルマン(1952年)『時空物質』ドーバー、142頁 。ISBN 978-0-486-60267-7 。 ^ Bjorken, James D.; Drell, Sidney D. (1964). 相対論的量子力学 . McGraw-Hill. p. 22. ^ Rinehart, RF (1955). 「行列関数の定義の同値性」. アメリカ数学月刊誌 , 62 (6), 395-414. ^これは一般化できます。一般に、 J n ( a ) の指数は、主 対角線上 にe a /0!、その上に e a /1!、 次の上に e a /2! を持つ上三角行列です 。
外部リンク