行列差分方程式

行列差分方程式は、ある時点における変数のベクトル（または行列）の値が、それ以前の1つ以上の時点における自身の値と行列を用いて関連付けられる差分方程式です。^[1]^[2]方程式の位数は、変数ベクトルの任意の2つの示された値間の最大時間差です。例えば、

\mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}

これは2階行列差分方程式の例です。x $は$ n $\times 1$ の変数ベクトル、 $A$ と $B$ は $n \times n$ 行列です。この方程式は、方程式の末尾にベクトル定数項が追加されていないため、同次方程式です。同じ方程式は次のようにも表記されます。

\mathbf {x} _{t+2}=\mathbf {Ax} _{t+1}+\mathbf {Bx} _{t}

または

\mathbf {x} _{n}=\mathbf {Ax} _{n-1}+\mathbf {Bx} _{n-2}

最もよく見られる行列差分方程式は1階です

非同次一次行列差分方程式の例は

加法定数ベクトルbを持つ。この系の定常状態は、ベクトルxの値x *であり、これに到達した場合、その後はそこから逸脱しない。x *は、差分方程式でx t = x t −1 = x *と設定し、x * について解くことで得られる。

\mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {b}

ここで、 $Iは$ $n \times$ n の $単位行列$ であり、 $[I$ − $A] は逆行列である$ と仮定する。すると、非同 $次$ $方程式は定常状態からの偏差に関して同次形式で書き直すことができる。$

\mathbf {x} ^{*}=[\mathbf {I} -\mathbf {A} ]^{-1}\mathbf {b}

一次の場合の安定性

\left[\mathbf {x} _{t}-\mathbf {x} ^{*}\right]=\mathbf {A} \left[\mathbf {x} _{t-1}-\mathbf {x} ^{*}\right]

1階行列差分方程式[ x t − x ] = A [ x t −1 − x ]は安定である、つまりx t が定常状態x *に漸近収束するのは、遷移行列Aのすべての固有値（実数または複素数）の絶対値が1未満である場合に限ります。

1階の場合の解

方程式が同次形式y t = Ay t −1で表されていると仮定します。すると、ベクトルyの初期値であり、解を求めるために知っておく必要がある初期条件y 0から繰り返し反復して代入することができます。

などと、 $数学的帰納法によってt に関する解は次のようになります。$

{\begin{aligned}\mathbf {y} _{1}&=\mathbf {Ay} _{0}\\\mathbf {y} _{2}&=\mathbf {Ay} _{1}=\mathbf {A} ^{2}\mathbf {y} _{0}\\\mathbf {y} _{3}&=\mathbf {Ay} _{2}=\mathbf {A} ^{3}\mathbf {y} _{0}\end{aligned}}

さらに、Aが対角化可能な場合、 $Aを$ そので書き直すと

\mathbf {y} _{t}=\mathbf {A} ^{t}\mathbf {y} _{0}

Further, if $A$ is diagonalizable, we can rewrite $A$ in terms of its eigenvalues and eigenvectors, giving the solution as

\mathbf {y} _{t}=\mathbf {PD} ^{t}\mathbf {P} ^{-1}\mathbf {y} _{0},

ここで、 $P$ は $n \times n$ 行列で、その列は $A$ の固有ベクトル（固有値はすべて異なると仮定）であり、 $D$ は $n$ $\times$ $n$ 対角行列で、その対角要素は $A$ の固有値である。 $この$ 解は、上記の安定性の結果の根拠となる。A $t が$ $時間の経過とともに零行列に縮小するのは、 A$ の固有値がすべて絶対値で 1 未満である場合に限る。

1次行列系から単一のスカラー変数のダイナミクスを抽出する

$n$ 次元システム $y t = Ay t -1$ から始めて、状態変数の1つ、例えば $y 1$ のダイナミクスを抽出できます。上記の $y tの解方程式は、$ $y 1, t$ の解が $A$ の $n個の$ 固有値で表されていることを示しています。したがって、 $y$ $1$ の発展を記述する方程式は、同じ固有値を含む解を持つ必要があります。この記述は、直感的に $y$ $1$ の発展方程式を導き出します。それは

y_{1,t}=a_{1}y_{1,t-1}+a_{2}y_{1,t-2}+\dots +a_{n}y_{1,t-n}

ここで、パラメータ $a i$ は行列 $A$ の特性方程式から得られます。

\lambda ^{n}-a_{1}\lambda ^{n-1}-a_{2}\lambda ^{n-2}-\dots -a_{n}\lambda ^{0}=0.

$したがって、 n$ 次元1次線形システムの個々のスカラー変数はそれぞれ、行列差分方程式と同じ安定性特性（安定または不安定）を持つ単変数 $n$ 次差分方程式に従って発展します。

高次ケースの解と安定性

高階、つまり1周期よりも長い時間差を持つ行列差分方程式は、ブロック行列（行列の行列）を用いて1階形式に変換することで解くことができ、その安定性を解析することができます。例えば、2階方程式があるとします。

\mathbf {x} _{t}=\mathbf {Ax} _{t-1}+\mathbf {Bx} _{t-2}

変数ベクトル $x$ が $n \times1$ 、 $A$ と $Bが$ $n \times n$ の場合、これは次の形に積み重ねることができます

{\begin{bmatrix}\mathbf {x} _{t}\\\mathbf {x} _{t-1}\\\end{bmatrix}}={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {I} &\mathbf {0} \\\end{bmatrix}}{\begin{bmatrix}\mathbf {x} _{t-1}\\\mathbf {x} _{t-2}\end{bmatrix}}

ここで、 $I$ は $n \times n$ 単位行列、 $Oは$ $n \times n$ 零行列です。次に、現在の変数と一度遅れた変数の $2 n \times 1積み重ねベクトルを$ $z t$ 、 $2 n \times 2 n$ ブロック行列を $L$ と表記すると、前と同じように解が得られます。

\mathbf {z} _{t}=\mathbf {L} ^{t}\mathbf {z} _{0}

また前と同じように、この積み重ね方程式、つまり元の2次方程式は、行列 $L$ のすべての固有値の絶対値が1より小さい場合にのみ安定です。

非線形行列差分方程式：リカッチ方程式

線形2次ガウス制御では、現在および将来のコスト行列の逆進化を表す非線形行列方程式が生じ、以下では $H$ と表記されます。この方程式は離散動的リカッチ方程式と呼ばれ、線形行列差分方程式に従って進化する変数ベクトルが、2次コスト関数を最適化するために外生ベクトルを操作することによって制御されるときに生じます。このリカッチ方程式は、次のような、または類似の形式をとります。

\mathbf {H} _{t-1}=\mathbf {K} +\mathbf {A} '\mathbf {H} _{t}\mathbf {A} -\mathbf {A} '\mathbf {H} _{t}\mathbf {C} \left[\mathbf {C} '\mathbf {H} _{t}\mathbf {C} +\mathbf {R} \right]^{-1}\mathbf {C} '\mathbf {H} _{t}\mathbf {A}

ここで、 $H$ 、 $K$ 、 $A$ は $n \times n$ 、 $C$ は $n \times k$ 、 $R$ は $k \times k$ 、 $n$ は制御対象ベクトルの要素数、 $k$ は制御ベクトルの要素数です。パラメータ行列 $A$ と $C$ は線形方程式から、パラメータ行列 $K$ と $R$ は2次コスト関数から得られます。詳細はこちらをご覧ください

一般に、この方程式は $H t$ について $tを用いて解析的に解くことはできません。むしろ、$ $H t$ の値の列はリカッチ方程式を反復することによって求められます。しかし、 $R$ $=$ $0$ かつ $n$ $=$ $k$ $+ 1の場合、このリカッチ方程式はスカラー$ 有理差分方程式に簡約することで解析的に解くことができることが^[3]で示されています。さらに、任意の $k$ と $n$ について、遷移行列 $A$ が非特異であれば、リカッチ方程式は行列の固有値を用いて解析的に解くことができますが、固有値は数値的に求める必要がある場合もあります。^[4]

$ほとんどの状況において、 H$ の時間的逆方向の発展は安定しており、これは $Hが$ 特定の固定行列 $H *$ に収束することを意味します。これは、他のすべての行列が有理行列であっても、無理行列である可能性があります。確率制御§離散時間も参照してください。

関連するリカッチ方程式^[5]は

\mathbf {X} _{t+1}=-\left[\mathbf {E} +\mathbf {B} \mathbf {X} _{t}\right]\left[\mathbf {C} +\mathbf {A} \mathbf {X} _{t}\right]^{-1}

ここで、行列 $X 、 A 、 B 、 C 、 E$ はすべて $n \times n$ です。この方程式は明示的に解くことができます。t = 0 で N 0 = X 0 、D 0 = I のとき、が確実に成り立つと仮定します $。$ $これ$ を $差分$ $方程式$ $に$ $用いる$ $と$ 、 $\mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1},$

{\begin{aligned}\mathbf {X} _{t+1}&=-\left[\mathbf {E} +\mathbf {BN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\mathbf {D} _{t}^{-1}\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\left[\mathbf {C} +\mathbf {AN} _{t}\mathbf {D} _{t}^{-1}\right]\mathbf {D} _{t}\right]^{-1}\\&=-\left[\mathbf {ED} _{t}+\mathbf {BN} _{t}\right]\left[\mathbf {CD} _{t}+\mathbf {AN} _{t}\right]^{-1}\\&=\mathbf {N} _{t+1}\mathbf {D} _{t+1}^{-1}\end{aligned}}

この形はすべての $tに対して成り立ちます。すると、$ $N$ と $D$ の変化は次のように表すことができます。 $\mathbf {X} _{t}=\mathbf {N} _{t}\mathbf {D} _{t}^{-1}$

{\begin{bmatrix}\mathbf {N} _{t+1}\\\mathbf {D} _{t+1}\end{bmatrix}}={\begin{bmatrix}-\mathbf {B} &-\mathbf {E} \\\mathbf {A} &\mathbf {C} \end{bmatrix}}{\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}\equiv \mathbf {J} {\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}

したがって、帰納法によって

{\begin{bmatrix}\mathbf {N} _{t}\\\mathbf {D} _{t}\end{bmatrix}}=\mathbf {J} ^{t}{\begin{bmatrix}\mathbf {N} _{0}\\\mathbf {D} _{0}\end{bmatrix}}

参照

参考文献

^ Cull, Paul; Flahive, Mary ; Robson, Robbie (2005). Difference Equations: From Rabbits to Chaos . Springer. ch. 7. ISBN 0-387-23234-6.
^ チアン、アルファ・C. (1984).数理経済学の基礎的手法（第3版）. マグロウヒル. 608–612ページ. ISBN 9780070107809.
^ Balvers, Ronald J.; Mitchell, Douglas W. (2007). 「線形二次制御問題の次元削減」(PDF) . Journal of Economic Dynamics and Control . 31 (1): 141– 159. doi :10.1016/j.jedc.2005.09.013. S2CID 121354131.
^ Vaughan, DR (1970). 「離散リカッチ方程式の非再帰的代数解」. IEEE Transactions on Automatic Control . 15 (5): 597– 599. doi :10.1109/TAC.1970.1099549.
^ Martin, CF; Ammar, G. (1991). 「行列リカッチ方程式の幾何学とそれに伴う固有値法」. Bittani; Laub; Willems (eds.). The Riccati Equation . Springer-Verlag. doi :10.1007/978-3-642-58223-3_5. ISBN 978-3-642-63508-3.

[1] Cull, Paul; Flahive, Mary ; Robson, Robbie (2005). Difference Equations: From Rabbits to Chaos . Springer. ch. 7. ISBN 0-387-23234-6.

[2] チアン、アルファ・C. (1984).数理経済学の基礎的手法（第3版）. マグロウヒル. 608–612ページ. ISBN 9780070107809.

[3] Balvers, Ronald J.; Mitchell, Douglas W. (2007). 「線形二次制御問題の次元削減」(PDF) . Journal of Economic Dynamics and Control . 31 (1): 141– 159. doi :10.1016/j.jedc.2005.09.013. S2CID 121354131.

[4] Vaughan, DR (1970). 「離散リカッチ方程式の非再帰的代数解」. IEEE Transactions on Automatic Control . 15 (5): 597– 599. doi :10.1109/TAC.1970.1099549.

[5] Martin, CF; Ammar, G. (1991). 「行列リカッチ方程式の幾何学とそれに伴う固有値法」. Bittani; Laub; Willems (eds.). The Riccati Equation . Springer-Verlag. doi :10.1007/978-3-642-58223-3_5. ISBN 978-3-642-63508-3.