ヘッセ行列

数学においてヘッセ行列(ヘッセんぎょう、Hessian 、または(あまり一般的ではないが)ヘッセ行列)は、スカラー値関数(またはスカラー体)の2階偏微分からなる正方行列である。これは、多変数関数の局所曲率を記述する。ヘッセ行列は19世紀にドイツの数学者ルートヴィヒ・オットー・ヘッセによって考案され、後に彼の名にちなんで命名された。ヘッセは当初「関数行列式」という用語を用いていた。ヘッセ行列は、H、または、またはで表されることある

定義とプロパティ

はベクトルを入力としてスカラーを出力する関数であるとする。2階偏微分がすべて存在する場合、のヘッセ行列は正方行列であり、通常は次のように定義され、配置される。 つまり、 ij列目の要素は

さらに、2 番目の偏導関数がすべて連続している場合、2 番目の導関数の対称性により、ヘッセ行列は対称行列になります。

ヘッセ行列の行列式はヘッセ行列式と呼ばれる[ 1 ]

関数のヘッセ行列は、関数の勾配ヤコビ行列転置です。つまり、

アプリケーション

変曲点

が3変数同次多項式である場合、方程式は平面射影曲線暗黙方程式となる。曲線の変曲点は、ヘッセ行列式が0となる非特異点と全く同じである。ベズーの定理によれば、ヘッセ行列式は3次多項式であるため、3次平面曲線は最大9個の変曲点を持つ。

2次導関数検定

凸関数のヘッセ行列は半正定値行列である。この性質を改良することで、臨界点が 極大値、極小値、あるいは鞍点のいずれであるかを以下のように判定することができる。

ヘッセ行列が正定値行列である場合、は で孤立した局所最小値を達成します。ヘッセ行列が負定値行列である場合、は で孤立した局所最大値を達成します。ヘッセ行列が正と負の固有値の両方を持つ場合、 はの鞍点となります。それ以外場合、この検定は決定的ではありません。これは、局所最小値ではヘッセ行列が半正定値行列であり、局所最大値ではヘッセ行列が半負定値行列であることを意味します。

半正定値および半負定値ヘッセ行列については、この検定は決定的なものではない(ヘッセ行列が半正定値でありながら正定値ではない臨界点は、局所的極値または鞍点である可能性がある)。しかし、モース理論の観点からは、より多くのことが言える

1変数および2変数関数の2階微分検定は、一般の場合よりも簡単です。1変数の場合、ヘッセ行列には2階微分が1つだけ含まれます。2階微分が正であれば極小、負であれば極大値となります。0の場合、検定は不確定です。2変数の場合、行列式は固有値の積であるため、行列式を使用できます。行列式が正であれば、固有値は両方とも正、または両方とも負です。行列式が負であれば、2つの固有値の符号が異なります。行列式が0の場合、2階微分検定は不確定です。

同様に、局所的最小値または最大値の十分条件となる2階の条件は、ヘッセ行列の主(左上端)行列式(部分行列の行列式)の列で表現できます。これらの条件は、制約付き最適化における境界付きヘッセ行列について次節で示す条件の特殊なケース、つまり制約の数が0の場合です。具体的には、最小値の十分条件は、これらの主小行列式がすべて正であることであり、最大値の十分条件は、これらの小行列式の符号が交互に変化し、小行列式が負であることです。

重要なポイント

関数の勾配(偏導関数のベクトル)がある点でゼロになる場合、関数は臨界点(または停留点を持ちます。におけるヘッセ行列の行列式は、文脈によっては判別式と呼ばれます。この行列式がゼロの場合、 は退化した臨界点、または非モース臨界点と呼ばれます。そうでない場合は、 は退化していないため、モース臨界点と呼ばれます。

ヘッセ行列は、その固有値によって臨界点の分類が可能になるため、モース理論カタストロフィー理論において重要な役割を果たしている。 [2] [3] [4]

ヘッセ行列の行列式は、関数の臨界点において評価されると、多様体として捉えられた関数のガウス曲率に等しい。その点におけるヘッセ行列の固有値は関数の主曲率であり、固有ベクトルは曲率の主方向である。(ガウス曲率 § 主曲率との関係 を参照。)

最適化での使用

ヘッセ行列は、関数の局所テイラー展開の二次項の係数であるため、ニュートン法における大規模最適化問題で用いられる。つまり、勾配は である。完全なヘッセ行列を計算して保存するにはメモリを消費するため、ニューラルネットワーク損失関数条件付きランダムフィールド、その他多数のパラメータを持つ統計モデルなどの高次元関数では実現不可能である。このような状況に対処するため、打ち切りニュートン法と準ニュートン法が開発されている。後者のアルゴリズム群はヘッセ行列の近似値を用いる。最も一般的な準ニュートン法の1つはBFGSである。[5]

このような近似では、最適化アルゴリズムがヘッセ行列を線形演算子 としてのみ使用するという事実を利用し、まずヘッセ行列が勾配の局所展開にも現れることに注意して進めます。

あるスカラーを仮定すると、となる。 したがって勾配が既に計算されている場合、近似ヘッセ行列は線形(勾配の大きさに比例)回数のスカラー演算によって計算できる。(この近似法はプログラムが簡単である一方、項による誤差を防ぐために小さくする必要があり、それを小さくすると最初の項の精度が失われるため、数値的に安定ではない。[6]

ランダム化探索ヒューリスティックスに関して特に注目すべきは、進化戦略の共分散行列が、スカラー因子と小さなランダム変動を除けば、ヘッセ行列の逆行列に適応する点である。この結果は、個体群サイズが増加するにつれて、単親戦略と静的モデルにおいて、二次近似を用いて正式に証明されている。[7]

その他のアプリケーション

ヘッセ行列は、画像処理コンピュータビジョンにおける画像処理演算子の表現に広く用いられています(ガウス分布のラプラシアン(LoG)ブロブ検出器、ヘッセ行列式(DoH)ブロブ検出器スケールスペースを参照)。これは、赤外分光法における異なる分子周波数を計算するために、通常モード解析に用いることができます[8]また、局所感度や統計診断にも用いられます。[9]

一般化

縁取りヘッセン

境界付きヘッセ行列、特定の制約付き最適化問題における2次導関数検定に用いられる。前述の関数を仮定するが、境界付きヘッセ行列がラグランジュ関数のヘッセ行列となるような制約関数を追加すると、次のようになる[10]

たとえば、制約がある場合、左上隅のゼロはゼロのブロックになり、上部に境界行、左側に境界列が存在します。

極値は(非特異ヘッセ行列を持つ臨界点の間では)正定値または負定値のヘッセ行列によって特徴付けられると述べている上記の規則は、境界付きヘッセ行列は負定値にも正定値にもなり得ないため、ここでは適用できません。これは、唯一の非ゼロ要素が最初の要素である任意のベクトルの場合と同じです。

ここでの2次導関数テストは、境界付きヘッセ行列の特定の集合の部分行列の行列式の符号制約から構成されます。[11]直感的には、制約は問題を自由変数の問題に縮小するものと考えることができます。(例えば、制約条件の下での最大化は、制約条件なしでの最大化に縮小できます。)

具体的には、境界付きヘッセ行列の主要な主小行列式(左上揃えの部分行列の行列式)のシーケンスに符号条件が課せられ、最初の主要な主小行列式は無視され、最小の小行列式は切り捨てられた最初の行と列で構成され、次の小行列式は切り捨てられた最初の行と列で構成され、以下同様に続き、最後は境界付きヘッセ行列全体になります。 がより大きい場合、最小の主要な主小行列式はヘッセ行列そのものです。[12]したがって、特定のポイントで評価される各小行列式が最大値 または 最小値 の候補として考えられます。極大値のための十分な条件は、これらの小行列式の符号が交互に変化し、最小の小行列式の符号が になることです。極小 のための十分な条件は、これらの小行列式の符号がすべての小行列式の符号が になることです(これらの条件の制約なしの場合、境界なしヘッセ行列がそれぞれ負定値または正定値になるための条件と一致する)。

ベクトル値関数

がベクトル場、つまり である場合2階偏微分の総和は行列ではなく、3階テンソルとなる。これはの各成分に対応するヘッセ行列の配列と考えることができるこのテンソルは、 のとき、通常のヘッセ行列に退化する。

複雑なケースへの一般化

複素変数が複数ある場合、ヘッセ行列は一般化できます。 と仮定し、 と書きます。 同一視すると、通常の「実」ヘッセ行列は行列です。 複素変数が複数ある場合の研究対象は正則関数、つまりn次元コーシー・リーマン条件の解であるため、通常はヘッセ行列のうち、正則な座標変換に対して不変な情報を含む部分に注目します。この「部分」はいわゆる複素ヘッセ行列で、行列 です。 が正則である 場合、その複素ヘッセ行列は恒等的にゼロとなるため、複素ヘッセ行列は滑らかな関数の研究に用いられますが、正則関数の研究には用いられません。例えば、レヴィ擬凸性を参照してください。正則関数を扱う場合、ヘッセ行列 を検討することができます。

リーマン多様体への一般化

をリーマン多様体としそのレヴィ・チヴィタ接続とするを滑らかな関数とする。ヘッセテンソルを で定義する。これは、関数の第一共変微分がその常微分と同じであるという事実を利用している。局所座標を選択すると、ヘッセ行列の局所表現は となる 。ここでは接続のクリストッフェル記号である。ヘッセ行列の他の同値な形式は で与えられる。

参照

参考文献

  1. ^ ビンモア, ケン; デイヴィス, ジョアン (2007).微積分の概念と方法. ケンブリッジ大学出版局. p. 190. ISBN 978-0-521-77541-0. OCLC  717598615。
  2. ^ Callahan, James J. (2010). Advanced Calculus: A Geometric View. Springer Science & Business Media. p. 248. ISBN 978-1-4419-7332-0
  3. ^ Casciaro, B.; Fortunato, D.; Francaviglia, M.; Masiello, A. 編 (2011). 一般相対性理論の最近の発展. Springer Science & Business Media. p. 178. ISBN 978-88-470-2113-6
  4. ^ Domenico PL Castrigiano; Sandra A. Hayes (2004). 『カタストロフィー理論』 Westview Press. p. 18. ISBN 978-0-8133-4126-2
  5. ^ Nocedal, Jorge ; Wright, Stephen (2000).数値最適化. Springer Verlag. ISBN 978-0-387-98793-4
  6. ^ Pearlmutter, Barak A. (1994). 「ヘッセ行列による高速厳密乗算」(PDF) .ニューラル・コンピュテーション. 6 (1): 147– 160. doi :10.1162/neco.1994.6.1.147. S2CID  1251969.
  7. ^ Shir, OM; A. Yehudayoff (2020). 「進化戦略における共分散-ヘッセ行列関係について」.理論計算機科学. 801. Elsevier: 157–174 . arXiv : 1806.03674 . doi : 10.1016/j.tcs.2019.09.002 .
  8. ^ Mott, Adam J.; Rez, Peter (2014年12月24日). 「タンパク質の赤外スペクトルの計算」 . European Biophysics Journal . 44 (3): 103– 112. doi :10.1007/s00249-014-1005-6. ISSN  0175-7571. PMID  25538002. S2CID  2945423.
  9. ^ Liu, Shuangzhe; Leiva, Victor; Zhuang, Dan; Ma, Tiefeng; Figueroa-Zúñiga, Jorge I. (2022年3月). 「行列微分計算とその多変量線形モデルへの応用とその診断法」. Journal of Multivariate Analysis . 188 104849. doi : 10.1016/j.jmva.2021.104849 .
  10. ^ Hallam, Arne (2004年10月7日). 「Econ 500: 経済分析における定量的手法 I」(PDF) .アイオワ州立大学.
  11. ^ ノイデッカー、ハインツ、マグナス、ヤン・R. (1988).行列微分積分学とその統計・計量経済学への応用. ニューヨーク:ジョン・ワイリー・アンド・サンズ. p. 136. ISBN 978-0-471-91516-4
  12. ^ Chiang, Alpha C. (1984). 『数理経済学の基礎的手法(第3版)』McGraw-Hill. p. 386. ISBN 978-0-07-010813-4

さらに読む

  • ルイス、デイビッド・W. (1991). 『行列理論』 シンガポール: ワールド・サイエンティフィック. ISBN 978-981-02-0689-5
  • マグナス、ヤン・R.、ノイデッカー、ハインツ (1999).「第二微分」.行列微分積分学:統計学と計量経済学への応用(改訂版). ニューヨーク: ワイリー. pp.  99– 115. ISBN 0-471-98633-X
Retrieved from "https://en.wikipedia.org/w/index.php?title=Hessian_matrix&oldid=1314244973"