ミラー降下

数学において、ミラー降下法は微分可能な関数の局所的最小値を見つけるための反復的な最適化アルゴリズムです。

勾配降下法や乗法重みなどのアルゴリズムを一般化します。

歴史

ミラー降下法は、 1983年にネミロフスキーとユディンによって最初に提案されました^。[1]

モチベーション

微分可能関数に学習率の列を適用した勾配降下法では、の局所的最小値の推測から始めて、次のような列を考える。 $(\eta _{n})_{n\geq 0}$ $F$ $\mathbf {x} _{0}$ $F,$ $\mathbf {x} _{0},\mathbf {x} _{1},\mathbf {x} _{2},\ldots$

\mathbf {x} _{n+1}=\mathbf {x} _{n}-\eta _{n}\nabla F(\mathbf {x} _{n}),\ n\geq 0.

これを次のように言い換えることができる。

\mathbf {x} _{n+1}=\arg \min _{\mathbf {x} }\left(F(\mathbf {x} _{n})+\nabla F(\mathbf {x} _{n})^{T}(\mathbf {x} -\mathbf {x} _{n})+{\frac {1}{2\eta _{n}}}\|\mathbf {x} -\mathbf {x} _{n}\|^{2}\right)

言い換えると、近接項を追加することで、の 1 次近似をで最小化します。 $\mathbf {x} _{n+1}$ $F$ $\mathbf {x} _{n}$ $\|\mathbf {x} -\mathbf {x} _{n}\|^{2}$

この二乗ユークリッド距離項は、ブレグマン距離の具体的な例です。他のブレグマン距離を用いると、ヘッジ法などの他のアルゴリズムが得られ、特定の形状における最適化により適している可能性があります。^[2]^[3]

処方

凸集合上で最適化する凸関数と、上のノルムが与えられます。 $f$ $K\subset \mathbb {R} ^{n}$ $\|\cdot \|$ $\mathbb {R} ^{n}$

また、微分可能な凸関数も与えられます。これは与えられたノルムに関して強凸です。これは距離生成関数と呼ばれ、その勾配はミラー写像として知られています。 $h\colon \mathbb {R} ^{n}\to \mathbb {R}$ $\alpha$ $\nabla h\colon \mathbb {R} ^{n}\to \mathbb {R} ^{n}$

初期から始めて、ミラー降下の各反復で次のようになります。 $x_{0}\in K$

双対空間へのマップ: $\theta _{t}\leftarrow \nabla h(x_{t})$
勾配ステップを使用してデュアル空間で更新します。 $\theta _{t+1}\leftarrow \theta _{t}-\eta _{t}\nabla f(x_{t})$
原始空間にマップし直す: $x'_{t+1}\leftarrow (\nabla h)^{-1}(\theta _{t+1})$
実行可能領域に投影し直します。ここで、Bregman ダイバージェンスはです。 $K$ $x_{t+1}\leftarrow \mathrm {arg} \min _{x\in K}D_{h}(x||x'_{t+1})$ $D_{h}$

他のメソッドや拡張機能との接続

ミラー降下法は情報幾何学における自然勾配やリーマン勾配降下法と関連している。^[4]

オンライン最適化設定におけるミラー降下法は、オンラインミラー降下法（OMD）として知られています。^[5]

参照

参考文献

^ アルカディ・ネミロフスキー、デイヴィッド・ユディン著『最適化における問題の複雑性と手法の効率性』ジョン・ワイリー・アンド・サンズ、1983年
^ Nemirovski, Arkadi (2012) チュートリアル: 大規模な決定論的および確率的凸最適化のためのミラー降下アルゴリズム。https://www2.isye.gatech.edu/~nemirovs/COLT2012Tut.pdf
^ 「ミラー降下アルゴリズム」. tlienart.github.io . 2022年7月10日閲覧。
^ ニールセン、フランク、「自然勾配とリーマン勾配、鏡面降下法、そして通常の勾配との関連についての注釈」（PDF）、ブログ。
^ Fang, Huang; Harvey, Nicholas JA; Portella, Victor S.; Friedlander, Michael P. (2021-09-03). 「オンラインミラー降下法と双対平均化：動的ケースにおけるペース維持」arXiv : 2006.02585 [cs.LG].

[1] アルカディ・ネミロフスキー、デイヴィッド・ユディン著『最適化における問題の複雑性と手法の効率性』ジョン・ワイリー・アンド・サンズ、1983年

[2] Nemirovski, Arkadi (2012) チュートリアル: 大規模な決定論的および確率的凸最適化のためのミラー降下アルゴリズム。https://www2.isye.gatech.edu/~nemirovs/COLT2012Tut.pdf

[3] 「ミラー降下アルゴリズム」. tlienart.github.io . 2022年7月10日閲覧。

[4] ニールセン、フランク、「自然勾配とリーマン勾配、鏡面降下法、そして通常の勾配との関連についての注釈」（PDF）、ブログ。

[5] Fang, Huang; Harvey, Nicholas JA; Portella, Victor S.; Friedlander, Michael P. (2021-09-03). 「オンラインミラー降下法と双対平均化：動的ケースにおけるペース維持」arXiv : 2006.02585 [cs.LG].