確率計画法

数理最適化の分野において、確率計画法は不確実性を伴う最適化問題をモデル化するための枠組みである。確率計画法とは、問題パラメータの一部またはすべてが不確実であるものの、既知の確率分布に従う最適化問題である。^[1]^[2]この枠組みは、すべての問題パラメータが正確に既知であると仮定する決定論的最適化とは対照的である。確率計画法の目的は、意思決定者が選択したいくつかの基準を最適化し、かつ問題パラメータの不確実性を適切に考慮した決定を見つけることである。現実世界の多くの意思決定には不確実性が含まれるため、確率計画法は金融から輸送、エネルギー最適化に至るまで幅広い分野で応用されている。^[3]^[4]

方法

いくつかの確率的計画法が開発されています。

サンプル平均近似を含むシナリオベースの方法
いくつかの変数が整数でなければならない問題に対する確率整数計画法
与えられた確率で満たされなければならない制約を扱うためのチャンス制約プログラミング
確率動的計画法
マルコフ決定過程
ベンダーの分解

2段階の問題定義

2段階確率計画法の基本的な考え方は、（最適な）決定は、決定が行われる時点で利用可能なデータに基づいて行われ、将来の観測値に依存してはならないというものです。この2段階定式化は、確率計画法において広く用いられています。2段階確率計画法の問題の一般的な定式化は、以下の式で与えられます。ここで、は第2段階の問題の最適値です。 $\min _{x\in X}\{g(x)=f(x)+E_{\xi }[Q(x,\xi )]\}$ $Q(x,\xi )$ $\min _{y}\{q(y,\xi )\,|\,T(\xi )x+W(\xi )y=h(\xi )\}.$

古典的な2段階線形確率計画問題は次のように定式化できる。 ${\begin{array}{llr}\min \limits _{x\in \mathbb {R} ^{n}}&g(x)=c^{T}x+E_{\xi }[Q(x,\xi )]&\\{\text{subject to}}&Ax=b&\\&x\geq 0&\end{array}}$

第2段階の問題の最適値はどこにあるか $Q(x,\xi )$ ${\begin{array}{llr}\min \limits _{y\in \mathbb {R} ^{m}}&q(\xi )^{T}y&\\{\text{subject to}}&T(\xi )x+W(\xi )y=h(\xi )&\\&y\geq 0&\end{array}}$

このような定式化では、は第一段階の決定変数ベクトル、は第二段階の決定変数ベクトル、は第二段階の問題のデータを含みます。この定式化では、第一段階では、不確実なデータ（ランダムベクトルとして捉えられる）の実現値が判明する前に、「今ここで」の決定を下す必要があります。第二段階では、の実現値が判明した後、適切な最適化問題を解くことで行動を最適化します。 $x\in \mathbb {R} ^{n}$ $y\in \mathbb {R} ^{m}$ $\xi (q,T,W,h)$ $x$ $\xi$ $\xi$

第一段階では、第一段階の意思決定のコストと、（最適な）第二段階の意思決定の期待コストを加算して最適化（上記の定式化では最小化）します。第二段階の問題は、不確実なデータが明らかになった際に想定される最適な行動を記述する最適化問題として単純に捉えることもできますし、その解決策を、システムの潜在的な不整合を補償する項と、この項のコストをリコースアクションとして捉えることもできます。 $c^{T}x$ $Wy$ $Tx\leq h$ $q^{T}y$

検討されている二段階問題は、目的関数と制約が線形であるため線形である。概念的にはこれは本質的ではなく、より一般的な二段階確率計画問題を考えることもできる。例えば、第一段階の問題が整数問題である場合、第一段階の問題に整数性制約を追加することで、実行可能集合が離散的になるようにすることができる。必要に応じて、非線形の目的関数と制約も組み込むことができる。^[5]

分配仮定

上記の2段階問題の定式化では、第2段階のデータが既知の確率分布を持つランダムベクトルとしてモデル化されていると仮定しています。これは多くの状況で正当化されます。例えば、分布が対象期間にわたって大きく変化しないと仮定すれば、の分布は履歴データから推測できます。また、サンプルの経験分布は、の将来値の分布の近似値として使用できます。の事前モデルがあれば、ベイズ更新によって事後分布を取得できます。 $\xi$ $\xi$ $\xi$ $\xi$

シナリオベースのアプローチ

離散化

2段階確率問題を数値的に解くには、ランダムベクトルには、それぞれの確率質量がである、シナリオと呼ばれる有限個の可能な実現値（例えば）が存在すると仮定することがしばしば必要となる。この場合、第1段階問題の目的関数における期待値は、次の和として表すことができる。さらに、2段階問題は1つの大きな線形計画問題として定式化することができる（これは元の問題の決定論的等価問題と呼ばれる。「確率問題の決定論的等価問題」のセクションを参照）。 $\xi$ $\xi _{1},\dots ,\xi _{K}$ $p_{1},\dots ,p_{K}$ $E[Q(x,\xi )]=\sum \limits _{k=1}^{K}p_{k}Q(x,\xi _{k})$

無限（あるいは非常に多数）の実現可能性が存在する場合、標準的なアプローチは、この分布をシナリオで表現することです。このアプローチは、以下の3つの疑問を提起します。 $\xi$

シナリオの構築方法については、§ シナリオの構築を参照してください。
決定論的等価問題の解き方。CPLEXやGLPKなどの最適化ツールは、大規模な線形/非線形問題を解くことができます。ウィスコンシン大学マディソン校がホストするNEOSサーバー^{[6]では、多くの最新ソルバーに無料でアクセスできます。決定論的等価問題の構造は、}ベンダーズ分解やシナリオ分解などの分解法^[7]の適用に特に適しています。
得られたソリューションの品質を「真の」最適値と比較して測定する方法。

これらの問題は独立ではありません。例えば、構築されるシナリオの数は、決定論的等価物の扱いやすさと得られる解の質の両方に影響を与えます。

確率線形計画法

確率線形計画法は、古典的な2段階確率計画法の特殊な例です。確率線形計画法は、それぞれ同じ構造を持ちながら多少異なるデータを持つ、複数期間の線形計画法（LP）の集合から構築されます。シナリオを表す2期間のLPは、以下の形式を持つと考えられます。 $k^{th}$ $k^{th}$

${\begin{array}{lccccccc}{\text{Minimize}}&f^{T}x&+&g^{T}y&+&h_{k}^{T}z_{k}&&\\{\text{subject to}}&Tx&+&Uy&&&=&r\\&&&V_{k}y&+&W_{k}z_{k}&=&s_{k}\\&x&,&y&,&z_{k}&\geq &0\end{array}}$

ベクトルとには、第1期の変数が含まれており、その値は直ちに選択する必要があります。ベクトルには、後続期のすべての変数が含まれています。制約条件は第1期の変数のみに関係し、すべてのシナリオで同じです。その他の制約条件は、後続期の変数に関係し、シナリオごとにいくつかの点で異なり、将来の不確実性を反映しています。 $x$ $y$ $z_{k}$ $Tx+Uy=r$

2期間のLPを解くことは、第2期間のシナリオを不確実性なしに仮定することと等価であることに注意してください。第2段階で不確実性を組み込むには、異なるシナリオに確率を割り当て、対応する決定論的等価物を解く必要があります。 $k^{th}$ $k^{th}$

確率的問題の決定論的等価物

有限個のシナリオを用いると、2段階確率線形計画問題は大規模線形計画問題としてモデル化できます。この定式化は、しばしば決定論的等価線形計画問題、または略して決定論的等価問題と呼ばれます。（厳密に言えば、決定論的等価問題とは、最適な第1段階の決定を計算するために使用できる任意の数学的プログラムであり、第2段階のコストを何らかの閉じた形で表現できる場合、連続確率分布にも存在します。）例えば、上記の確率線形計画問題の決定論的等価問題を作成するには、各シナリオに確率を割り当てます。すると、すべてのシナリオからの制約条件の下で、目的関数の期待値を最小化できます。 $p_{k}$ $k=1,\dots ,K$

${\begin{array}{lccccccccccccc}{\text{Minimize}}&f^{\top }x&+&g^{\top }y&+&p_{1}h_{1}^{\top }z_{1}&+&p_{2}h_{2}^{T}z_{2}&+&\cdots &+&p_{K}h_{K}^{\top }z_{K}&&\\{\text{subject to}}&Tx&+&Uy&&&&&&&&&=&r\\&&&V_{1}y&+&W_{1}z_{1}&&&&&&&=&s_{1}\\&&&V_{2}y&&&+&W_{2}z_{2}&&&&&=&s_{2}\\&&&\vdots &&&&&&\ddots &&&&\vdots \\&&&V_{K}y&&&&&&&+&W_{K}z_{K}&=&s_{K}\\&x&,&y&,&z_{1}&,&z_{2}&,&\ldots &,&z_{K}&\geq &0\\\end{array}}$

後期変数のベクトルはシナリオごとに異なります。しかし、第1期変数とについては、どのシナリオが実現するかを知る前に、第1期について決定を下す必要があるため、すべてのシナリオで同じです。したがって、とのみに関する制約は一度だけ指定すればよく、残りの制約はシナリオごとに個別に指定する必要があります。 $z_{k}$ $k$ $x$ $y$ $x$ $y$

シナリオ構築

実際には、専門家から将来に関する意見を聞き出すことでシナリオを構築できる可能性があります。構築するシナリオの数は比較的少なく、得られる決定論的等価シナリオを妥当な計算量で解くことができるようにする必要があります。少数のシナリオのみを用いた最適な解は、単一のシナリオのみを想定する解よりも、より適応性の高い計画を提供するとよく言われます。場合によっては、このような主張はシミュレーションによって検証できます。理論的には、得られた解が元の問題を妥当な精度で解くことを保証するいくつかの手段があります。通常、応用においては、最初の段階の最適解のみが実用的な価値を持ちます。なぜなら、ランダムデータの「真の」実現は、構築（生成）されたシナリオの集合とはほぼ常に異なるからです。 $x^{*}$

に独立したランダム成分が含まれており、それぞれが3つの実現可能性を持つと仮定すると（例えば、各ランダムパラメータの将来の実現可能性は低、中、高に分類される）、シナリオの総数はとなります。シナリオ数がこのように指数関数的に増加すると、たとえ妥当なサイズであっても、専門家の意見を用いたモデル開発は非常に困難になります。のランダム成分の一部が連続分布を持つ場合、状況はさらに悪化します。 $\xi$ $d$ $K=3^{d}$ $d$ $\xi$

モンテカルロサンプリングとサンプル平均近似（SAA）法

シナリオセットを扱いやすいサイズに縮小する一般的な方法は、モンテカルロシミュレーションを用いることです。シナリオの総数が非常に多い、あるいは無限大であると仮定します。さらに、ランダムベクトルの実現値の標本を生成できると仮定します。通常、標本は独立かつ同一分布に従うと仮定されます（iid標本）。標本が与えられた場合、期待値関数は標本平均によって近似されます。 $\xi ^{1},\xi ^{2},\dots ,\xi ^{N}$ $N$ $\xi$ $q(x)=E[Q(x,\xi )]$

${\hat {q}}_{N}(x)={\frac {1}{N}}\sum _{j=1}^{N}Q(x,\xi ^{j})$

したがって、第一段階の問題は次のように与えられる。

${\begin{array}{rlrrr}{\hat {g}}_{N}(x)=&\min \limits _{x\in \mathbb {R} ^{n}}&c^{T}x+{\frac {1}{N}}\sum _{j=1}^{N}Q(x,\xi ^{j})&\\&{\text{subject to}}&Ax&=&b\\&&x&\geq &0\end{array}}$

この定式化は標本平均近似法として知られています。SAA問題は、対象となる標本の関数であり、その意味でランダムです。与えられた標本に対して、 SAA問題は、シナリオ. ,がそれぞれ同じ確率で実行される2段階確率線形計画問題と同じ形式です。 $\xi ^{1},\xi ^{2},\dots ,\xi ^{N}$ $\xi ^{j}$ $j=1,\dots ,N$ $p_{j}={\frac {1}{N}}$

統計的推論

次の確率計画問題を考えてみましょう

\min \limits _{x\in X}\{g(x)=f(x)+E[Q(x,\xi )]\}

ここではの空でない閉部分集合であり、は確率分布が集合上でサポートされるランダムベクトルであり、である。2段階確率計画法の枠組みにおいて、は対応する第2段階問題の最適値によって与えられる。 $X$ $\mathbb {R} ^{n}$ $\xi$ $P$ $\Xi \subset \mathbb {R} ^{d}$ $Q:X\times \Xi \rightarrow \mathbb {R}$ $Q(x,\xi )$

が明確に定義され、すべてのに対して有限値であると仮定する。これは、任意のに対して、その値がほぼ確実に有限であることを意味する。 $g(x)$ $x\in X$ $x\in X$ $Q(x,\xi )$

ランダムベクトルの実現値の標本があるとする。このランダム標本はの観測値の履歴データとみなすこともできるし、モンテカルロサンプリング法によって生成することもできる。そして、対応する標本平均近似を定式化することができる。 $\xi ^{1},\dots ,\xi ^{N}$ $N$ $\xi$ $N$ $\xi$

\min \limits _{x\in X}\{{\hat {g}}_{N}(x)=f(x)+{\frac {1}{N}}\sum _{j=1}^{N}Q(x,\xi ^{j})\}

大数の法則により、ある正則性条件下では、は確率1でに点収束することが分かります。さらに、軽度の付加条件下では、収束は一様です。また、、すなわちはの不偏推定値です。したがって、SAA問題の最適値と最適解は、真の問題のそれぞれの最適値と最適解にとして収束すると期待するのは当然です。 ${\frac {1}{N}}\sum _{j=1}^{N}Q(x,\xi ^{j})$ $E[Q(x,\xi )]$ $N\rightarrow \infty$ $E[{\hat {g}}_{N}(x)]=g(x)$ ${\hat {g}}_{N}(x)$ $g(x)$ $N\rightarrow \infty$

SAA推定値の一貫性

SAA問題の実行可能集合が固定されている、つまり標本に依存しないと仮定する。真の問題の最適値と最適解の集合をそれぞれととし、SAA問題の最適値と最適解の集合をそれぞれととする。 $X$ $\vartheta ^{*}$ $S^{*}$ ${\hat {\vartheta }}_{N}$ ${\hat {S}}_{N}$

とを（決定論的な）実数値関数の列とする。以下の2つの性質は同値である。 $g:X\rightarrow \mathbb {R}$ ${\hat {g}}_{N}:X\rightarrow \mathbb {R}$
- 任意の列に対して、収束する任意の列は、収束する ${\overline {x}}\in X$ $\{x_{N}\}\subset X$ ${\overline {x}}$ ${\hat {g}}_{N}(x_{N})$ $g({\overline {x}})$
- 関数は連続であり、任意のコンパクト部分集合上で一様収束する。 $g(\cdot )$ $X$ ${\hat {g}}_{N}(\cdot )$ $g(\cdot )$ $X$
SAA問題の目的関数が、実行可能集合上で一様に、確率1で真の問題の目的関数に収束するとします。すると、は、確率1でに収束します。 ${\hat {g}}_{N}(x)$ $g(x)$ $N\rightarrow \infty$ $X$ ${\hat {\vartheta }}_{N}$ $\vartheta ^{*}$ $N\rightarrow \infty$
次のようなコンパクト集合が存在すると仮定する。 $C\subset \mathbb {R} ^{n}$
- 真の問題の最適解の集合は空ではなく、以下に含まれる。 $S$ $C$
- 関数は有限値であり、連続である。 $g(x)$ $C$
- 関数列は確率1でに収束し、一様に ${\hat {g}}_{N}(x)$ $g(x)$ $N\rightarrow \infty$ $x\in C$
- 十分に大きい場合、集合は空ではなく、確率1で $N$ ${\hat {S}}_{N}$ ${\hat {S}}_{N}\subset C$

となり、確率1でとなる。は集合から集合への偏差を表し、以下のように定義される。

{\hat {\vartheta }}_{N}\rightarrow \vartheta ^{*}

\mathbb {D} (S^{*},{\hat {S}}_{N})\rightarrow 0

N\rightarrow \infty

\mathbb {D} (A,B)

$A$ $B$

\mathbb {D} (A,B):=\sup _{x\in A}\{\inf _{x'\in B}\|x-x'\|\}

いくつかの状況では、SAA問題の実行可能集合が推定され、対応するSAA問題は次の形式をとる。 $X$

\min _{x\in X_{N}}{\hat {g}}_{N}(x)

ここで、は標本に依存するの部分集合であり、したがってランダムである。しかしながら、SAA推定値の一貫性の結果は、いくつかの追加の仮定の下でも導き出すことができる。 $X_{N}$ $\mathbb {R} ^{n}$

次のようなコンパクト集合が存在すると仮定する。 $C\subset \mathbb {R} ^{n}$
- 真の問題の最適解の集合は空ではなく、以下に含まれる。 $S$ $C$
- 関数は有限値であり、連続である。 $g(x)$ $C$
- 関数列は確率1でに収束し、一様に ${\hat {g}}_{N}(x)$ $g(x)$ $N\rightarrow \infty$ $x\in C$
- 十分に大きい場合、集合は空ではなく、確率1で $N$ ${\hat {S}}_{N}$ ${\hat {S}}_{N}\subset C$
- とが確率1で点に収束する場合、 $x_{N}\in X_{N}$ $x_{N}$ $x$ $x\in X$
- ある点において、確率 1 で次の数列が存在します。 $x\in S^{*}$ $x_{N}\in X_{N}$ $x_{N}\rightarrow x$

すると、確率 1 でとなります。

{\hat {\vartheta }}_{N}\rightarrow \vartheta ^{*}

\mathbb {D} (S^{*},{\hat {S}}_{N})\rightarrow 0

N\rightarrow \infty

SAA最適値の漸近解析

標本が独立同値で、点を固定すると仮定する。すると、の標本平均推定値は不偏かつ分散を持つ。ここでは有限であると仮定する。さらに、中心極限定理より、 $\xi ^{1},\dots ,\xi ^{N}$ $x\in X$ ${\hat {g}}_{N}(x)$ $g(x)$ ${\frac {1}{N}}\sigma ^{2}(x)$ $\sigma ^{2}(x):=Var[Q(x,\xi )]$

{\sqrt {N}}[{\hat {g}}_{N}-g(x)]{\xrightarrow {\mathcal {D}}}Y_{x}

ここで、は分布の収束を表し、は平均と分散の正規分布を持ち、と表記されます。 ${\xrightarrow {\mathcal {D}}}$ $Y_{x}$ $0$ $\sigma ^{2}(x)$ ${\mathcal {N}}(0,\sigma ^{2}(x))$

言い換えれば、は漸近的に正規分布に従う、すなわちが大きい場合、は平均、分散の近似正規分布に従う。このことから、の（近似的な）%信頼区間は次のようになる。 ${\hat {g}}_{N}(x)$ $N$ ${\hat {g}}_{N}(x)$ $g(x)$ ${\frac {1}{N}}\sigma ^{2}(x)$ $100(1-\alpha )$ $f(x)$

\left[{\hat {g}}_{N}(x)-z_{\alpha /2}{\frac {{\hat {\sigma }}(x)}{\sqrt {N}}},{\hat {g}}_{N}(x)+z_{\alpha /2}{\frac {{\hat {\sigma }}(x)}{\sqrt {N}}}\right]

ここで（ここでは標準正規分布の累積分布関数を表す）および $z_{\alpha /2}:=\Phi ^{-1}(1-\alpha /2)$ $\Phi (\cdot )$

{\hat {\sigma }}^{2}(x):={\frac {1}{N-1}}\sum _{j=1}^{N}\left[Q(x,\xi ^{j})-{\frac {1}{N}}\sum _{j=1}^{N}Q(x,\xi ^{j})\right]^{2}

はの標本分散推定値です。つまり、の推定値の誤差は（確率的に）のオーダーです。 $\sigma ^{2}(x)$ $g(x)$ $O({\sqrt {N}})$

アプリケーションと例

生物学的応用

確率的動的計画法は、行動生態学などの分野において、動物行動のモデル化に頻繁に用いられている。^[8]^[9]最適採餌行動、鳥類の巣立ちや寄生蜂の産卵といった生活史遷移のモデルに関する実証的検証は、このモデリング手法が行動意思決定の進化を説明する上で有用であることを示している。これらのモデルは、通常、2段階ではなく多段階で構成される。

経済的応用

確率動的計画法は、不確実性下における意思決定を理解する上で有用なツールです。不確実性下における資本ストックの蓄積はその一例であり、資源経済学者は天候など不確実性が関与する生物経済学の問題^{[10]を分析するために、この手法を用いることが多いです。}

例: 多段階ポートフォリオ最適化

以下は、ファイナンスにおける多段階確率計画法の例です。ある時点において、資産に投資するための初期資本があるとします。さらに、ポートフォリオを随時リバランスすることは可能ですが、追加資金の投入は行わないものとします。各時点において、現在の資産を資産間で再分配する決定を下します。n個の資産に投資された初期額をnとします。各nは非負であり、バランス方程式が成立することを条件とします。 $t=0$ $W_{0}$ $n$ $t=1,\dots ,T-1$ $t$ $W_{t}$ $n$ $x_{0}=(x_{10},\dots ,x_{n0})$ $x_{i0}$ $\sum _{i=1}^{n}x_{i0}=W_{0}$

各期間の総収益について考えてみましょう。これはベクトル値のランダムプロセスを形成します。期間に、各資産に投資された金額を指定してポートフォリオを再調整できます。その時点では、第 1 期間の収益が実現されているため、再調整の決定にこの情報を使用するのは合理的です。したがって、時間における第 2 段階の決定は、実際にはランダムベクトルの実現の関数、つまりです。同様に、時間における決定は、時間までのランダムプロセスの履歴によって提供される利用可能な情報の関数です。が定数である一連の関数、は、決定プロセスの実装可能なポリシーを定義します。このようなポリシーは、確率 1 でモデル制約、つまり非負制約、、、および資産残高制約を満たす場合に実行可能であると言えます。 $\xi _{t}=(\xi _{1t},\dots ,\xi _{nt})$ $t=1,\dots ,T$ $\xi _{1},\dots ,\xi _{T}$ $t=1$ $x_{1}=(x_{11},\dots ,x_{n1})$ $t=1$ $\xi _{1}$ $x_{1}=x_{1}(\xi _{1})$ $t$ $x_{t}=(x_{1t},\dots ,x_{nt})$ $x_{t}=x_{t}(\xi _{[t]})$ $\xi _{[t]}=(\xi _{1},\dots ,\xi _{t})$ $t$ $x_{t}=x_{t}(\xi _{[t]})$ $t=0,\dots ,T-1$ $x_{0}$ $x_{it}(\xi _{[t]})\geq 0$ $i=1,\dots ,n$ $t=0,\dots ,T-1$

\sum _{i=1}^{n}x_{it}(\xi _{[t]})=W_{t},

期間中に富は $t=1,\dots ,T$ $W_{t}$

W_{t}=\sum _{i=1}^{n}\xi _{it}x_{i,t-1}(\xi _{[t-1]}),

それはランダムプロセスの実現と時間までの決定に依存します。 $t$

最終期におけるこの富の期待効用を最大化することが目的であると仮定すると、つまり、次のような問題を考える。

\max E[U(W_{T})].

これは多段階確率計画問題であり、各段階はからまで番号が付けられています。最適化は、実装可能かつ実行可能なすべての方策について行われます。問題の説明を完了するには、ランダムプロセスの確率分布を定義する必要があります。これはさまざまな方法で行うことができます。例えば、プロセスの時間発展を定義する特定のシナリオツリーを構築することができます。各段階において、各資産のランダムリターンが他の資産とは独立して2つの継続を持つことが許容される場合、シナリオの総数は $t=0$ $t=T-1$ $\xi _{1},\dots ,\xi _{T}$ $2^{nT}.$

動的計画法の方程式を書くには、上記の多段階問題を時間的に遡って考えてみましょう。最終段階では、ランダム過程の実現方法が既知であり、選択されています。したがって、次の問題を解く必要があります。 $t=T-1$ $\xi _{[T-1]}=(\xi _{1},\dots ,\xi _{T-1})$ $x_{T-2}$

{\begin{array}{lrclr}\max \limits _{x_{T-1}}&E[U(W_{T})|\xi _{[T-1]}]&\\{\text{subject to}}&W_{T}&=&\sum _{i=1}^{n}\xi _{iT}x_{i,T-1}\\&\sum _{i=1}^{n}x_{i,T-1}&=&W_{T-1}\\&x_{T-1}&\geq &0\end{array}}

ここで、は与えられたの条件付き期待値を表します。上記の問題の最適値はとに依存し、はと表されます。 $E[U(W_{T})|\xi _{[T-1]}]$ $U(W_{T})$ $\xi _{[T-1]}$ $W_{T-1}$ $\xi _{[T-1]}$ $Q_{T-1}(W_{T-1},\xi _{[T-1]})$

同様に、段階ごとに、問題を解決する必要があります $t=T-2,\dots ,1$

{\begin{array}{lrclr}\max \limits _{x_{t}}&E[Q_{t+1}(W_{t+1},\xi _{[t+1]})|\xi _{[t]}]&\\{\text{subject to}}&W_{t+1}&=&\sum _{i=1}^{n}\xi _{i,t+1}x_{i,t}\\&\sum _{i=1}^{n}x_{i,t}&=&W_{t}\\&x_{t}&\geq &0\end{array}}

その最適値はで表されます。最終的に、段階では、問題 $Q_{t}(W_{t},\xi _{[t]})$ $t=0$

{\begin{array}{lrclr}\max \limits _{x_{0}}&E[Q_{1}(W_{1},\xi _{[1]})]&\\{\text{subject to}}&W_{1}&=&\sum _{i=1}^{n}\xi _{i,1}x_{i0}\\&\sum _{i=1}^{n}x_{i0}&=&W_{0}\\&x_{0}&\geq &0\end{array}}

段階的に独立したランダムプロセス

プロセスの一般的な分布では、これらの動的計画法方程式を解くのは困難かもしれません。プロセスが段階的に独立している場合、つまりがに対して（確率的に）独立である場合、状況は劇的に単純化されます。この場合、対応する条件付き期待値は無条件期待値になり、関数はに依存しません。つまり、は問題の最適値です。 $\xi _{t}$ $\xi _{t}$ $\xi _{t}$ $\xi _{1},\dots ,\xi _{t-1}$ $t=2,\dots ,T$ $Q_{t}(W_{t})$ $t=1,\dots ,T-1$ $\xi _{[t]}$ $Q_{T-1}(W_{T-1})$

{\begin{array}{lrclr}\max \limits _{x_{T-1}}&E[U(W_{T})]&\\{\text{subject to}}&W_{T}&=&\sum _{i=1}^{n}\xi _{iT}x_{i,T-1}\\&\sum _{i=1}^{n}x_{i,T-1}&=&W_{T-1}\\&x_{T-1}&\geq &0\end{array}}

そして、最適値は $Q_{t}(W_{t})$

{\begin{array}{lrclr}\max \limits _{x_{t}}&E[Q_{t+1}(W_{t+1})]&\\{\text{subject to}}&W_{t+1}&=&\sum _{i=1}^{n}\xi _{i,t+1}x_{i,t}\\&\sum _{i=1}^{n}x_{i,t}&=&W_{t}\\&x_{t}&\geq &0\end{array}}

のために。 $t=T-2,\dots ,1$

ソフトウェアツール

モデリング言語

離散確率計画問題はすべて、任意の代数モデリング言語で表現できます。明示的または暗黙的な非予測性を手動で実装することで、結果のモデルが各段階で利用可能な情報の構造を尊重するようにします。一般的なモデリング言語によって生成されるSP問題のインスタンスは、（シナリオ数に比例して）非常に大きくなる傾向があり、その行列はこのクラスの問題に固有の構造を失います。この構造は、本来であれば特定の分解アルゴリズムによって解を求める際に活用できるものです。SP向けに特別に設計されたモデリング言語の拡張機能が登場し始めています。以下を参照してください。

AIMMS – SP問題の定義をサポート
EMP SP (確率的計画のための拡張数理計画法) –確率的計画法を容易にするために作成されたGAMSのモジュール (パラメトリック分布、確率制約、およびリスク値や期待不足などのリスク測定のキーワードが含まれています)。
SAMPL – 確率的プログラムを表現するために特別に設計された AMPLの拡張機能のセット（確率制約、統合確率制約、ロバスト最適化問題の構文を含む）

どちらも、問題の構造を冗長性のない形式でソルバーに伝える SMPS インスタンスレベル形式を生成できます。

参照

参考文献

^ Shapiro, Alexander; Dentcheva, Darinka ; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF) . MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics and the Mathematical Programming Society. pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798. オリジナル（PDF）から2020年3月24日にアーカイブ。2010年9月22日閲覧。
^ Birge, John R.; Louveaux, François (2011). 確率計画法入門. Springer Series in Operations Research and Financial Engineering. doi :10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.
^ Stein W. Wallace、William T. Ziemba（編）.確率的計画法の応用. MPS-SIAM最適化ブックシリーズ5、2005年。
^ 確率的計画法の応用については、次の Web サイト Stochastic Programming Community で説明されています。
^ Shapiro, Alexander; Philpott, Andy. 確率的計画法のチュートリアル(PDF) .
^ 「最適化のためのNEOSサーバー」。
^ Ruszczyński, Andrzej ; Shapiro, Alexander (2003).確率的計画法. オペレーションズ・リサーチとマネジメント・サイエンスのハンドブック. 第10巻. フィラデルフィア: Elsevier . p. 700. ISBN 978-0444508546。
^ Mangel, M. & Clark, CW 1988.行動生態学における動的モデリング.プリンストン大学出版局ISBN 0-691-08506-4
^ Houston, A. I & McNamara, JM 1999.適応行動モデル：状態に基づくアプローチケンブリッジ大学出版局ISBN 0-521-65539-0
^ Howitt, R., Msangi, S., Reynaud, A, K. Knapp. 2002. 「多項式近似を用いた確率的動的計画問題の解決：あるいはSDPへの「ベティ・クロッカー」アプローチ」カリフォルニア大学デービス校、農業資源経済学部ワーキングペーパー。

さらに読む

John R. Birge、François V. Louveaux著『確率計画法入門』Springer Verlag、ニューヨーク、1997年。
カール、ピーター; ウォレス、スタイン W. (1994). 確率的計画法. Wiley-Interscience Series in Systems and Optimization. チチェスター: John Wiley & Sons, Ltd. pp. xii+307. ISBN 0-471-95158-7. MR 1315300。
G. Ch. Pflug：「確率モデルの最適化。シミュレーションと最適化のインターフェース」 Kluwer、ドルドレヒト、1996年。
アンドラス・プレコパ確率的プログラミング。 Kluwer Academic Publishers、ドルドレヒト、1995 年。
Andrzej Ruszczynski、Alexander Shapiro（編）（2003）確率的計画法、オペレーションズ・リサーチ・アンド・マネジメント・サイエンス・ハンドブック、第10巻、Elsevier。
Shapiro, Alexander; Dentcheva, Darinka ; Ruszczyński, Andrzej (2009). 確率計画法に関する講義：モデリングと理論(PDF) . MPS/SIAM最適化シリーズ第9巻. ペンシルベニア州フィラデルフィア: Society for Industrial and Applied Mathematics and the Mathematical Programming Society. pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798. オリジナル（PDF）から2020年3月24日にアーカイブ。2010年9月22日閲覧。
Stein W. WallaceとWilliam T. Ziemba（編）（2005）確率的計画法の応用。MPS-SIAM最適化ブックシリーズ5
キング、アラン・J.; ウォレス、スタイン・W. (2012). 確率計画法によるモデリング. シュプリンガー・オペレーションズ・リサーチ・アンド・ファイナンシャル・エンジニアリング・シリーズ. ニューヨーク: シュプリンガー. ISBN 978-0-387-87816-4。

外部リンク

確率的計画法コミュニティホームページ

[1] Shapiro, Alexander; Dentcheva, Darinka ; Ruszczyński, Andrzej (2009). Lectures on stochastic programming: Modeling and theory (PDF) . MPS/SIAM Series on Optimization. Vol. 9. Philadelphia, PA: Society for Industrial and Applied Mathematics and the Mathematical Programming Society. pp. xvi+436. ISBN 978-0-89871-687-0. MR 2562798. オリジナル（PDF）から2020年3月24日にアーカイブ。2010年9月22日閲覧。

[2] Birge, John R.; Louveaux, François (2011). 確率計画法入門. Springer Series in Operations Research and Financial Engineering. doi :10.1007/978-1-4614-0237-4. ISBN 978-1-4614-0236-7. ISSN 1431-8598.

[3] Stein W. Wallace、William T. Ziemba（編）.確率的計画法の応用. MPS-SIAM最適化ブックシリーズ5、2005年。

[4] 確率的計画法の応用については、次の Web サイト Stochastic Programming Community で説明されています。

[5] Shapiro, Alexander; Philpott, Andy. 確率的計画法のチュートリアル(PDF) .

[neos-6] 「最適化のためのNEOSサーバー」。

[7] Ruszczyński, Andrzej ; Shapiro, Alexander (2003).確率的計画法. オペレーションズ・リサーチとマネジメント・サイエンスのハンドブック. 第10巻. フィラデルフィア: Elsevier . p. 700. ISBN 978-0444508546。

[8] Mangel, M. & Clark, CW 1988.行動生態学における動的モデリング.プリンストン大学出版局ISBN 0-691-08506-4

[9] Houston, A. I & McNamara, JM 1999.適応行動モデル：状態に基づくアプローチケンブリッジ大学出版局ISBN 0-521-65539-0

[10] Howitt, R., Msangi, S., Reynaud, A, K. Knapp. 2002. 「多項式近似を用いた確率的動的計画問題の解決：あるいはSDPへの「ベティ・クロッカー」アプローチ」カリフォルニア大学デービス校、農業資源経済学部ワーキングペーパー。