指数分布

指数関数
指数関数
	確率密度関数
	累積分布関数
パラメータ	レート、または逆スケール
サポート
PDF
CDF
四分位数
平均
中央値
モード
分散
歪度
過剰尖度
エントロピ
MGF
CF
フィッシャー情報
カルバック・ライブラー距離
予想される不足額

確率論と統計学において、指数分布または負の指数分布は、ポアソン点過程、すなわち、事象が一定の平均率で連続的かつ独立して発生する過程における事象間の距離の確率分布である。距離パラメータは、製造エラー間の時間や織物製造過程における織物ロールに沿った長さなど、過程の意味のある一次元尺度であればよい。^[1]これはガンマ分布の特殊なケースである。これは幾何分布の連続的な類似体であり、記憶がないという重要な特性を持つ。^[2]ポアソン点過程の解析に使用されることに加えて、他のさまざまな文脈でも見られる。^[3]

指数分布は、分布の指数族のクラスとは異なります。これは、指数分布をそのメンバーの一つとして含む確率分布の大きなクラスですが、正規分布、二項分布、ガンマ分布、ポアソン分布など、他の多くの分布も含みます。^[3]

定義

確率密度関数

指数分布の確率密度関数（pdf ）は

f(x;\lambda )={\begin{cases}\lambda e^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

ここでλ > 0 は分布のパラメータであり、しばしば速度パラメータと呼ばれます。この分布は区間 $[0, \infty)$ でサポートされます。確率変数 Xがこの分布に従う場合、 $X ~ Exp(λ)$ と書きます。

指数分布は無限に割り切れる性質を示す。

累積分布関数

累積分布関数は次のように与えられる。

F(x;\lambda )={\begin{cases}1-e^{-\lambda x}&x\geq 0,\\0&x<0.\end{cases}}

代替パラメータ化

指数分布は、尺度パラメータ $β = 1/ λ$ （平均でもある）でパラメータ化されることがあります。 $f(x;\beta )={\begin{cases}{\frac {1}{\beta }}e^{-x/\beta }&x\geq 0,\\0&x<0.\end{cases}}\qquad \qquad F(x;\beta )={\begin{cases}1-e^{-x/\beta }&x\geq 0,\\0&x<0.\end{cases}}$

プロパティ

平均、分散、モーメント、中央値

指数分布に従う確率変数Xの平均または期待値は、速度パラメータλで与えられ、 $\operatorname {E} [X]={\frac {1}{\lambda }}.$

以下の例に照らし合わせると、これは理にかなっています。1 時間あたり平均 2 回の電話を受ける人は、連続した電話の間隔が 0.5 時間、つまり 30 分になると予想できます。

Xの分散はで与えられるため、標準偏差は平均と等しくなります。 $\operatorname {Var} [X]={\frac {1}{\lambda ^{2}}},$

Xのモーメントは次のように与えられる。 $n\in \mathbb {N}$ $\operatorname {E} \left[X^{n}\right]={\frac {n!}{\lambda ^{n}}}.$

Xの中心モーメントは次のように与えられる。ここで、! nはnのサブファクタリングである。 $n\in \mathbb {N}$ $\mu _{n}={\frac {!n}{\lambda ^{n}}}={\frac {n!}{\lambda ^{n}}}\sum _{k=0}^{n}{\frac {(-1)^{k}}{k!}}.$

Xの中央値は次のように与えられます。ここで $lnは$ 自然対数を表します。したがって、平均値と中央値の絶対差は $\operatorname {m} [X]={\frac {\ln(2)}{\lambda }}<\operatorname {E} [X],$ $\left|\operatorname {E} \left[X\right]-\operatorname {m} \left[X\right]\right|={\frac {1-\ln(2)}{\lambda }}<{\frac {1}{\lambda }}=\operatorname {\sigma } [X],$

中央値-平均値不等式に従って。

指数確率変数の無記憶性

指数分布に従う確率変数Tは次の関係に従う。 $\Pr \left(T>s+t\mid T>s\right)=\Pr(T>t),\qquad \forall s,t\geq 0.$

これは、相補累積分布関数を考慮するとわかります。 ${\begin{aligned}\Pr \left(T>s+t\mid T>s\right)&={\frac {\Pr \left(T>s+t\cap T>s\right)}{\Pr \left(T>s\right)}}\\[4pt]&={\frac {\Pr \left(T>s+t\right)}{\Pr \left(T>s\right)}}\\[4pt]&={\frac {e^{-\lambda (s+t)}}{e^{-\lambda s}}}\\[4pt]&=e^{-\lambda t}\\[4pt]&=\Pr(T>t).\end{aligned}}$

T をある初期時刻に対するイベント発生の待機時間として解釈する場合、この関係は、 T が初期時間sにわたってイベントを観測できないことを条件としている場合、残りの待機時間の分布は元の無条件分布と同じになることを意味します。例えば、イベントが30秒経過しても発生していない場合、発生までに少なくとも10秒かかる条件付き確率は、イベントが初期時刻から10秒以上経過した後に観測される無条件確率に等しくなります。

指数分布と幾何分布は、記憶のない唯一の確率分布です。

したがって、指数分布は必然的に、一定の故障率を持つ唯一の連続確率分布でもあります。

四分位数

Exp( λ )の分位関数（逆累積分布関数）は $F^{-1}(p;\lambda )={\frac {-\ln(1-p)}{\lambda }},\qquad 0\leq p<1$

したがって、四分位数は次のようになります。

第一四分位数: ln(4/3)/ λ
中央値：ln(2)/ λ
第三四分位数: ln(4)/ λ

その結果、四分位範囲はln(3)/ λとなる。

条件付きリスク値（期待不足額）

Exp( λ )の期待不足額または超分位値としても知られる条件付きリスク値（CVaR）は次のように導出される：^[4]

${\begin{aligned}{\bar {q}}_{\alpha }(X)&={\frac {1}{1-\alpha }}\int _{\alpha }^{1}q_{p}(X)dp\\&={\frac {1}{(1-\alpha )}}\int _{\alpha }^{1}{\frac {-\ln(1-p)}{\lambda }}dp\\&={\frac {-1}{\lambda (1-\alpha )}}\int _{1-\alpha }^{0}-\ln(y)dy\\&={\frac {-1}{\lambda (1-\alpha )}}\int _{0}^{1-\alpha }\ln(y)dy\\&={\frac {-1}{\lambda (1-\alpha )}}[(1-\alpha )\ln(1-\alpha )-(1-\alpha )]\\&={\frac {-\ln(1-\alpha )+1}{\lambda }}\\\end{aligned}}$

緩衝超過確率（bPOE）

緩衝超過確率は、CVaRが閾値と等しくなる確率レベルから1を引いた値である。これは以下のように導出される。^[4] $x$

${\begin{aligned}{\bar {p}}_{x}(X)&=\{1-\alpha |{\bar {q}}_{\alpha }(X)=x\}\\&=\{1-\alpha |{\frac {-\ln(1-\alpha )+1}{\lambda }}=x\}\\&=\{1-\alpha |\ln(1-\alpha )=1-\lambda x\}\\&=\{1-\alpha |e^{\ln(1-\alpha )}=e^{1-\lambda x}\}=\{1-\alpha |1-\alpha =e^{1-\lambda x}\}=e^{1-\lambda x}\end{aligned}}$

カルバック・ライブラー距離

（「近似」分布）と（「真の」分布）のNATSにおける有向カルバック・ライブラー分布は次のように与えられる。 $e^{\lambda }$ $e^{\lambda _{0}}$ ${\begin{aligned}\Delta (\lambda _{0}\parallel \lambda )&=\mathbb {E} _{\lambda _{0}}\left(\log {\frac {p_{\lambda _{0}}(x)}{p_{\lambda }(x)}}\right)\\&=\mathbb {E} _{\lambda _{0}}\left(\log {\frac {\lambda _{0}e^{\lambda _{0}x}}{\lambda e^{\lambda x}}}\right)\\&=\log(\lambda _{0})-\log(\lambda )-(\lambda _{0}-\lambda )E_{\lambda _{0}}(x)\\&=\log(\lambda _{0})-\log(\lambda )+{\frac {\lambda }{\lambda _{0}}}-1.\end{aligned}}$

最大エントロピー分布

支持 $[0, \infty)$ と平均μを持つすべての連続確率分布の中で、 λ = 1/ μの指数分布は最大の微分エントロピーを持つ。言い換えれば、これは、ゼロ以上の確率変量Xに対して、E[ X ]が固定されたときの最大エントロピー確率分布である。^[5]

指数確率変数の最小値の分布

X ₁ , ..., X _{n を}、それぞれ速度パラメータλ ₁ , ..., λ _nを持つ独立した指数分布に従う確率変数とする。この場合、もまた指数分布に従う。 $\min \left\{X_{1},\dotsc ,X_{n}\right\}$ $\lambda =\lambda _{1}+\dotsb +\lambda _{n}.$

これは、相補累積分布関数を考慮するとわかります。 ${\begin{aligned}&\Pr \left(\min\{X_{1},\dotsc ,X_{n}\}>x\right)\\={}&\Pr \left(X_{1}>x,\dotsc ,X_{n}>x\right)\\={}&\prod _{i=1}^{n}\Pr \left(X_{i}>x\right)\\={}&\prod _{i=1}^{n}\exp \left(-x\lambda _{i}\right)=\exp \left(-x\sum _{i=1}^{n}\lambda _{i}\right).\end{aligned}}$

最小値を達成する変数のインデックスは、カテゴリ分布に従って分布する。 $\Pr \left(X_{k}=\min\{X_{1},\dotsc ,X_{n}\}\right)={\frac {\lambda _{k}}{\lambda _{1}+\dotsb +\lambda _{n}}}.$

証明はとすればわかる。すると、 $I=\operatorname {argmin} _{i\in \{1,\dotsb ,n\}}\{X_{1},\dotsc ,X_{n}\}$ ${\begin{aligned}\Pr(I=k)&=\int _{0}^{\infty }\Pr(X_{k}=x)\Pr(\forall _{i\neq k}X_{i}>x)\,dx\\&=\int _{0}^{\infty }\lambda _{k}e^{-\lambda _{k}x}\left(\prod _{i=1,i\neq k}^{n}e^{-\lambda _{i}x}\right)dx\\&=\lambda _{k}\int _{0}^{\infty }e^{-\left(\lambda _{1}+\dotsb +\lambda _{n}\right)x}dx\\&={\frac {\lambda _{k}}{\lambda _{1}+\dotsb +\lambda _{n}}}.\end{aligned}}$

X ₁ , ..., X _{n が}すべてパラメータ0を持たない場合、指数分布ではないことに注意してください。 ^[6] $\max\{X_{1},\dotsc ,X_{n}\}$

IID指数順序統計量の結合モーメント

を独立かつ同一分布する指数確率変数とし、速度パラメータλとする。対応する順序統計量をとする。の場合、順序統計量との結合モーメントは次のように与えられる。 $X_{1},\dotsc ,X_{n}$ $n$ $X_{(1)},\dotsc ,X_{(n)}$ $i<j$ $\operatorname {E} \left[X_{(i)}X_{(j)}\right]$ $X_{(i)}$ $X_{(j)}$ ${\begin{aligned}\operatorname {E} \left[X_{(i)}X_{(j)}\right]&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\operatorname {E} \left[X_{(i)}\right]+\operatorname {E} \left[X_{(i)}^{2}\right]\\&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\sum _{k=0}^{i-1}{\frac {1}{(n-k)\lambda }}+\sum _{k=0}^{i-1}{\frac {1}{((n-k)\lambda )^{2}}}+\left(\sum _{k=0}^{i-1}{\frac {1}{(n-k)\lambda }}\right)^{2}.\end{aligned}}$

これは、総期待値の法則と記憶なしの性質を適用することで確認できます。 ${\begin{aligned}\operatorname {E} \left[X_{(i)}X_{(j)}\right]&=\int _{0}^{\infty }\operatorname {E} \left[X_{(i)}X_{(j)}\mid X_{(i)}=x\right]f_{X_{(i)}}(x)\,dx\\&=\int _{x=0}^{\infty }x\operatorname {E} \left[X_{(j)}\mid X_{(j)}\geq x\right]f_{X_{(i)}}(x)\,dx&&\left({\textrm {since}}~X_{(i)}=x\implies X_{(j)}\geq x\right)\\&=\int _{x=0}^{\infty }x\left[\operatorname {E} \left[X_{(j)}\right]+x\right]f_{X_{(i)}}(x)\,dx&&\left({\text{by the memoryless property}}\right)\\&=\sum _{k=0}^{j-1}{\frac {1}{(n-k)\lambda }}\operatorname {E} \left[X_{(i)}\right]+\operatorname {E} \left[X_{(i)}^{2}\right].\end{aligned}}$

最初の式は、全期待値の法則から導かれます。2番目の式は、を条件とするとが必ず成り立つという事実を利用しています。3番目の式は、をに置き換えるために、無記憶性を利用しています。 $X_{(i)}=x$ $X_{(j)}\geq x$ $\operatorname {E} \left[X_{(j)}\mid X_{(j)}\geq x\right]$ $\operatorname {E} \left[X_{(j)}\right]+x$

2つの独立した指数確率変数の合計

2つの独立した確率変数の和の確率分布関数（PDF）は、それぞれのPDFの畳み込みです。とがそれぞれ速度パラメータを持つ独立した指数確率変数である場合、の確率密度は次のように与えられます。この分布のエントロピーは閉じた形で得られます。（一般性を失うことなく）と仮定すると、次のようになります。ここで、はオイラー・マスケロニ定数、はディガンマ関数です。^[7] $X_{1}$ $X_{2}$ $\lambda _{1}$ $\lambda _{2},$ $Z=X_{1}+X_{2}$ ${\begin{aligned}f_{Z}(z)&=\int _{-\infty }^{\infty }f_{X_{1}}(x_{1})f_{X_{2}}(z-x_{1})\,dx_{1}\\&=\int _{0}^{z}\lambda _{1}e^{-\lambda _{1}x_{1}}\lambda _{2}e^{-\lambda _{2}(z-x_{1})}\,dx_{1}\\&=\lambda _{1}\lambda _{2}e^{-\lambda _{2}z}\int _{0}^{z}e^{(\lambda _{2}-\lambda _{1})x_{1}}\,dx_{1}\\&={\begin{cases}{\dfrac {\lambda _{1}\lambda _{2}}{\lambda _{2}-\lambda _{1}}}\left(e^{-\lambda _{1}z}-e^{-\lambda _{2}z}\right)&{\text{ if }}\lambda _{1}\neq \lambda _{2}\\[4pt]\lambda ^{2}ze^{-\lambda z}&{\text{ if }}\lambda _{1}=\lambda _{2}=\lambda .\end{cases}}\end{aligned}}$ $\lambda _{1}>\lambda _{2}$ ${\begin{aligned}H(Z)&=1+\gamma +\ln \left({\frac {\lambda _{1}-\lambda _{2}}{\lambda _{1}\lambda _{2}}}\right)+\psi \left({\frac {\lambda _{1}}{\lambda _{1}-\lambda _{2}}}\right),\end{aligned}}$ $\gamma$ $\psi (\cdot )$

等レートパラメータの場合、結果は形状 2 でパラメータを持つアーラン分布となり、これはガンマ分布の特殊なケースになります。 $\lambda ,$

n個の独立したExp( λ)指数確率変数の合計はGamma(n, λ)分布に従います。

統計的推論

以下では、確率変数Xが速度パラメータ λ で指数分布し、Xからn 個の独立したサンプルがあり、サンプル平均がであると仮定します。 $x_{1},\dotsc ,x_{n}$ ${\bar {x}}$

パラメータ推定

λ の最大尤度推定値は次のように構築されます。

変数から抽出された独立かつ同一に分布するサンプルx = ( x ₁ , ..., x _n )が与えられた場合のλの尤度関数は次のようになります。 $L(\lambda )=\prod _{i=1}^{n}\lambda \exp(-\lambda x_{i})=\lambda ^{n}\exp \left(-\lambda \sum _{i=1}^{n}x_{i}\right)=\lambda ^{n}\exp \left(-\lambda n{\overline {x}}\right),$

ここで:はサンプル平均です。 ${\overline {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}$

尤度関数の対数の導関数は次のようになります。 ${\frac {d}{d\lambda }}\ln L(\lambda )={\frac {d}{d\lambda }}\left(n\ln \lambda -\lambda n{\overline {x}}\right)={\frac {n}{\lambda }}-n{\overline {x}}\ {\begin{cases}>0,&0<\lambda <{\frac {1}{\overline {x}}},\\[8pt]=0,&\lambda ={\frac {1}{\overline {x}}},\\[8pt]<0,&\lambda >{\frac {1}{\overline {x}}}.\end{cases}}$

したがって、レートパラメータの最大尤度推定値は次のようになります。 ${\widehat {\lambda }}_{\text{mle}}={\frac {1}{\overline {x}}}={\frac {n}{\sum _{i}x_{i}}}$

これはの不偏推定値ではないが、および分布平均の不偏^[10] MLE ^{[11]推定値}である。 $\lambda ,$ ${\overline {x}}$ $1/\lambda$

のバイアスはに等しく、バイアス補正された最大尤度推定値を与える。 ${\widehat {\lambda }}_{\text{mle}}$ $B\equiv \operatorname {E} \left[\left({\widehat {\lambda }}_{\text{mle}}-\lambda \right)\right]={\frac {\lambda }{n-1}}$ ${\widehat {\lambda }}_{\text{mle}}^{*}={\widehat {\lambda }}_{\text{mle}}-B.$

平均二乗誤差（バイアスと分散のトレードオフも参照）のおおよその最小値は、サンプルサイズが2より大きいと仮定し、MLEに補正係数をかけて求めることができる。これは逆ガンマ分布の平均と分散から導かれる。^[12] ${\widehat {\lambda }}=\left({\frac {n-2}{n}}\right)\left({\frac {1}{\bar {x}}}\right)={\frac {n-2}{\sum _{i}x_{i}}}$ ${\textstyle {\mbox{Inv-Gamma}}(n,\lambda )}$

フィッシャー情報

速度パラメータの推定値に対するフィッシャー情報量（）は次のように与えられます。 ${\mathcal {I}}(\lambda )$ $\lambda$ ${\mathcal {I}}(\lambda )=\operatorname {E} \left[\left.\left({\frac {\partial }{\partial \lambda }}\log f(x;\lambda )\right)^{2}\right|\lambda \right]=\int \left({\frac {\partial }{\partial \lambda }}\log f(x;\lambda )\right)^{2}f(x;\lambda )\,dx$

分布を入力して解くと次のようになります。 ${\mathcal {I}}(\lambda )=\int _{0}^{\infty }\left({\frac {\partial }{\partial \lambda }}\log \lambda e^{-\lambda x}\right)^{2}\lambda e^{-\lambda x}\,dx=\int _{0}^{\infty }\left({\frac {1}{\lambda }}-x\right)^{2}\lambda e^{-\lambda x}\,dx=\lambda ^{-2}.$

これは、指数分布の各独立サンプルが未知の速度パラメータについて持つ情報量を決定します。 $\lambda$

信頼区間

指数分布の速度パラメータの正確な100(1 − α)%信頼区間は次式で与えられる: ^[13]これは次式にも等しく、 $χ$ ${\frac {2n}{{\widehat {\lambda }}_{\textrm {mle}}\chi _{{\frac {\alpha }{2}},2n}^{2}}}<{\frac {1}{\lambda }}<{\frac {2n}{{\widehat {\lambda }}_{\textrm {mle}}\chi _{1-{\frac {\alpha }{2}},2n}^{2}}}\,,$ ${\frac {2n{\overline {x}}}{\chi _{{\frac {\alpha }{2}},2n}^{2}}}<{\frac {1}{\lambda }}<{\frac {2n{\overline {x}}}{\chi _{1-{\frac {\alpha }{2}},2n}^{2}}}\,,$ $2 p 、 v$ は自由度vのカイ二乗分布の $100(p)$ パーセンタイル、nは観測値の数、xバーは標本平均である。正確な区間の端点への単純な近似は、 $χ$ の正規近似を用いて導出することができる。 $2 p 、 v$ 分布。この近似により、95%信頼区間は次の値になります。 ${\begin{aligned}\lambda _{\text{lower}}&={\widehat {\lambda }}\left(1-{\frac {1.96}{\sqrt {n}}}\right)\\\lambda _{\text{upper}}&={\widehat {\lambda }}\left(1+{\frac {1.96}{\sqrt {n}}}\right)\end{aligned}}$

この近似値は、少なくとも15～20個の元素を含むサンプルには許容できる可能性がある。^[14]

共役事前分布を用いたベイズ推論

指数分布の共役事前分布はガンマ分布です（指数分布はその特殊ケースです）。ガンマ確率密度関数の以下のパラメータ化は有用です。

$\operatorname {Gamma} (\lambda ;\alpha ,\beta )={\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\lambda ^{\alpha -1}\exp(-\lambda \beta ).$

事後分布 pは、上で定義した尤度関数とガンマ事前分布を使って次のように表すことができます。

${\begin{aligned}p(\lambda )&\propto L(\lambda )\Gamma (\lambda ;\alpha ,\beta )\\&=\lambda ^{n}\exp \left(-\lambda n{\overline {x}}\right){\frac {\beta ^{\alpha }}{\Gamma (\alpha )}}\lambda ^{\alpha -1}\exp(-\lambda \beta )\\&\propto \lambda ^{(\alpha +n)-1}\exp(-\lambda \left(\beta +n{\overline {x}}\right)).\end{aligned}}$

事後密度p は、欠落している正規化定数を除いて指定されました。これはガンマ確率密度関数の形をしているので、簡単に埋めることができ、以下の式が得られます。

$p(\lambda )=\operatorname {Gamma} (\lambda ;\alpha +n,\beta +n{\overline {x}}).$

ここで、ハイパーパラメータ αは事前観測値の数、βは事前観測値の合計として解釈できます。ここでの事後平均は以下です。 ${\frac {\alpha +n}{\beta +n{\overline {x}}}}.$

較正事前分布を用いたベイズ推論

指数分布は、群構造を持つ統計分布の一つである。群構造の結果として、指数分布にはハール測度が関連付けられる。これは、ベイズ予測においてハール測度を事前分布（ハール事前分布として知られる）として使用すると、任意の真のパラメータ値に対して完全に較正された確率が得られる。 ^[15]^[16]^[17]完全に較正された確率は、予測される確率がサンプル外イベントの頻度と正確に一致するという性質を持つ。指数分布の場合、ハール事前分布を用いて生成されたベイズ予測の正確な式が次式で与えられる。 $1/\lambda .$

$p_{\rm {Haar-prior}}(x_{n+1}\mid x_{1},\ldots ,x_{n})={\frac {n^{n+1}\left({\overline {x}}\right)^{n}}{\left(n{\overline {x}}+x_{n+1}\right)^{n+1}}}.$

これは事前予測の較正の例であり、事前予測は較正を改善する（そしてこの場合は較正を完璧にする）ように選択される。Haar事前分布を用いた指数関数の事前予測の較正は、Rソフトウェアパッケージfitdistcp[1]に実装されている。

以下の予測セクションで説明するように、他のさまざまな観点からも同じ予測を導き出すことができます。

発生と応用

イベントの発生

指数分布は、均質なポアソン過程における到着間隔の長さを記述するときに自然に発生します。

指数分布は、離散過程の状態変化に必要なベルヌーイ試行回数を表す幾何分布の連続版と見なすことができます。これに対し、指数分布は連続過程の状態変化にかかる時間を表します。

現実世界のシナリオでは、一定率（または単位時間あたりの確率）という仮定が満たされることはほとんどありません。例えば、電話の着信率は時間帯によって異なります。しかし、平日の午後2時から4時のように、着信率がほぼ一定である時間帯に焦点を当てると、指数分布は次の電話がかかってくるまでの時間の近似モデルとして適しています。同様の注意事項は、近似的に指数分布に従う変数を生成する以下の例にも当てはまります。

放射性粒子が崩壊するまでの時間、またはガイガーカウンターのクリック間の時間
1回の電話を受けてから次の電話を受けるまでの時間
縮約形信用リスクモデルにおける債務不履行（企業債権者への支払い）までの時間

指数変数は、 DNA鎖上の変異間の距離や、特定の道路上の轢き殺傷者間の距離など、特定のイベントが単位長さあたり一定の確率で発生する状況をモデル化するためにも使用できます。

待ち行列理論では、システム内のエージェントのサービス時間（例えば、銀行の窓口係などが顧客にサービスを提供するのにかかる時間）は、しばしば指数分布変数としてモデル化されます。（例えば、顧客の到着も、到着が独立しており、かつ同一の分布を示す場合、ポアソン分布によってモデル化されます。）複数の独立したタスクのシーケンスとして考えられるプロセスの長さは、アーラン分布（複数の独立した指数分布変数の合計の分布）に従います。

信頼性理論と信頼性工学においても、指数分布は広く用いられています。この分布はメモリレス特性を持つため、信頼性理論で使用されるバスタブ曲線の一定ハザード率部分をモデル化するのに適しています。また、信頼性モデルに故障率を簡単に追加できるため、非常に便利です。しかし、指数分布は生物や技術機器の寿命全体をモデル化するには適していません。なぜなら、ここでの「故障率」は一定ではないからです。非常に新しいシステムや非常に古いシステムでは、故障が多く発生します。

^{CumFreq [18]}を使用して年間最大1日降雨量に近似した累積指数分布

物理学では、一定の温度と圧力のもとで均一な重力場にある気体を観測すると、様々な分子の高さも近似的に指数分布に従います。これは気圧の公式として知られています。これは、後述するエントロピーの性質によるものです。

水文学では、指数分布は日降水量や河川流量の月間および年間の最大値などの変数の極端な値を分析するために使用されます。^[19]

青い図は、年間最大日降水量の順位付けに指数分布を当てはめた例を示しており、二項分布に基づく90%信頼区間も表示しています。降水量データは、累積頻度分析の一環としてプロットされた位置によって表されています。

手術室管理において、典型的な作業内容がない手術のカテゴリ（すべての種類の手術を網羅する緊急治療室など）の手術時間の分布。

予測

未知の指数分布からn個のデータ点の標本を観測した後、これらの標本を用いて同じ情報源からの将来のデータについて予測を行うのが一般的な課題である。将来の標本に対する一般的な予測分布は、いわゆるプラグイン分布であり、指数密度関数に速度パラメータλの適切な推定値を代入することによって形成される。推定値としては、最大尤度の原理によって与えられるものが一般的に選択され、これを用いることで、観測標本x = ( x ₁ , ..., x _n )を条件とする将来の標本x _{n +1に対する予測密度は以下のように与えられる。} $p_{\rm {ML}}(x_{n+1}\mid x_{1},\ldots ,x_{n})=\left({\frac {1}{\overline {x}}}\right)\exp \left(-{\frac {x_{n+1}}{\overline {x}}}\right).$

ベイズアプローチは、推定パラメータの不確実性を考慮した予測分布を提供しますが、これは事前分布の選択に大きく依存する可能性があります。

主観的ベイズアプローチで生じる事前分布の選択の問題を回避した予測分布は

$p_{\rm {CNML}}(x_{n+1}\mid x_{1},\ldots ,x_{n})={\frac {n^{n+1}\left({\overline {x}}\right)^{n}}{\left(n{\overline {x}}+x_{n+1}\right)^{n+1}}},$

これは次のように考えることができる

頻度主義的信頼分布は、重要な量の分布から得られる。^[20] ${x_{n+1}}/{\overline {x}}$
プロファイル予測尤度は、 x _n₊₁とλの結合尤度からパラメータλを最大化によって除去することによって得られる。^[21]
客観的ベイズ予測事後分布。これは、情報を持たないジェフリーズ事前分布1/ λを用いて得られる。これはこの場合、右ハール事前分布に等しい。右ハール事前分布を用いて生成された予測は、完全に較正された確率を与えることが保証されている。^[22]^[23]
情報理論的考察に基づく条件付き正規化最大尤度（CNML）予測分布。^[24]

予測分布の精度は、真の指数分布（速度パラメータλ ₀）と、標本xに基づく予測分布との間の距離または乖離によって測定できる。カルバック・ライブラー・ダイバージェンスは、 2つの分布間の差を測る、パラメータ化を必要としない一般的な指標である。Δ( λ ₀ || p )を、速度パラメータλ ₀を持つ指数分布と予測分布pとの間のカルバック・ライブラー・ダイバージェンスとすると、次式が成り立つ。

${\begin{aligned}\operatorname {E} _{\lambda _{0}}\left[\Delta (\lambda _{0}\parallel p_{\rm {ML}})\right]&=\psi (n)+{\frac {1}{n-1}}-\log(n)\\\operatorname {E} _{\lambda _{0}}\left[\Delta (\lambda _{0}\parallel p_{\rm {CNML}})\right]&=\psi (n)+{\frac {1}{n}}-\log(n)\end{aligned}}$

ここで、期待値は速度パラメータλ ₀ ∈ (0, ∞)を持つ指数分布に対するものであり、ψ( · )はディガンマ関数である。すべてのサンプルサイズn > 0において、CNML予測分布は平均カルバック・ライブラー・ダイバージェンスに関して最大尤度プラグイン分布よりも明らかに優れていることは明らかである。

ランダム変数生成

指数変量を生成する概念的に非常に単純な方法は、逆変換サンプリングに基づいています。単位区間 $（0, 1）上の$ 一様分布から抽出されたランダム変量Uが与えられた場合、変量

$T=F^{-1}(U)$

指数分布に従う。ここでF ⁻¹は分位関数であり、次のように定義される。

$F^{-1}(p)={\frac {-\ln(1-p)}{\lambda }}.$

さらに、U が(0, 1) 上で一様であれば、 1 − Uも一様です。これは、次のように指数変数を生成できることを意味します。

$T={\frac {-\ln(U)}{\lambda }}.$

指数変数を生成するための他の方法については、Knuth ^[25]と Devroye ^{[26]によって議論されています。}

ソートルーチンを使用せずに、順序付けされた指数変数のセットを高速に生成する方法も利用可能です。^[26]

参照

デッドタイム– 粒子検出器分析への指数分布の応用。
ラプラス分布、または「二重指数分布」。
確率分布間の関係
マーシャル・オルキン指数分布

参考文献

^ “7.2: 指数分布”. Statistics LibreTexts . 2021年7月15日. 2024年10月11日閲覧。
^ 「指数分布 | 数学 | ブリタニカ」www.britannica.com . 2024年10月11日閲覧。
^ ab Weisstein, Eric W. 「指数分布」. mathworld.wolfram.com . 2024年10月11日閲覧。
^ ab Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). 「共通確率分布のCVaRとbPOEの計算とポートフォリオ最適化および密度推定への応用」(PDF) . Annals of Operations Research . 299 ( 1– 2). Springer: 1281– 1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. オリジナル(PDF)から2023年3月31日にアーカイブ。 2023年2月27日閲覧。
^ Park, Sung Y.; Bera, Anil K. (2009). 「最大エントロピー自己回帰条件付き異分散モデル」(PDF) . Journal of Econometrics . 150 (2). Elsevier: 219– 230. doi :10.1016/j.jeconom.2008.12.014. 2016年3月7日時点のオリジナル(PDF)からアーカイブ。 2011年6月2日閲覧。
^ Michael, Lugo. 「指数関数の最大値の期待値」(PDF) 。 2016年12月20日時点のオリジナル(PDF)からアーカイブ。 2016年12月13日閲覧。
^ Eckford, Andrew W.; Thomas, Peter J. (2016). 「2つの独立した非同一分布指数確率変数の和のエントロピー」arXiv : 1609.02911 [cs.IT].
^ abcdefghi Leemis, Lawrence M.; McQuestion, Jacquelyn T. (2008年2月). 「単変量分布関係」(PDF) . The American Statistician . 62 (1): 45-53. doi :10.1198/000313008X270448.
^ イベ、オリバー・C. (2014). 『応用確率過程とランダム過程の基礎』（第2版）. アカデミック・プレス. p. 128. ISBN 9780128010358。
^ リチャード・アーノルド・ジョンソン、ディーン・W・ウィチャーン（2007年）『応用多変量統計分析』ピアソン・プレンティス・ホール、ISBN 978-0-13-187715-3. 2012年8月10日閲覧。
^ NIST/SEMATECH 統計手法の電子ハンドブック
^ Elfessi, Abdulaziz; Reineke, David M. (2001). 「ベイズ的アプローチによる古典的推定：指数分布」. Journal of Statistics Education . 9 (1). doi : 10.1080/10691898.2001.11910648 .
^ ロス、シェルドン・M. (2009). エンジニアと科学者のための確率統計入門（第4版）. Associated Press. p. 267. ISBN 978-0-12-370483-2。
^ Guerriero, V. (2012). 「べき乗分布：マルチスケール推論統計法」. Journal of Modern Mathematics Frontier . 1 : 21–28 .
^ Severini, TA (2002-12-01). 「右不変事前分布の正確な確率マッチング特性について」 . Biometrika . 89 (4): 952– 957. doi :10.1093/biomet/89.4.952. ISSN 0006-3444.
^ Gerrard, R.; Tsanakas, A. (2011). 「パラメータの不確実性下における故障確率」 .リスク分析. 31 (5): 727– 744. Bibcode :2011RiskA..31..727G. doi :10.1111/j.1539-6924.2010.01549.x. ISSN 1539-6924. PMID 21175720.
^ ジューソン, スティーブン; スウィーティング, トレバー; ジューソン, リン (2025-02-20). 「事前検定を用いた極端気象リスク評価における信頼性バイアスの低減」.統計気候学、気象学、海洋学の進歩. 11 (1): 1– 22. Bibcode :2025ASCMO..11....1J. doi : 10.5194/ascmo-11-1-2025 . ISSN 2364-3579.
^ 「Cumfreq、累積頻度分析用の無料コンピュータプログラム」。
^ Ritzema, HP編 (1994). 頻度分析と回帰分析. 第6章: 排水の原理と応用, 出版物16, 国際土地改良研究所 (ILRI), ワーゲニンゲン, オランダ. pp. 175–224. ISBN 90-70754-33-9。
^ Lawless, JF; Fredette, M. (2005). 「頻度論的予測区間と予測分布」. Biometrika . 92 (3): 529– 542. doi :10.1093/biomet/92.3.529.
^ Bjornstad, JF (1990). 「予測尤度：レビュー」. Statist. Sci . 5 (2): 242– 254. doi : 10.1214/ss/1177012175 .
^ Severini, Thomas A.; Mukerjee, Rahul; Ghosh, Malay (2002-12-01). 「右不変事前分布の正確な確率マッチング特性について」 . Biometrika . 89 (4): 952– 957. doi :10.1093/biomet/89.4.952. ISSN 0006-3444.
^ ジューソン, スティーブン; スウィーティング, トレバー; ジューソン, リン (2025-02-20). 「事前検定を用いた極端気象リスク評価における信頼性バイアスの低減」.統計気候学、気象学、海洋学の進歩. 11 (1): 1– 22. Bibcode :2025ASCMO..11....1J. doi : 10.5194/ascmo-11-1-2025 . ISSN 2364-3579.
^ DF SchmidtとE. Makalic、「指数分布の普遍モデル」、IEEE Transactions on Information Theory、第55巻、第7号、pp. 3087–3090、2009年doi :10.1109/TIT.2009.2018331
^ ドナルド・E・クヌース(1998).『コンピュータプログラミングの芸術』第2巻：半数値アルゴリズム、第3版. ボストン: アディソン・ウェスレー. ISBN 0-201-89684-23.4.1節、133ページを参照。
^ ab Luc Devroye (1986).非一様乱数変量生成法. ニューヨーク: Springer-Verlag. ISBN 0-387-96305-7第9章第2節、392～401ページを参照。

外部リンク

「指数分布」、数学百科事典、EMSプレス、2001 [1994]
指数分布のオンライン計算機

[1] “7.2: 指数分布”. Statistics LibreTexts . 2021年7月15日. 2024年10月11日閲覧。

[2] 「指数分布 | 数学 | ブリタニカ」www.britannica.com . 2024年10月11日閲覧。

[Weisstein-3] Weisstein, Eric W. 「指数分布」. mathworld.wolfram.com . 2024年10月11日閲覧。

[Norton-2019-4] Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). 「共通確率分布のCVaRとbPOEの計算とポートフォリオ最適化および密度推定への応用」(PDF) . Annals of Operations Research . 299 ( 1– 2). Springer: 1281– 1315. arXiv : 1811.11301 . doi :10.1007/s10479-019-03373-1. オリジナル(PDF)から2023年3月31日にアーカイブ。 2023年2月27日閲覧。

[5] Park, Sung Y.; Bera, Anil K. (2009). 「最大エントロピー自己回帰条件付き異分散モデル」(PDF) . Journal of Econometrics . 150 (2). Elsevier: 219– 230. doi :10.1016/j.jeconom.2008.12.014. 2016年3月7日時点のオリジナル(PDF)からアーカイブ。 2011年6月2日閲覧。

[6] Michael, Lugo. 「指数関数の最大値の期待値」(PDF) 。 2016年12月20日時点のオリジナル(PDF)からアーカイブ。 2016年12月13日閲覧。

[7] Eckford, Andrew W.; Thomas, Peter J. (2016). 「2つの独立した非同一分布指数確率変数の和のエントロピー」arXiv : 1609.02911 [cs.IT].

[Leemis-8] Leemis, Lawrence M.; McQuestion, Jacquelyn T. (2008年2月). 「単変量分布関係」(PDF) . The American Statistician . 62 (1): 45-53. doi :10.1198/000313008X270448.

[9] イベ、オリバー・C. (2014). 『応用確率過程とランダム過程の基礎』（第2版）. アカデミック・プレス. p. 128. ISBN 9780128010358。

[Dean_W._Wichern-2007-10] リチャード・アーノルド・ジョンソン、ディーン・W・ウィチャーン（2007年）『応用多変量統計分析』ピアソン・プレンティス・ホール、ISBN 978-0-13-187715-3. 2012年8月10日閲覧。

[11] NIST/SEMATECH 統計手法の電子ハンドブック

[12] Elfessi, Abdulaziz; Reineke, David M. (2001). 「ベイズ的アプローチによる古典的推定：指数分布」. Journal of Statistics Education . 9 (1). doi : 10.1080/10691898.2001.11910648 .

[13] ロス、シェルドン・M. (2009). エンジニアと科学者のための確率統計入門（第4版）. Associated Press. p. 267. ISBN 978-0-12-370483-2。

[Guerriero-2012-14] Guerriero, V. (2012). 「べき乗分布：マルチスケール推論統計法」. Journal of Modern Mathematics Frontier . 1 : 21–28 .

[15] Severini, TA (2002-12-01). 「右不変事前分布の正確な確率マッチング特性について」 . Biometrika . 89 (4): 952– 957. doi :10.1093/biomet/89.4.952. ISSN 0006-3444.

[16] Gerrard, R.; Tsanakas, A. (2011). 「パラメータの不確実性下における故障確率」 .リスク分析. 31 (5): 727– 744. Bibcode :2011RiskA..31..727G. doi :10.1111/j.1539-6924.2010.01549.x. ISSN 1539-6924. PMID 21175720.

[17] ジューソン, スティーブン; スウィーティング, トレバー; ジューソン, リン (2025-02-20). 「事前検定を用いた極端気象リスク評価における信頼性バイアスの低減」.統計気候学、気象学、海洋学の進歩. 11 (1): 1– 22. Bibcode :2025ASCMO..11....1J. doi : 10.5194/ascmo-11-1-2025 . ISSN 2364-3579.

[18] 「Cumfreq、累積頻度分析用の無料コンピュータプログラム」。

[19] Ritzema, HP編 (1994). 頻度分析と回帰分析. 第6章: 排水の原理と応用, 出版物16, 国際土地改良研究所 (ILRI), ワーゲニンゲン, オランダ. pp. 175–224. ISBN 90-70754-33-9。

[20] Lawless, JF; Fredette, M. (2005). 「頻度論的予測区間と予測分布」. Biometrika . 92 (3): 529– 542. doi :10.1093/biomet/92.3.529.

[21] Bjornstad, JF (1990). 「予測尤度：レビュー」. Statist. Sci . 5 (2): 242– 254. doi : 10.1214/ss/1177012175 .

[22] Severini, Thomas A.; Mukerjee, Rahul; Ghosh, Malay (2002-12-01). 「右不変事前分布の正確な確率マッチング特性について」 . Biometrika . 89 (4): 952– 957. doi :10.1093/biomet/89.4.952. ISSN 0006-3444.

[23] ジューソン, スティーブン; スウィーティング, トレバー; ジューソン, リン (2025-02-20). 「事前検定を用いた極端気象リスク評価における信頼性バイアスの低減」.統計気候学、気象学、海洋学の進歩. 11 (1): 1– 22. Bibcode :2025ASCMO..11....1J. doi : 10.5194/ascmo-11-1-2025 . ISSN 2364-3579.

[24] DF SchmidtとE. Makalic、「指数分布の普遍モデル」、IEEE Transactions on Information Theory、第55巻、第7号、pp. 3087–3090、2009年doi :10.1109/TIT.2009.2018331

[25] ドナルド・E・クヌース(1998).『コンピュータプログラミングの芸術』第2巻：半数値アルゴリズム、第3版. ボストン: アディソン・ウェスレー. ISBN 0-201-89684-23.4.1節、133ページを参照。

[Luc_Devroye-26] Luc Devroye (1986).非一様乱数変量生成法. ニューヨーク: Springer-Verlag. ISBN 0-387-96305-7第9章第2節、392～401ページを参照。