ロジット正規分布

ロジット正規分布
ロジット正規分布
	確率密度関数
	累積分布関数
表記
パラメータ	σ 2 > 0 — 二乗スケール (実数)、; μ ∈ R — 位置
サポート	x ∈ (0, 1)
PDF
CDF
平均	解析的な解決策はない
中央値
モード	解析的な解決策はない
分散	解析的な解決策はない
MGF	解析的な解決策はない

確率論において、ロジット正規分布は、ロジットが正規分布に従うランダム変数の確率分布です。Yが正規分布に従うランダム変数で、tが標準ロジット関数である場合、X = t ( Y )はロジット正規分布に従います。同様に、Xがロジット正規分布に従う場合、Y = logit ( X )= log ( X /(1- X ))は正規分布します。これはロジット正規分布とも呼ばれ、^[1]は多項式ロジット分布を指すことが多いです（例：^[2]^[3]^[4]）。

変数は、0 と 1 で制限され、0 と 1 の値が決して発生しない割合である場合、ロジット正規分布としてモデル化される可能性があります。

キャラクター設定

確率密度関数

ロジット正規分布の確率密度関数 (PDF) は、0 < x < 1 の場合、次のようになります。

f_{X}(x;\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}\,{\frac {1}{x(1-x)}}\,e^{-{\frac {(\operatorname {logit} (x)-\mu )^{2}}{2\sigma ^{2}}}}

ここで、μとσは変数のロジットの平均と標準偏差です(定義により、変数のロジットは正規分布します)。

μの符号を変えることによって得られる密度は対称的で、f(1-x;- μ、σ )に等しくなり、モードは0.5（(0,1)区間の中点）の反対側にシフトします。

μ（ファセット）とσ（色）のさまざまな組み合わせに対するロジット正規分布のPDFのプロット

瞬間

ロジット正規分布のモーメントには解析解は存在しない。モーメントは数値積分によって推定できるが、の値が0と1の端点で密度関数が無限大に発散するような場合には、数値積分は不可能となる。代替案として、ロジット正規分布が正規確率変数の変換であるという観察結果を用いる方法がある。これにより、次の準モンテカルロ推定によって - 番目のモーメントを近似することができる。 ${\textstyle \mu ,\sigma ^{2}}$ $n$ $E[X^{n}]\approx {\frac {1}{K-1}}\sum _{i=1}^{K-1}\left(P\left(\Phi _{\mu ,\sigma ^{2}}^{-1}(i/K)\right)\right)^{n},$

ここで、は標準ロジスティック関数、は平均、分散の正規分布の逆累積分布関数です。のとき、これは平均に対応します。 ${\textstyle P}$ ${\textstyle \Phi _{\mu ,\sigma ^{2}}^{-1}}$ ${\textstyle \mu ,\sigma ^{2}}$ $n=1$

モードまたはモード

密度の微分が 0 に等しい場合、モード x の位置は次の式を満たします。

\operatorname {logit} (x)=\sigma ^{2}(2x-1)+\mu .

パラメータの値によっては 2 つの解が存在する場合があり、分布は二峰性となります。

多変量一般化

ロジスティック正規分布は、多変量正規分布のロジスティック変換を行うことで、ロジット正規分布をD次元確率ベクトルに一般化したものである。^[1]^[5]^[6]

確率密度関数

確率密度関数は次のようになります。

f_{X}(\mathbf {x} ;{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})={\frac {1}{(2\pi )^{D-1}|{\boldsymbol {\Sigma }}|^{\frac {1}{2}}}}\,{\frac {1}{\prod \limits _{i=1}^{D}x_{i}}}\,e^{-{\frac {1}{2}}\left\{\log \left({\frac {\mathbf {x} _{-D}}{x_{D}}}\right)-{\boldsymbol {\mu }}\right\}^{\top }{\boldsymbol {\Sigma }}^{-1}\left\{\log \left({\frac {\mathbf {x} _{-D}}{x_{D}}}\right)-{\boldsymbol {\mu }}\right\}}\quad ,\quad \mathbf {x} \in {\mathcal {S}}^{D}\;\;,

ここで、はの最初の(D-1)個の成分のベクトルを表し、はD次元確率ベクトルの単体を表します。これは、加法ロジスティック変換を適用して多変量正規確率変数を単体に写像することから導かれます。 $\mathbf {x} _{-D}$ $\mathbf {x}$ ${\mathcal {S}}^{D}$ $\mathbf {y} \sim {\mathcal {N}}\left({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}\right)\;,\;\mathbf {y} \in \mathbb {R} ^{D-1}$

\mathbf {x} =\left[{\frac {e^{y_{1}}}{1+\sum _{i=1}^{D-1}e^{y_{i}}}},\dots ,{\frac {e^{y_{D-1}}}{1+\sum _{i=1}^{D-1}e^{y_{i}}}},{\frac {1}{1+\sum _{i=1}^{D-1}e^{y_{i}}}}\right]^{\top }

一意の逆マッピングは次のように与えられます。

\mathbf {y} =\left[\log \left({\frac {x_{1}}{x_{D}}}\right),\dots ,\log \left({\frac {x_{D-1}}{x_{D}}}\right)\right]^{\top }

。

これは、ベクトルxの要素の和が1になる場合である。シグモイド要素を持つxの場合、つまり

\mathbf {y} =\left[\log \left({\frac {x_{1}}{1-x_{1}}}\right),\dots ,\log \left({\frac {x_{D}}{1-x_{D}}}\right)\right]^{\top }

我々は持っています

f_{X}(\mathbf {x} ;{\boldsymbol {\mu }},{\boldsymbol {\Sigma }})={\frac {1}{(2\pi )^{D-1}|{\boldsymbol {\Sigma }}|^{\frac {1}{2}}}}\,{\frac {1}{\prod \limits _{i=1}^{D}\left(x_{i}(1-x_{i})\right)}}\,e^{-{\frac {1}{2}}\left\{\log \left({\frac {\mathbf {x} }{1-\mathbf {x} }}\right)-{\boldsymbol {\mu }}\right\}^{\top }{\boldsymbol {\Sigma }}^{-1}\left\{\log \left({\frac {\mathbf {x} }{1-\mathbf {x} }}\right)-{\boldsymbol {\mu }}\right\}}

ここで、対数と引数の除算は要素ごとに行われます。これは、変換のヤコビ行列が要素を持つ対角行列であるためです。 ${\frac {1}{x_{i}(1-x_{i})}}$

統計分析での使用

ロジスティック正規分布は、確率ベクトルの成分間の相関関係を捉えることができるという点で、ディリクレ分布よりも柔軟な代替分布です。また、データベクトルの成分の対数比に関する質問に答えることができるため、構成データの統計解析を簡素化する可能性も秘めています。多くの場合、成分の絶対値よりも比率が重要になります。

確率単体は有界空間であるため、のベクトルに一般的に適用される標準的な手法はあまり意味を持ちません。統計学者ジョン・エイチソンは、そのような手法を単体ベクトルに直接適用した場合に生じる偽の負の相関の問題を説明しました。^[5]しかし、の成分データを加法ロジスティック変換の逆変換で写像すると、の実数値データが得られます。このデータ表現には標準的な手法を適用できます。このアプローチは、ロジスティック正規分布の使用を正当化するものであり、したがって「単体のガウス分布」と見なすことができます。 $\mathbb {R} ^{n}$ ${\mathcal {S}}^{D}$ $\mathbb {R} ^{D-1}$

ディリクレ分布との関係

ディリクレ分布とロジスティック正規分布は、どのようなパラメータを選択しても、完全に一致することはありません。しかし、Aitchisonは、カルバック・ライブラー距離（KL）を最小化するようにディリクレ分布をロジスティック正規分布で近似する方法を示しました。

K(p,q)=\int _{{\mathcal {S}}^{D}}p\left(\mathbf {x} \mid {\boldsymbol {\alpha }}\right)\log \left({\frac {p\left(\mathbf {x} \mid {\boldsymbol {\alpha }}\right)}{q\left(\mathbf {x} \mid {\boldsymbol {\mu }},{\boldsymbol {\Sigma }}\right)}}\right)\,d\mathbf {x}

これは次のように最小限に抑えられます。

{\boldsymbol {\mu }}^{*}=\mathbf {E} _{p}\left[\log \left({\frac {\mathbf {x} _{-D}}{x_{D}}}\right)\right]\quad ,\quad {\boldsymbol {\Sigma }}^{*}={\textbf {Var}}_{p}\left[\log \left({\frac {\mathbf {x} _{-D}}{x_{D}}}\right)\right]

ディリクレ分布のモーメント特性を用いると、解はディガンマ関数とトリガンマ関数で表すことができる。 $\psi$ $\psi '$

\mu _{i}^{*}=\psi \left(\alpha _{i}\right)-\psi \left(\alpha _{D}\right)\quad ,\quad i=1,\ldots ,D-1

\Sigma _{ii}^{*}=\psi '\left(\alpha _{i}\right)+\psi '\left(\alpha _{D}\right)\quad ,\quad i=1,\ldots ,D-1

\Sigma _{ij}^{*}=\psi '\left(\alpha _{D}\right)\quad ,\quad i\neq j

この近似は、が大きい場合に特に正確です。実際、に対してであることが示せ、が成り立ちます。 ${\boldsymbol {\alpha }}$ $\alpha _{i}\rightarrow \infty ,i=1,\ldots ,D$ $p\left(\mathbf {x} \mid {\boldsymbol {\alpha }}\right)\rightarrow q\left(\mathbf {x} \mid {\boldsymbol {\mu }}^{*},{\boldsymbol {\Sigma }}^{*}\right)$

参照

ベータ分布とクマラスワミ分布、類似した形状を持つ有界区間上の他の2パラメータ分布

参考文献

^ ab Aitchison, J.; Shen, SM (1980). 「ロジスティック正規分布：いくつかの特性と用途」. Biometrika . 67 (2): 261. doi :10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.
^ Huang, Jonathan; Tomasz, Malisiewicz. 「階層的ロジスティック正規分布のフィッティング」（PDF） .
^ ピーター・ホフ、2003年。リンク
^ 「対数正規分布とロジスティック正規分布の用語 - AIと社会科学 - ブレンダン・オコナー」brenocon.com . 2018年4月18日閲覧。
^ J. アッチソン著「構成データの統計分析」統計と応用確率に関するモノグラフ、チャップマン＆ホール、1986年。
^ Hinde, John (2011). 「ロジスティック正規分布」. Lovric, Miodrag (編).国際統計科学百科事典. Springer. pp. 754– 755. doi :10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5。

さらに読む

Frederic, P. & Lad, F. (2008) ロジット正規分布の二つのモーメント. Communications in Statistics-Simulation and Computation . 37: 1263-1269
Mead, R. (1965). 「一般化ロジット正規分布」.バイオメトリクス. 21 (3): 721– 732. doi :10.2307/2528553. JSTOR 2528553. PMID 5858101.

外部リンク

R用のlogitnormパッケージ

[AitchisonShen1980-1] Aitchison, J.; Shen, SM (1980). 「ロジスティック正規分布：いくつかの特性と用途」. Biometrika . 67 (2): 261. doi :10.2307/2335470. ISSN 0006-3444. JSTOR 2335470.

[2] Huang, Jonathan; Tomasz, Malisiewicz. 「階層的ロジスティック正規分布のフィッティング」（PDF） .

[3] ピーター・ホフ、2003年。リンク

[4] 「対数正規分布とロジスティック正規分布の用語 - AIと社会科学 - ブレンダン・オコナー」brenocon.com . 2018年4月18日閲覧。

[stat_anal_comp_data-5] J. アッチソン著「構成データの統計分析」統計と応用確率に関するモノグラフ、チャップマン＆ホール、1986年。

[CometsRosalsky2011-6] Hinde, John (2011). 「ロジスティック正規分布」. Lovric, Miodrag (編).国際統計科学百科事典. Springer. pp. 754– 755. doi :10.1007/978-3-642-04898-2_342. ISBN 978-3-642-04897-5。