Probability distribution
一般 化正規分布 ( GND )または 一般化ガウス分布 ( GGD )は、 実数 直線上の 連続確率分布 の2つの パラメトリック 族のいずれかです。どちらの族も、 正規分布 に 形状パラメータ を加えています。2つの族を区別するために、以下では「対称分布」と「非対称分布」と呼びますが、これは標準的な名称ではありません。
対称バージョン 対称 一般化正規分布は、 指数分布 または 一般化誤差分布 とも呼ばれ、 対称分布 のパラメトリック族です。すべての 正規分布 と ラプラス 分布が含まれ、極限ケースとして、 実数直線上の有界区間上の
すべての 連続一様分布 も含まれます。
この分布族には、 (平均 、分散 ) のときは 正規分布 が含まれ、のときは ラプラス分布 が含まれます。 のとき 、密度は 上の一様密度に 点ごとに収束します 。 β = 2 {\displaystyle \textstyle \beta =2} μ {\displaystyle \textstyle \mu } α 2 2 {\displaystyle \textstyle {\frac {\alpha ^{2}}{2}}} β = 1 {\displaystyle \textstyle \beta =1} β → ∞ {\displaystyle \textstyle \beta \rightarrow \infty } ( μ − α , μ + α ) {\displaystyle \textstyle (\mu -\alpha ,\mu +\alpha )}
この族は、通常よりも重い( の場合 )か、通常よりも軽い( の場合)裾を許容します。これは、 正規密度( )から均一密度( )に至る対称な 扁平 密度の連続体、およびラプラス密度( )から正規密度( )に至る対称な 急尖 密度 の連続体 をパラメータ化する便利な方法です 。形状パラメータは、 裾に加えて、 尖り具合 も制御します。 β < 2 {\displaystyle \beta <2} β > 2 {\displaystyle \beta >2} β = 2 {\displaystyle \textstyle \beta =2} β = ∞ {\displaystyle \textstyle \beta =\infty } β = 1 {\displaystyle \textstyle \beta =1} β = 2 {\displaystyle \textstyle \beta =2} β {\displaystyle \beta }
パラメータ推定 最大尤度法 と モーメント法 によるパラメータ推定が 研究されている [3] 。 推定値は閉じた形を持たず、数値的に求める必要がある。数値計算を必要としない推定量も提案されている [4] 。
一般化正規対数尤度関数は、が正の偶数である 場合にのみ、無限個の連続導関数(すなわち、 滑らかな関数 のクラス C ∞ に属する)を持ちます。それ以外の場合、関数は 連続導関数を持ちます。結果として、 の 最大尤度推定 値の一貫性と漸近正規性に関する標準的な結果は 、 の場合にのみ適用されます 。 β {\displaystyle \textstyle \beta } ⌊ β ⌋ {\displaystyle \textstyle \lfloor \beta \rfloor } β {\displaystyle \beta } β ≥ 2 {\displaystyle \textstyle \beta \geq 2}
最大尤度推定量 一般化正規分布は、近似最大尤度 法を用いて近似的に近似することができる 。 [5] [6] を最初にサンプル第1モーメントに設定する と 、 ニュートン・ラプソン 反復法を用いて 、初期推定値 から推定される 。 μ {\displaystyle \mu } m 1 {\displaystyle m_{1}} β {\displaystyle \textstyle \beta } β = β 0 {\displaystyle \textstyle \beta =\textstyle \beta _{0}}
β 0 = m 1 m 2 , {\displaystyle \beta _{0}={\frac {m_{1}}{\sqrt {m_{2}}}},} どこ
m 1 = 1 N ∑ i = 1 N | x i | , {\displaystyle m_{1}={1 \over N}\sum _{i=1}^{N}|x_{i}|,} は絶対値の 最初の統計 モーメント であり、は2番目の統計 モーメント である。反復は m 2 {\displaystyle m_{2}}
β i + 1 = β i − g ( β i ) g ′ ( β i ) , {\displaystyle \beta _{i+1}=\beta _{i}-{\frac {g(\beta _{i})}{g'(\beta _{i})}},} どこ
g ( β ) = 1 + ψ ( 1 / β ) β − ∑ i = 1 N | x i − μ | β log | x i − μ | ∑ i = 1 N | x i − μ | β + log ( β N ∑ i = 1 N | x i − μ | β ) β , {\displaystyle g(\beta )=1+{\frac {\psi (1/\beta )}{\beta }}-{\frac {\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\log |x_{i}-\mu |}{\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }}}+{\frac {\log({\frac {\beta }{N}}\sum _{i=1}^{N}|x_{i}-\mu |^{\beta })}{\beta }},} そして
g ′ ( β ) = − ψ ( 1 / β ) β 2 − ψ ′ ( 1 / β ) β 3 + 1 β 2 − ∑ i = 1 N | x i − μ | β ( log | x i − μ | ) 2 ∑ i = 1 N | x i − μ | β + ( ∑ i = 1 N | x i − μ | β log | x i − μ | ) 2 ( ∑ i = 1 N | x i − μ | β ) 2 + ∑ i = 1 N | x i − μ | β log | x i − μ | β ∑ i = 1 N | x i − μ | β − log ( β N ∑ i = 1 N | x i − μ | β ) β 2 , {\displaystyle {\begin{aligned}g'(\beta )={}&-{\frac {\psi (1/\beta )}{\beta ^{2}}}-{\frac {\psi '(1/\beta )}{\beta ^{3}}}+{\frac {1}{\beta ^{2}}}-{\frac {\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }(\log |x_{i}-\mu |)^{2}}{\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }}}\\[6pt]&{}+{\frac {\left(\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\log |x_{i}-\mu |\right)^{2}}{\left(\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\right)^{2}}}+{\frac {\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\log |x_{i}-\mu |}{\beta \sum _{i=1}^{N}|x_{i}-\mu |^{\beta }}}\\[6pt]&{}-{\frac {\log \left({\frac {\beta }{N}}\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\right)}{\beta ^{2}}},\end{aligned}}} ここで 、 と はそれぞれ ディガンマ関数 と トリガンマ関数 です 。 ψ {\displaystyle \psi } ψ ′ {\displaystyle \psi '}
の値が与えられている場合、 次の最小値を見つけることで 推定することが可能です。 β {\displaystyle \textstyle \beta } μ {\displaystyle \mu }
min μ = ∑ i = 1 N | x i − μ | β {\displaystyle \min _{\mu }=\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }} 最終的に 次のように評価されます α {\displaystyle \textstyle \alpha }
α = ( β N ∑ i = 1 N | x i − μ | β ) 1 / β . {\displaystyle \alpha =\left({\frac {\beta }{N}}\sum _{i=1}^{N}|x_{i}-\mu |^{\beta }\right)^{1/\beta }.} については 、中央値がより適切な推定値である 。 が推定されると、 上述 のように推定できる。 [7] β ≤ 1 {\displaystyle \beta \leq 1} μ {\displaystyle \mu } μ {\displaystyle \mu } β {\displaystyle \beta } α {\displaystyle \alpha }
アプリケーション 対称型一般化正規分布は、平均値周辺の値の集中と裾の挙動が特に重要なモデリングにおいて用いられてきた。 [8] [9] 正規分布からの他の偏差に焦点を絞る場合は、他の分布族も用いることができる。 分布の 対称性が主な関心事である場合は、後述する 歪んだ正規分布 族または一般化正規分布族の非対称版を用いることができる。裾の挙動が主な関心事である場合は、自由度が無限大に増加するにつれて正規分布に近似する スチューデントt 分布族を用いることができる。t分布は、この一般化正規分布とは異なり、原点に 尖端 を持たずに、正規分布よりも裾が重くなる。プラズマ物理学においては、逆制動放射に起因するラングドン分布という名前で用いられている。 [10]
としてモデル化された 線形回帰 問題では 、 MLE は p ノルム が使用されるに なります 。 y ∼ G e n e r a l i z e d N o r m a l ( X ⋅ θ , α , p ) {\displaystyle y\sim \mathrm {GeneralizedNormal} (X\cdot \theta ,\alpha ,p)} arg min θ ‖ X ⋅ θ − y ‖ p {\displaystyle \arg \min _{\theta }\|X\cdot \theta -y\|_{p}}
プロパティ
瞬間 を平均ゼロの一般化ガウス分布とし、形状 とスケーリングパラメータを とする 。 のモーメントは 、-1 より大きい任意の k に対して存在し、有限である。任意の非負整数 k に対して、平板中心モーメントは [2]である。 X β {\displaystyle X_{\beta }} β {\displaystyle \beta } α {\displaystyle \alpha } X β {\displaystyle X_{\beta }}
E [ X β k ] = { 0 if k is odd, α k Γ ( k + 1 β ) / Γ ( 1 β ) if k is even. {\displaystyle \operatorname {E} \left[X_{\beta }^{k}\right]={\begin{cases}0&{\text{if }}k{\text{ is odd,}}\\\alpha ^{k}\Gamma \left({\frac {k+1}{\beta }}\right){\Big /}\,\Gamma \left({\frac {1}{\beta }}\right)&{\text{if }}k{\text{ is even.}}\end{cases}}}
正定値関数への接続 対称 一般化正規分布の確率密度関数は、 正定値関数 である。 [11] [12] β ∈ ( 0 , 2 ] {\displaystyle \beta \in (0,2]}
無限に割り切れる 対称一般化ガウス分布は、 次の条件を満たす場合にのみ 無限に割り切れる分布 である。 [11] β ∈ ( 0 , 1 ] ∪ { 2 } {\displaystyle \beta \in (0,1]\cup \{2\}}
一般化 多変量一般化正規分布、すなわち同じパラメータ とパラメータを持つ指数分布 の積は 、形式で表すことができ 、独立な周辺分布を持つ唯一の確率密度である。 [13] 多変量正規分布 の特殊なケースの結果は、もともと マクスウェル に帰せられる 。 [14] n {\displaystyle n} β {\displaystyle \beta } α {\displaystyle \alpha } p ( x ) = g ( ‖ x ‖ β ) {\displaystyle p(\mathbf {x} )=g(\|\mathbf {x} \|_{\beta })}
非対称バージョン 非対称一般化正規分布 確率密度関数
累積分布関数
パラメータ ξ {\displaystyle \xi \,} 位置 ( 実数 ) スケール (正、 実数 ) 形状 ( 実数 ) α {\displaystyle \alpha \,} κ {\displaystyle \kappa \,} サポート x ∈ ( − ∞ , ξ + α / κ ) if κ > 0 {\displaystyle x\in (-\infty ,\xi +\alpha /\kappa ){\text{ if }}\kappa >0} x ∈ ( − ∞ , ∞ ) if κ = 0 {\displaystyle x\in (-\infty ,\infty ){\text{ if }}\kappa =0} x ∈ ( ξ + α / κ , + ∞ ) if κ < 0 {\displaystyle x\in (\xi +\alpha /\kappa ,+\infty ){\text{ if }}\kappa <0} PDF ϕ ( y ) α − κ ( x − ξ ) {\displaystyle {\frac {\phi (y)}{\alpha -\kappa (x-\xi )}}} 、 標準 正規分布の PDFは y = { − 1 κ log [ 1 − κ ( x − ξ ) α ] if κ ≠ 0 x − ξ α if κ = 0 {\displaystyle y={\begin{cases}-{\frac {1}{\kappa }}\log \left[1-{\frac {\kappa (x-\xi )}{\alpha }}\right]&{\text{if }}\kappa \neq 0\\{\frac {x-\xi }{\alpha }}&{\text{if }}\kappa =0\end{cases}}} ϕ {\displaystyle \phi } CDF Φ ( y ) {\displaystyle \Phi (y)} 、ここで 標準 正規 CDFは y = { − 1 κ log [ 1 − κ ( x − ξ ) α ] if κ ≠ 0 x − ξ α if κ = 0 {\displaystyle y={\begin{cases}-{\frac {1}{\kappa }}\log \left[1-{\frac {\kappa (x-\xi )}{\alpha }}\right]&{\text{if }}\kappa \neq 0\\{\frac {x-\xi }{\alpha }}&{\text{if }}\kappa =0\end{cases}}} Φ {\displaystyle \Phi } 平均 ξ − α κ ( e κ 2 / 2 − 1 ) {\displaystyle \xi -{\frac {\alpha }{\kappa }}\left(e^{\kappa ^{2}/2}-1\right)} 中央値 ξ {\displaystyle \xi \,} 分散 α 2 κ 2 e κ 2 ( e κ 2 − 1 ) {\displaystyle {\frac {\alpha ^{2}}{\kappa ^{2}}}e^{\kappa ^{2}}\left(e^{\kappa ^{2}}-1\right)} 歪度 3 e κ 2 − e 3 κ 2 − 2 ( e κ 2 − 1 ) 3 / 2 sign ( κ ) {\displaystyle {\frac {3e^{\kappa ^{2}}-e^{3\kappa ^{2}}-2}{(e^{\kappa ^{2}}-1)^{3/2}}}{\text{ sign}}(\kappa )} 過剰尖度 e 4 κ 2 + 2 e 3 κ 2 + 3 e 2 κ 2 − 6 {\displaystyle e^{4\kappa ^{2}}+2e^{3\kappa ^{2}}+3e^{2\kappa ^{2}}-6}
非対称 一般化正規分布は 、形状パラメータを使用して非対称性または歪度を導入できる連続確率分布の族です。 [15] [16] 形状パラメータがゼロの場合、正規分布になります。形状パラメータの値が正の場合、右に限られた左に歪んだ分布が生成され、形状パラメータの値が負の場合、左に限られた右に歪んだ分布が生成されます。形状パラメータがゼロの場合にのみ、この分布の密度関数は実数線全体にわたって正になります。この場合、分布は 正規分布 であり、それ以外の場合は分布はシフトしており、逆の 対数正規分布 である可能性があります。
パラメータ推定 パラメータは最尤推定法 またはモーメント法によって推定できます 。パラメータ推定値は閉形式ではないため、推定値を算出するには数値計算を使用する必要があります。標本空間(密度がゼロでない実数の集合)はパラメータの真の値に依存するため、このファミリーを扱う場合、パラメータ推定値の性能に関するいくつかの標準的な結果は自動的には適用されません。
アプリケーション 非対称一般化正規分布は、正規分布に従う値、あるいは正規分布に対して右または左に偏った値をモデル化するために使用できます。歪ん だ正規分布は、 歪んだ値による正規分布からの偏差をモデル化するのに有用な別の分布です。歪んだデータをモデル化するために使用される他の分布には、 ガンマ 分布、 対数正規 分布、 ワイブル 分布などがありますが、これらの分布には正規分布は特別なケースとして含まれていません。
2つのPDF間のKullback-Leiblerダイバージェンス カルバック・ライブラー・ダイバージェンス (KLD)は、2つの確率密度関数間のダイバージェンスまたは類似度を計算する手法である。 [17]
と 、 制約条件付き で パラメータとを持つ2つの一般化ガウス分布があるとする 。 [18] この発散は次のように与えられる。 P ( x ) {\displaystyle P(x)} Q ( x ) {\displaystyle Q(x)} α 1 , β 1 , μ 1 {\displaystyle \alpha _{1},\beta _{1},\mu _{1}} α 2 , β 2 , μ 2 {\displaystyle \alpha _{2},\beta _{2},\mu _{2}} μ 1 = μ 2 = 0 {\displaystyle \mu _{1}=\mu _{2}=0}
K L D p d f ( P ( x ) ∥ Q ( x ) ) = − 1 β 1 + ( α 1 α 2 ) β 2 Γ ( 1 + β 2 β 1 ) Γ ( 1 β 1 ) + log ( α 2 Γ ( 1 + 1 β 2 ) α 1 Γ ( 1 + 1 β 1 ) ) {\displaystyle {\rm {KLD_{pdf}}}(P(x)\parallel Q(x))=-{\frac {1}{\beta _{1}}}+{\frac {({\frac {\alpha _{1}}{\alpha _{2}}})^{\beta _{2}}\Gamma ({\frac {1+\beta _{2}}{\beta _{1}}})}{\Gamma ({\frac {1}{\beta _{1}}})}}+\log \left({\frac {\alpha _{2}\Gamma (1+{\frac {1}{\beta _{2}}})}{\alpha _{1}\Gamma (1+{\frac {1}{\beta _{1}}})}}\right)}
ここで説明する2つの一般化正規分布族は、 歪んだ正規分布 族と同様に、形状パラメータを追加することで正規分布を拡張したパラメトリック分布族です。正規分布は確率と統計において中心的な役割を果たしているため、多くの分布は正規分布との関係で特徴付けることができます。例えば、対数 正規分布 、 折り畳み正規分布 、 逆正規 分布は正規分布値の変換として定義されますが、一般化正規分布族や歪んだ正規分布族とは異なり、これらの分布族には正規分布が特別なケースとして含まれていません。
実際には、有限分散を持つ分布はすべて、極限において正規分布と密接に関連しています。スチューデントt分布、 アーウィン・ホール分布 、 ベイツ分布 も正規分布を拡張しており、極限において正規分布を 含みます 。したがって、例えばスチューデントt分布と正規化された拡張アーウィン・ホール分布の組み合わせよりも、タイプ1の「一般化」正規分布を優先する強い理由は存在しません。これには例えば三角分布(これはタイプ1の一般化ガウス分布ではモデル化できません)が含まれます。
尾部(長いと短い) と 中心の動作(平坦、三角形、ガウスなど)の両方を完全に独立してモデル化できる対称分布は、たとえば X = IH/chi を使用することによって導き出すことができます。
Tukeyのg分布とh分布は、歪度と太い裾の両方を通じて、正規分布からの逸脱も許容します。 [19]
参照
参考文献 ^ Griffin, Maryclare. 「gnormを使った指数べき分布の扱い方」. Github, gnormパッケージ. 2020年 6月26日 閲覧 。 ^ ab Nadarajah, Saralees (2005年9月). 「一般化正規分布」. Journal of Applied Statistics . 32 (7): 685– 694. Bibcode :2005JApSt..32..685N. doi :10.1080/02664760500079464. S2CID 121914682. ^ Varanasi, MK; Aazhang, B. (1989年10月). 「パラメトリック一般化ガウス密度推定」. Journal of the Acoustical Society of America . 86 (4): 1404– 1415. Bibcode :1989ASAJ...86.1404V. doi :10.1121/1.398700. ^ ドミンゲス=モリーナ、J. アルマンド; González-Farías, グラシエラ ; Rodríguez-Dagnino、Ramón M. 「一般化ガウス分布における形状パラメータを推定するための実践的な手順」 (PDF) 。 2007 年 9 月 28 日に オリジナル (PDF)からアーカイブされました 。 2009 年 3 月 3 日 に取得 。 ^ Varanasi, MK; Aazhang B. (1989). 「パラメトリック一般化ガウス密度推定」. J. Acoust. Soc. Am. 86 (4): 1404– 1415. Bibcode :1989ASAJ...86.1404V. doi :10.1121/1.398700. ^ Do, MN; Vetterli, M. (2002年2月). 「一般化ガウス密度とカルバック・ライブラー距離を用いたウェーブレットベースのテクスチャ検索」. IEEE Transactions on Image Processing . 11 (2): 146– 158. Bibcode :2002ITIP...11..146D. doi :10.1109/83.982822. PMID 18244620. ^ Varanasi, Mahesh K.; Aazhang, Behnaam (1989-10-01). 「パラメトリック一般化ガウス密度推定」. アメリカ音響学会誌 . 86 (4): 1404– 1415. Bibcode :1989ASAJ...86.1404V. doi :10.1121/1.398700. ISSN 0001-4966. ^ Liang, Faming; Liu, Chuanhai; Wang, Naisyin (2007年4月). 「発現差のある遺伝子の同定のための堅牢な逐次ベイズ法」. Statistica Sinica . 17 (2): 571– 597. 2007年10月9日時点のオリジナルよりアーカイブ 。 2009年3月3日 閲覧。 ^ Box, George EP ; Tiao, George C. (1992). ベイズ推論における統計分析 . ニューヨーク: Wiley. ISBN 978-0-471-57428-6 。 ^ Milder, Avram L. (2021). 電子速度分布関数とトムソン散乱 (博士論文). ロチェスター大学. hdl : 1802/36536 . ^ ab Dytso, Alex; Bustin, Ronit; Poor, H. Vincent; Shamai, Shlomo (2018). 「一般化ガウス分布の解析的性質」. Journal of Statistical Distributions and Applications . 5 (1): 6. doi : 10.1186/s40488-018-0088-5 . ^ ボクナー、サロモン (1937). 「安定な確率法則と完全に単調な関数」. デューク数学ジャーナル . 3 (4): 726– 728. doi :10.1215/s0012-7094-37-00360-0. ^ Sinz, Fabian; Gerwinn, Sebastian; Bethge, Matthias (2009年5月). 「p-一般化正規分布の特性評価」. Journal of Multivariate Analysis . 100 (5): 817– 820. doi : 10.1016/j.jmva.2008.07.006 . ^ Kac, M. (1939). 「正規分布の特徴づけについて」. American Journal of Mathematics . 61 (3): 726– 728. doi :10.2307/2371328. JSTOR 2371328. ^ Hosking, JRM, Wallis, JR (1997) 地域頻度分析:Lモーメントに基づくアプローチ 、ケンブリッジ大学出版局 。ISBN 0-521-43045-3 セクションA.8 ^ lmomco R パッケージのドキュメント ^ Kullback, S.; Leibler, RA (1951). 「情報と十分性について」. 数理統計年報 . 22 (1): 79– 86. doi : 10.1214/aoms/1177729694 . ^ Quintero-Rincón, A.; Pereyra, M.; D'Giano, C.; Batatia, H.; Risk, M. (2017). 「ウェーブレット統計表現とKullback-Leiblerダイバージェンスに基づく視覚的EEGてんかん検出法」. VII Latin American Congress on Biomedical Engineering CLAIB 2016, ブカラマンガ, サンタンデール, コロンビア, 2016年10月26日~28日 . IFMBE Proceedings. 第60巻. pp. 13– 16. doi : 10.1007/978-981-10-4086-3_4 . hdl : 11336/77054 . ISBN 978-981-10-4085-6 。 ^ Tukeyのg-and-h分布、Yuan Yan、Marc G. Genton Significance、第16巻、第3号、2019年6月、12~13ページ、 doi :10.1111/j.1740-9713.2019.01273.x
離散 一変数
連続 一変量
制限された間隔 でサポートされている 半無限 間隔 でサポートされている 実数直線 全体で サポートされている さまざまなタイプの サポート付き
混合 単変量
多変量 (ジョイント) 方向性 退化 と 特異性 家族