Multivariable generalization of the Student's t-distribution
多変量 t検定 表記 t p ( μ , Σ , ν ) {\displaystyle t_{p}({\boldsymbol {\mu }},{\boldsymbol {\Sigma }},\nu )} パラメータ μ = [ μ 1 , … , μ p ] T {\displaystyle {\boldsymbol {\mu }}=[\mu _{1},\dots ,\mu _{p}]^{\mathsf {T}}} 位置 ( 実数 ベクトル ) スケール行列 ( 正定値 実数 行列 ) (実数)は 自由度を表す p × 1 {\displaystyle p\times 1} Σ {\displaystyle {\boldsymbol {\Sigma }}} p × p {\displaystyle p\times p} ν > 0 {\displaystyle \nu >0} サポート x ∈ R p {\displaystyle \mathbf {x} \in \mathbb {R} ^{p}\!} PDF Γ [ ( ν + p ) / 2 ] Γ ( ν / 2 ) ν p / 2 π p / 2 | Σ | 1 / 2 [ 1 + 1 ν ( x − μ ) T Σ − 1 ( x − μ ) ] − ( ν + p ) / 2 {\displaystyle {\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}\left|{\boldsymbol {\Sigma }}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})^{\mathsf {T}}{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2}} CDF 解析的な表現はないが、近似値については本文を参照 平均 μ {\displaystyle {\boldsymbol {\mu }}} if ; else 未定義 ν > 1 {\displaystyle \nu >1} 中央値 μ {\displaystyle {\boldsymbol {\mu }}} モード μ {\displaystyle {\boldsymbol {\mu }}} 分散 ν ν − 2 Σ {\displaystyle {\frac {\nu }{\nu -2}}{\boldsymbol {\Sigma }}} (共分散行列)if ; else undefined ν > 2 {\displaystyle \nu >2} 歪度 0 の場合 ; それ以外の場合は未定義 ν > 3 {\displaystyle \nu >3}
統計学 において 、 多変量 t 分布 (または 多変量スチューデント分布 )は、 多変量確率分布の 一種です。これは、単変量 確率変数 に適用可能な分布である スチューデント t 分布を ランダム ベクトルに一般化したものです。 ランダム行列 の場合は この構造内で扱うことができますが、 行列 t 分布 は異なり、行列構造を特に利用します。
意味 多変量 t 分布を構築する一般的な方法の1つは、次元 の場合 、および が独立で、それぞれおよび(つまり、多変量正規分布およびカイ2乗分布)として分布する場合 、 行列 は p × p 行列 で あり 、 が 定数ベクトルである場合、確率変数の 密度は [1] p {\displaystyle p} y {\displaystyle \mathbf {y} } u {\displaystyle u} N ( 0 , Σ ) {\displaystyle N({\mathbf {0} },{\boldsymbol {\Sigma }})} χ ν 2 {\displaystyle \chi _{\nu }^{2}} Σ {\displaystyle \mathbf {\Sigma } \,} μ {\displaystyle {\boldsymbol {\mu }}} x = y / u / ν + μ {\textstyle {\mathbf {x} }={\mathbf {y} }/{\sqrt {u/\nu }}+{\boldsymbol {\mu }}}
Γ [ ( ν + p ) / 2 ] Γ ( ν / 2 ) ν p / 2 π p / 2 | Σ | 1 / 2 [ 1 + 1 ν ( x − μ ) T Σ − 1 ( x − μ ) ] − ( ν + p ) / 2 {\displaystyle {\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}\left|{\boldsymbol {\Sigma }}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}\left({\mathbf {x} }-{\boldsymbol {\mu }}\right)^{\mathsf {T}}{\boldsymbol {\Sigma }}^{-1}\left({\mathbf {x} }-{\boldsymbol {\mu }}\right)\right]^{-(\nu +p)/2}}
は、パラメータ を持つ多変量 t 分布に従うと言われています 。 共分散は ( に対して ) で与えられるため、 は共分散行列ではないことに注意してください。 Σ , μ , ν {\displaystyle {\boldsymbol {\Sigma }},{\boldsymbol {\mu }},\nu } Σ {\displaystyle \mathbf {\Sigma } } ν / ( ν − 2 ) Σ {\displaystyle \nu /(\nu -2)\mathbf {\Sigma } } ν > 2 {\displaystyle \nu >2}
多変量t 分布の構築的な定義は、 同時にサンプリングアルゴリズムとしても機能します。
および を独立して 生成します 。 u ∼ χ ν 2 {\displaystyle u\sim \chi _{\nu }^{2}} y ∼ N ( 0 , Σ ) {\displaystyle \mathbf {y} \sim N(\mathbf {0} ,{\boldsymbol {\Sigma }})} 計算します 。 x ← y ν / u + μ {\textstyle \mathbf {x} \gets \mathbf {y} {\sqrt {\nu /u}}+{\boldsymbol {\mu }}} この定式化により、多変量t 分布の階層的表現が正規分布のスケール混合として 生成されます。 ここで、 は 密度が に比例するガンマ分布を示し 、 条件付きで に従います 。 u ∼ G a ( ν / 2 , ν / 2 ) {\displaystyle u\sim \mathrm {Ga} (\nu /2,\nu /2)} G a ( a , b ) {\displaystyle \mathrm {Ga} (a,b)} x a − 1 e − b x {\displaystyle x^{a-1}e^{-bx}} x ∣ u {\displaystyle \mathbf {x} \mid u} N ( μ , u − 1 Σ ) {\displaystyle N({\boldsymbol {\mu }},u^{-1}{\boldsymbol {\Sigma }})}
特殊なケースでは 、分布は 多変量コーシー分布に なります。 ν = 1 {\displaystyle \nu =1}
導出 スチューデントの t 分布 の多変量一般化には、実のところ多くの候補があります 。この分野の広範な調査は、KotzとNadarajah(2004)によって行われています。本質的な問題は、単変量の場合の式の適切な一般化となる、多変数の確率密度関数を定義することです。1次元( )では、およびで 、 確率密度関数 が得られ 、1つのアプローチは対応する多変数関数を使用することです。これは 楕円分布 理論の基本的な考え方であり、をすべての の2次関数に 置き換える、対応する 変数 関数を書きます。これは、すべての周辺分布が同じ 自由度 を 持つ場合にのみ意味をなすことは明らかです 。 で 、多変量密度関数の簡単な選択があります。 p = 1 {\displaystyle p=1} t = x − μ {\displaystyle t=x-\mu } Σ = 1 {\displaystyle \Sigma =1} f ( t ) = Γ [ ( ν + 1 ) / 2 ] ν π Γ [ ν / 2 ] ( 1 + t 2 / ν ) − ( ν + 1 ) / 2 {\displaystyle f(t)={\frac {\Gamma [(\nu +1)/2]}{{\sqrt {\nu \pi \,}}\,\Gamma [\nu /2]}}(1+t^{2}/\nu )^{-(\nu +1)/2}} p {\displaystyle p} t i {\displaystyle t_{i}} t 2 {\displaystyle t^{2}} t i {\displaystyle t_{i}} ν {\displaystyle \nu } A = Σ − 1 {\displaystyle \mathbf {A} ={\boldsymbol {\Sigma }}^{-1}}
f ( t ) = Γ ( ( ν + p ) / 2 ) | A | 1 / 2 ν p π p Γ ( ν / 2 ) ( 1 + ∑ i , j = 1 p , p A i j t i t j / ν ) − ( ν + p ) / 2 {\displaystyle f(\mathbf {t} )={\frac {\Gamma ((\nu +p)/2)\left|\mathbf {A} \right|^{1/2}}{{\sqrt {\nu ^{p}\pi ^{p}\,}}\,\Gamma (\nu /2)}}\left(1+\sum _{i,j=1}^{p,p}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +p)/2}}
これは標準ですが、唯一の選択肢ではありません。
重要な特別なケースは、標準的な 二変量 t 分布である。 、 p = 2:
f ( t 1 , t 2 ) = | A | 1 / 2 2 π ( 1 + ∑ i , j = 1 2 , 2 A i j t i t j / ν ) − ( ν + 2 ) / 2 {\displaystyle f(t_{1},t_{2})={\frac {\left|\mathbf {A} \right|^{1/2}}{2\pi }}\left(1+\sum _{i,j=1}^{2,2}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +2)/2}}
ご了承ください 。 Γ ( ν + 2 2 ) π ν Γ ( ν 2 ) = 1 2 π {\displaystyle {\frac {\Gamma {\left({\frac {\nu +2}{2}}\right)}}{\pi \nu \,\Gamma {\left({\frac {\nu }{2}}\right)}}}={\frac {1}{2\pi }}}
さて、が 単位行列であれば、密度は A {\displaystyle \mathbf {A} }
f ( t 1 , t 2 ) = 1 2 π ( 1 + ( t 1 2 + t 2 2 ) / ν ) − ( ν + 2 ) / 2 . {\displaystyle f(t_{1},t_{2})={\frac {1}{2\pi }}\left(1+(t_{1}^{2}+t_{2}^{2})/\nu \right)^{-(\nu +2)/2}.}
標準表現の難しさは、この式が周辺1次元分布の積に因数分解できないことから明らかです。 が対角の場合、標準表現は 相関が ゼロであることが示されます が、 周辺分布は 統計的に独立 ではありません 。 Σ {\displaystyle \Sigma }
楕円多変量分布の注目すべき自発的出現は、資産ポートフォリオの古典的なマルコウィッツ最小分散計量解のような多変量正規分布データに最小二乗法を適用したときに正式な数学的外観を示すことである。 [2]
累積分布関数 1 次元の累積分布関数 (cdf)の定義は、次の確率 (ここで は実数ベクトル) を定義することによって、複数の次元に拡張できます。 x {\displaystyle \mathbf {x} }
F ( x ) = P ( X ≤ x ) , where X ∼ t ν ( μ , Σ ) . {\displaystyle F(\mathbf {x} )=\mathbb {P} (\mathbf {X} \leq \mathbf {x} ),\quad {\textrm {where}}\;\;\mathbf {X} \sim t_{\nu }({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}).} には簡単な公式はないが、 モンテカルロ積分 によって数値的に近似することができる 。 [3] [4] [5] F ( x ) {\displaystyle F(\mathbf {x} )}
条件付き分布 これはミュアヘッド [6] とコーニッシュ [7]によって開発されたが、後にロス [1] とディン [8] によって上記のより単純なカイ二乗比表現を使用して導出された。 ベクトルが 多変量 t 分布に従い、2つの 要素のサブベクトルに分割されるとする。 X {\displaystyle X} p 1 , p 2 {\displaystyle p_{1},p_{2}} X p = [ X 1 X 2 ] ∼ t p ( μ p , Σ p × p , ν ) {\displaystyle X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t_{p}\left(\mu _{p},\Sigma _{p\times p},\nu \right)}
ここで 、既知の平均ベクトルは であり 、スケール行列は です 。 p 1 + p 2 = p {\displaystyle p_{1}+p_{2}=p} μ p = [ μ 1 μ 2 ] {\displaystyle \mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}} Σ p × p = [ Σ 11 Σ 12 Σ 21 Σ 22 ] {\displaystyle \Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}}
Roth と Ding は、条件付き分布が、 パラメータが変更された 新しい t分布であることを発見しました。 p ( X 1 | X 2 ) {\displaystyle p(X_{1}|X_{2})}
X 1 | X 2 ∼ t p 1 ( μ 1 | 2 , ν + d 2 ν + p 2 Σ 11 | 2 , ν + p 2 ) {\displaystyle X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},\,{\frac {\nu +d_{2}}{\nu +p_{2}}}\Sigma _{11|2},\,\nu +p_{2}\right)}
Kotz らによる同等の表現は、やや簡潔ではありません。
このように、条件付き分布は2段階の手順として最も簡単に表現できます。まず 上記の中間分布を作成し、次に以下のパラメータを使用して、明示的な条件付き分布を作成します。 X 1 | X 2 ∼ t p 1 ( μ 1 | 2 , Ψ , ν ~ ) {\displaystyle X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},\Psi ,{\tilde {\nu }}\right)}
f ( X 1 | X 2 ) = Γ ( ν ~ + p 1 2 ) Γ ( ν ~ 2 ) ( π ν ~ ) p 1 / 2 | Ψ | 1 / 2 [ 1 + 1 ν ~ ( X 1 − μ 1 | 2 ) T Ψ − 1 ( X 1 − μ 1 | 2 ) ] − ( ν ~ + p 1 ) / 2 {\displaystyle f(X_{1}|X_{2})={\frac {\Gamma {\left({\frac {{\tilde {\nu }}+p_{1}}{2}}\right)}}{\Gamma {\left({\frac {\tilde {\nu }}{2}}\right)}\left(\pi \,{\tilde {\nu }}\right)^{p_{1}/2}\left|{\boldsymbol {\Psi }}\right|^{1/2}}}\left[1+{\frac {1}{\tilde {\nu }}}\left(X_{1}-\mu _{1|2}\right)^{\mathsf {T}}{\boldsymbol {\Psi }}^{-1}\left(X_{1}-\mu _{1|2}\right)\right]^{-({\tilde {\nu }}+p_{1})/2}} ここで、 有効自由度は、 使用されない変数の数によって増加します 。 は の条件付き平均です。 は の シュアー 補数 です。 は から の の 二乗 マハラノビス距離 です。スケール行列 は の条件付きスケール行列であり 、 は の条件付き共分散行列です 。 ν ~ = ν + p 2 {\displaystyle {\tilde {\nu }}=\nu +p_{2}} ν {\displaystyle \nu } p 2 {\displaystyle p_{2}} μ 1 | 2 = μ 1 + Σ 12 Σ 22 − 1 ( X 2 − μ 2 ) {\displaystyle \mu _{1|2}=\mu _{1}+\Sigma _{12}\Sigma _{22}^{-1}\left(X_{2}-\mu _{2}\right)} x 1 {\displaystyle x_{1}} Σ 11 | 2 = Σ 11 − Σ 12 Σ 22 − 1 Σ 21 {\displaystyle \Sigma _{11|2}=\Sigma _{11}-\Sigma _{12}\Sigma _{22}^{-1}\Sigma _{21}} Σ 22 in Σ {\displaystyle \Sigma _{22}{\text{ in }}\Sigma } d 2 = ( X 2 − μ 2 ) T Σ 22 − 1 ( X 2 − μ 2 ) {\displaystyle d_{2}=(X_{2}-\mu _{2})^{\mathsf {T}}\Sigma _{22}^{-1}(X_{2}-\mu _{2})} X 2 {\displaystyle X_{2}} μ 2 {\displaystyle \mu _{2}} Σ 22 {\displaystyle \Sigma _{22}} Ψ = ν + d 2 ν ~ Σ 11 | 2 {\displaystyle \Psi ={\frac {\nu +d_{2}}{\tilde {\nu }}}\Sigma _{11|2}} ν ~ > 0 {\displaystyle {\tilde {\nu }}>0} Σ c o v = ν ~ ν ~ − 2 Ψ = ν + d 2 ν ~ − 2 Σ 11 | 2 {\displaystyle \Sigma _{cov}={\frac {\tilde {\nu }}{{\tilde {\nu }}-2}}\Psi ={\frac {\nu +d_{2}}{{\tilde {\nu }}-2}}\Sigma _{11|2}} ν ~ > 2 {\displaystyle {\tilde {\nu }}>2}
多変量コピュラ t このような分布の使用は、 特にスチューデントの t コピュラの使用を通じて、 数理ファイナンス への応用により新たな関心を集めています。 [9]
楕円表現 楕円分布 [10] として構築され 、 球対称でスケーリングのない最も単純な中心化ケースをとると、 多変量 t -PDFは次の形になります。 Σ = I {\displaystyle \Sigma =\operatorname {I} \,}
f X ( X ) = g ( X T X ) = Γ ( ν + p 2 ) ( ν π ) p / 2 Γ ( ν 2 ) ( 1 + ν − 1 X T X ) − ( ν + p ) / 2 {\displaystyle f_{X}(X)=g(X^{\mathsf {T}}X)={\frac {\Gamma {\left({\frac {\nu +p}{2}}\right)}}{(\nu \pi )^{\,p/2}\Gamma {\left({\frac {\nu }{2}}\right)}}}\left(1+\nu ^{-1}X^{\mathsf {T}}X\right)^{-(\nu +p)/2}}
ここで 、は ベクトルであり、はミュアヘッド [6]の 1.5節で定義された自由度である 。の共分散 は X = ( x 1 , ⋯ , x p ) T {\displaystyle X=(x_{1},\cdots ,x_{p})^{\mathsf {T}}} p {\displaystyle p} ν {\displaystyle \nu } X {\displaystyle X}
E ( X X T ) = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ f X ( x 1 , … , x p ) X X T d x 1 … d x p = ν ν − 2 I {\displaystyle \operatorname {E} \left(XX^{\mathsf {T}}\right)=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p})XX^{\mathsf {T}}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}\operatorname {I} }
目的は、直交座標PDFをラジアルPDFに変換することである。KibriaとJoarder [11] はラジアル測度を定義し 、密度がr 2 のみに依存することに注目すると、次式が得られる。 r 2 = R 2 = X T X p {\displaystyle r_{2}=R^{2}={\frac {X^{\mathsf {T}}X}{p}}}
E [ r 2 ] = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ f X ( x 1 , … , x p ) X T X p d x 1 … d x p = ν ν − 2 {\displaystyle \operatorname {E} [r_{2}]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p}){\frac {X^{\mathsf {T}}X}{p}}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}}
これは、相関はないが統計的に依存する要素を持つ単変量重裾ゼロ平均ランダムシーケンスとして扱われる 要素ベクトル の分散に相当します。 p {\displaystyle p} X {\displaystyle X}
放射状分布 r 2 = X T X p {\displaystyle r_{2}={\frac {X^{\mathsf {T}}X}{p}}} フィッシャー・スネデコール 分布 に従います 。 F {\displaystyle F}
r 2 ∼ f F ( p , ν ) = B ( p 2 , ν 2 ) − 1 ( p ν ) p / 2 r 2 p / 2 − 1 ( 1 + p ν r 2 ) − ( p + ν ) / 2 {\displaystyle r_{2}\sim f_{F}(p,\nu )=B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}{\bigg (}{\frac {p}{\nu }}{\bigg )}^{p/2}r_{2}^{p/2-1}{\bigg (}1+{\frac {p}{\nu }}r_{2}{\bigg )}^{-(p+\nu )/2}}
平均値を持つ 。 分布は、サンプル標準偏差で正規化した後のサンプルデータの二乗和の検定で自然に発生します。 E [ r 2 ] = ν ν − 2 {\displaystyle \operatorname {E} [r_{2}]={\frac {\nu }{\nu -2}}} F {\displaystyle F}
上の式 で確率変数を に変更し、 -ベクトルを維持すると 、 確率分布は次のように
なります。 y = p ν r 2 = X T X ν {\displaystyle y={\frac {p}{\nu }}r_{2}={\frac {X^{\mathsf {T}}X}{\nu }}} p {\displaystyle p} X {\displaystyle X} E [ y ] = ∫ − ∞ ∞ ⋯ ∫ − ∞ ∞ f X ( X ) X T X ν d x 1 … d x p = p ν − 2 {\displaystyle \operatorname {E} [y]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(X){\frac {X^{\mathsf {T}}X}{\nu }}\,dx_{1}\dots dx_{p}={\frac {p}{\nu -2}}} f Y ( y | p , ν ) = | p ν | − 1 B ( p 2 , ν 2 ) − 1 ( p ν ) p / 2 ( p ν ) − p / 2 − 1 y p / 2 − 1 ( 1 + y ) − ( p + ν ) / 2 = B ( p 2 , ν 2 ) − 1 y p / 2 − 1 ( 1 + y ) − ( ν + p ) / 2 {\displaystyle {\begin{aligned}f_{Y}(y|\,p,\nu )&=\left|{\frac {p}{\nu }}\right|^{-1}B\left({\frac {p}{2}},{\frac {\nu }{2}}\right)^{-1}\left({\frac {p}{\nu }}\right)^{p/2}\left({\frac {p}{\nu }}\right)^{-p/2-1}y^{\,p/2-1}{\bigl (}1+y{\bigr )}^{-(p+\nu )/2}\\[2ex]&=B\left({\frac {p}{2}},{\frac {\nu }{2}}\right)^{-1}y^{\,p/2-1}{\bigl (}1+y{\bigr )}^{-(\nu +p)/2}\end{aligned}}}
これは平均値 を持つ 正規 ベータプライム分布 です。 y ∼ β ′ ( y ; p 2 , ν 2 ) {\displaystyle y\sim \beta \,'{\bigg (}y;{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}} 1 2 p 1 2 ν − 1 = p ν − 2 {\displaystyle {\frac {{\frac {1}{2}}p}{{\frac {1}{2}}\nu -1}}={\frac {p}{\nu -2}}}
累積放射分布 ベータプライム分布が与えられた場合、の放射状累積分布関数は 次のように知られています。 y {\displaystyle y} F Y ( y ) ∼ I ( y 1 + y ; p 2 , ν 2 ) B ( p 2 , ν 2 ) − 1 {\displaystyle F_{Y}(y)\sim I{\bigg (}{\frac {y}{1+y}};\,{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}\,B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}}
ここで 、 は不完全 ベータ関数 であり、球面 仮定のもとに適用されます。 I {\displaystyle I} Σ {\displaystyle \Sigma }
スカラーの場合 、分布は と同等であり 、変数 t は CDF の目的で両側の裾を持ちます (つまり、「両側 t 検定」)。 p = 1 {\displaystyle p=1} t 2 = y 2 σ − 1 {\displaystyle t^{2}=y^{2}\sigma ^{-1}}
動径分布は、直交座標から球面座標への簡単な座標変換によっても導出できます。PDFを持つ 一定半径の曲面は、等密度面です。この密度値が与えられた場合、面積 と厚さの 殻 における確率量子は です 。 R = ( X T X ) 1 / 2 {\textstyle R=\left(X^{\mathsf {T}}X\right)^{1/2}} p X ( X ) ∝ ( 1 + ν − 1 R 2 ) − ( ν + p ) / 2 {\textstyle p_{X}(X)\propto \left(1+\nu ^{-1}R^{2}\right)^{-(\nu +p)/2}} A R {\displaystyle A_{R}} δ R {\displaystyle \delta R} R {\displaystyle R} δ P = p X ( R ) A R δ R {\displaystyle \delta P=p_{X}(R)\,A_{R}\delta R}
半径 の囲まれた 球面の 表面積は です 。 を代入すると、 殻には確率要素 があり 、これは放射密度関数 と等価であり
、さらに簡略化されて となります 。 ここでは ベータ関数 です。 p {\displaystyle p} R {\displaystyle R} A R = 2 π p / 2 R p − 1 Γ ( p / 2 ) {\displaystyle A_{R}={\frac {2\pi ^{p/2}R^{\,p-1}}{\Gamma (p/2)}}} δ P {\displaystyle \delta P} δ P = p X ( R ) 2 π p / 2 R p − 1 Γ ( p / 2 ) δ R {\displaystyle \delta P=p_{X}(R){\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}\delta R} f R ( R ) = Γ ( 1 2 ( ν + p ) ) ν p / 2 π p / 2 Γ ( 1 2 ν ) 2 π p / 2 R p − 1 Γ ( p / 2 ) ( 1 + R 2 ν ) − ( ν + p ) / 2 {\displaystyle f_{R}(R)={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{\nu ^{\,p/2}\pi ^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}} f R ( R ) = 2 ν 1 / 2 B ( 1 2 p , 1 2 ν ) ( R 2 ν ) ( p − 1 ) / 2 ( 1 + R 2 ν ) − ( ν + p ) / 2 {\displaystyle f_{R}(R)={\frac {2}{\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}} B ( ∗ , ∗ ) {\displaystyle B(*,*)}
ラジアル変数を に変更すると、 以前のベータプライム分布が返されます。 y = R 2 / ν {\displaystyle y=R^{2}/\nu } f Y ( y ) = 1 B ( 1 2 p , 1 2 ν ) y p / 2 − 1 ( 1 + y ) − ( ν + p ) / 2 {\displaystyle f_{Y}(y)={\frac {1}{B{\left({\frac {1}{2}}p,{\frac {1}{2}}\nu \right)}}}y^{\,p/2-1}\left(1+y\right)^{-(\nu +p)/2}}
放射状形状関数を変えずに放射状変数をスケールするには、スケール行列を定義し、3パラメータの直交座標密度関数を得る。つまり 、体積要素の 確率 は Σ = α I {\displaystyle \Sigma =\alpha \operatorname {I} } Δ P {\displaystyle \Delta _{P}} d x 1 … d x p {\displaystyle dx_{1}\dots dx_{p}}
Δ P ( f X ( X | α , p , ν ) ) = Γ ( 1 2 ( ν + p ) ) ( ν π ) p / 2 α p / 2 Γ ( 1 2 ν ) ( 1 + X T X α ν ) − ( ν + p ) / 2 d x 1 … d x p {\displaystyle \Delta _{P}{\big (}f_{X}(X\,|\alpha ,p,\nu ){\big )}={\frac {\Gamma {\left({\frac {1}{2}}(\nu +p)\,\right)}}{(\nu \pi )^{\,p/2}\alpha ^{\,p/2}\Gamma {\left({\frac {1}{2}}\nu \right)}}}\left(1+{\frac {X^{\mathsf {T}}X}{\alpha \nu }}\right)^{-(\nu +p)/2}\;dx_{1}\dots dx_{p}}
あるいは、スカラー放射状変数の観点から言えば 、 R {\displaystyle R}
f R ( R | α , p , ν ) = 2 α 1 / 2 ν 1 / 2 B ( 1 2 p , 1 2 ν ) ( R 2 α ν ) ( p − 1 ) / 2 ( 1 + R 2 α ν ) − ( ν + p ) / 2 {\displaystyle f_{R}(R\,|\alpha ,p,\nu )={\frac {2}{\alpha ^{1/2}\;\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{-(\nu +p)/2}}
ラジアルモーメント 球面分布を仮定した場合、すべてのラジアル変数のモーメントはベータプライム分布から導出できます。 の場合 、既知の結果となります。したがって、変数 について、 次
式が成り立ち ます
。 のモーメントは、 スケール行列を導入することで得られ ます
。 ラジアル変数 に関するモーメントは 、 と と設定する こと で求められます。 Z ∼ β ′ ( a , b ) {\displaystyle Z\sim \beta '(a,b)} E ( Z m ) = B ( a + m , b − m ) B ( a , b ) {\displaystyle \operatorname {E} (Z^{m})={\frac {B(a+m,b-m)}{B(a,b)}}} y = p ν R 2 {\displaystyle y={\frac {p}{\nu }}R^{2}} E ( y m ) = B ( 1 2 p + m , 1 2 ν − m ) B ( 1 2 p , 1 2 ν ) = Γ ( 1 2 p + m ) Γ ( 1 2 ν − m ) Γ ( 1 2 p ) Γ ( 1 2 ν ) , ν / 2 > m {\displaystyle \operatorname {E} (y^{m})={\frac {B({\frac {1}{2}}p+m,{\frac {1}{2}}\nu -m)}{B({\frac {1}{2}}p,{\frac {1}{2}}\nu )}}={\frac {\Gamma {\big (}{\frac {1}{2}}p+m{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu -m{\big )}}{\Gamma {\big (}{\frac {1}{2}}p{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}},\;\nu /2>m} r 2 = ν y {\displaystyle r_{2}=\nu \,y} E ( r 2 m ) = ν m E ( y m ) {\displaystyle \operatorname {E} (r_{2}^{m})=\nu ^{m}\operatorname {E} (y^{m})} α I {\displaystyle \alpha \operatorname {I} } E ( r 2 m | α ) = α m ν m E ( y m ) {\displaystyle \operatorname {E} (r_{2}^{m}|\alpha )=\alpha ^{m}\nu ^{m}\operatorname {E} (y^{m})} R {\displaystyle R} R = ( α ν y ) 1 / 2 {\displaystyle R=(\alpha \nu y)^{1/2}} M = 2 m {\displaystyle M=2m} E ( R M ) = E ( ( α ν y ) 1 / 2 ) 2 m = ( α ν ) M / 2 E ( y M / 2 ) = ( α ν ) M / 2 B ( 1 2 ( p + M ) , 1 2 ( ν − M ) ) B ( p 2 , ν 2 ) {\displaystyle {\begin{aligned}\operatorname {E} (R^{M})&=\operatorname {E} \!\left((\alpha \nu y)^{1/2}\right)^{2m}=(\alpha \nu )^{M/2}\operatorname {E} (y^{M/2})\\[1ex]&=(\alpha \nu )^{M/2}{\frac {B{\big (}{\frac {1}{2}}(p+M),{\frac {1}{2}}(\nu -M){\big )}}{B{\left({\frac {p}{2}},{\frac {\nu }{2}}\right)}}}\end{aligned}}}
これは多変量正規分布法と密接に関連しており、KotzとNadarajah、Kibria、Joarder、Roth、Cornishの論文で説明されている。中心MV-t確率密度関数のいくぶん簡略化されたバージョン、すなわち ( は定数、 は任意だが固定)から始め、 をフルランク行列とし、ベクトル を形成する 。そして、単純な変数変換によって f X ( X ) = K | Σ | 1 / 2 ( 1 + ν − 1 X T Σ − 1 X ) − ( ν + p ) / 2 {\displaystyle f_{X}(X)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}X^{\mathsf {T}}\Sigma ^{-1}X\right)^{-\left(\nu +p\right)/2}} K {\displaystyle \mathrm {K} } ν {\displaystyle \nu } Θ ∈ R p × p {\displaystyle \Theta \in \mathbb {R} ^{p\times p}} Y = Θ X {\displaystyle Y=\Theta X}
f Y ( Y ) = K | Σ | 1 / 2 ( 1 + ν − 1 Y T Θ − T Σ − 1 Θ − 1 Y ) − ( ν + p ) / 2 | ∂ Y ∂ X | − 1 {\displaystyle f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}Y^{\mathsf {T}}\Theta ^{-{\mathsf {T}}}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}\left|{\frac {\partial Y}{\partial X}}\right|^{-1}}
偏微分行列は であり 、ヤコビ行列は となる 。したがって ∂ Y i ∂ X j = Θ i , j {\displaystyle {\frac {\partial Y_{i}}{\partial X_{j}}}=\Theta _{i,j}} | ∂ Y ∂ X | = | Θ | {\displaystyle \left|{\frac {\partial Y}{\partial X}}\right|=\left|\Theta \right|} f Y ( Y ) = K | Σ | 1 / 2 | Θ | ( 1 + ν − 1 Y T Θ − T Σ − 1 Θ − 1 Y ) − ( ν + p ) / 2 {\displaystyle f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}\left|\Theta \right|}}\left(1+\nu ^{-1}Y^{\mathsf {T}}\Theta ^{-{\mathsf {T}}}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}}
分母は 次のように減算されます。 | Σ | 1 / 2 | Θ | = | Σ | 1 / 2 | Θ | 1 / 2 | Θ T | 1 / 2 = | Θ Σ Θ T | 1 / 2 {\displaystyle \left|\Sigma \right|^{1/2}\left|\Theta \right|=\left|\Sigma \right|^{1/2}\left|\Theta \right|^{1/2}\left|\Theta ^{\mathsf {T}}\right|^{1/2}=\left|\Theta \Sigma \Theta ^{\mathsf {T}}\right|^{1/2}} f Y ( Y ) = Γ [ ( ν + p ) / 2 ] Γ ( ν / 2 ) ( ν π ) p / 2 | Θ Σ Θ T | 1 / 2 ( 1 + ν − 1 Y T ( Θ Σ Θ T ) − 1 Y ) − ( ν + p ) / 2 {\displaystyle f_{Y}(Y)={\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p/2}\left|\Theta \Sigma \Theta ^{\mathsf {T}}\right|^{1/2}}}\left(1+\nu ^{-1}Y^{\mathsf {T}}\left(\Theta \Sigma \Theta ^{\mathsf {T}}\right)^{-1}Y\right)^{-\left(\nu +p\right)/2}}
これは通常のMV- t 分布です。
一般に、 およびが 完全階数を持つ場合 、 X ∼ t p ( μ , Σ , ν ) {\displaystyle X\sim t_{p}(\mu ,\Sigma ,\nu )} Θ p × p {\displaystyle \Theta ^{p\times p}} p {\displaystyle p} Θ X + c ∼ t p ( Θ μ + c , Θ Σ Θ T , ν ) {\displaystyle \Theta X+c\sim t_{p}(\Theta \mu +c,\Theta \Sigma \Theta ^{\mathsf {T}},\nu )}
周辺分布 これは、以下の階数減少線形変換の特殊なケースです。コッツは周辺分布を次のように定義しています。 要素 を2つのサブベクトルに分割します。 X ∼ t ( p , μ , Σ , ν ) {\displaystyle X\sim t(p,\mu ,\Sigma ,\nu )} p 1 , p 2 {\displaystyle p_{1},p_{2}} X p = [ X 1 X 2 ] ∼ t ( p 1 + p 2 , μ p , Σ p × p , ν ) {\displaystyle X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t\left(p_{1}+p_{2},\mu _{p},\Sigma _{p\times p},\nu \right)}
、平均 、 スケール行列 p 1 + p 2 = p {\displaystyle p_{1}+p_{2}=p} μ p = [ μ 1 μ 2 ] {\displaystyle \mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}} Σ p × p = [ Σ 11 Σ 12 Σ 21 Σ 22 ] {\displaystyle \Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}}
すると 、 X 1 ∼ t ( p 1 , μ 1 , Σ 11 , ν ) {\displaystyle X_{1}\sim t\left(p_{1},\mu _{1},\Sigma _{11},\nu \right)} X 2 ∼ t ( p 2 , μ 2 , Σ 22 , ν ) {\displaystyle X_{2}\sim t\left(p_{2},\mu _{2},\Sigma _{22},\nu \right)} f ( X 1 ) = Γ [ ( ν + p 1 ) / 2 ] Γ ( ν / 2 ) ( ν π ) p 1 / 2 | Σ 11 | 1 / 2 [ 1 + 1 ν ( X 1 − μ 1 ) T Σ 11 − 1 ( X 1 − μ 1 ) ] − ( ν + p 1 ) / 2 {\displaystyle f(X_{1})={\frac {\Gamma \left[(\nu +p_{1})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{1}/2}\left|{{\boldsymbol {\Sigma }}_{11}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})^{\mathsf {T}}{\boldsymbol {\Sigma }}_{11}^{-1}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})\right]^{-(\nu \,+\,p_{1})/2}}
f ( X 2 ) = Γ [ ( ν + p 2 ) / 2 ] Γ ( ν / 2 ) ( ν π ) p 2 / 2 | Σ 22 | 1 / 2 [ 1 + 1 ν ( X 2 − μ 2 ) T Σ 22 − 1 ( X 2 − μ 2 ) ] − ( ν + p 2 ) / 2 {\displaystyle f(X_{2})={\frac {\Gamma \left[(\nu +p_{2})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{2}/2}\left|{{\boldsymbol {\Sigma }}_{22}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})^{\mathsf {T}}{\boldsymbol {\Sigma }}_{22}^{-1}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})\right]^{-(\nu \,+\,p_{2})/2}}
変換が次のような形式で構築される場合 Θ p 1 × p = [ 1 ⋯ 0 ⋯ 0 0 ⋱ 0 ⋯ 0 0 ⋯ 1 ⋯ 0 ] {\displaystyle \Theta _{p_{1}\times \,p}={\begin{bmatrix}1&\cdots &0&\cdots &0\\0&\ddots &0&\cdots &0\\0&\cdots &1&\cdots &0\end{bmatrix}}}
すると、ベクトル は 、以下で説明するように、 の周辺分布と同じ分布になります 。 Y = Θ X {\displaystyle Y=\Theta X} X 1 {\displaystyle X_{1}}
線形変換の場合、が階数 の 矩形行列 であれば 、 結果は次元削減となる。ここで、ヤコビ行列 は一見矩形行列のように見えるが、分母の確率密度関数の値 は正しい。矩形行列の積行列式についてはAitkenの論文で議論されている。 [12] 一般に、 が フルランクであれ ば、 Θ {\displaystyle \Theta } Θ ∈ R m × p , m < p {\displaystyle \Theta \in \mathbb {R} ^{m\times p},m<p} m {\displaystyle m} | Θ | {\displaystyle \left|\Theta \right|} | Θ Σ Θ T | 1 / 2 {\displaystyle \left|\Theta \Sigma \Theta ^{\mathsf {T}}\right|^{1/2}} X ∼ t ( p , μ , Σ , ν ) {\displaystyle X\sim t(p,\mu ,\Sigma ,\nu )} Θ m × p {\displaystyle \Theta ^{m\times p}} m {\displaystyle m}
Y = Θ X + c ∼ t ( m , Θ μ + c , Θ Σ Θ T , ν ) {\displaystyle Y=\Theta X+c\sim t(m,\Theta \mu +c,\Theta \Sigma \Theta ^{\mathsf {T}},\nu )} f Y ( Y ) = Γ [ ( ν + m ) / 2 ] Γ ( ν / 2 ) ( ν π ) m / 2 | Θ Σ Θ T | 1 / 2 [ 1 + 1 ν ( Y − c 1 ) T ( Θ Σ Θ T ) − 1 ( Y − c 1 ) ] − ( ν + m ) / 2 , c 1 = Θ μ + c {\displaystyle f_{Y}(Y)={\frac {\Gamma \left[(\nu +m)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,m/2}\left|\Theta \Sigma \Theta ^{\mathsf {T}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}(Y-c_{1})^{\mathsf {T}}(\Theta \Sigma \Theta ^{\mathsf {T}})^{-1}(Y-c_{1})\right]^{-(\nu \,+\,m)/2},\;c_{1}=\Theta \mu +c}
極限において 、 m = 1 で 行ベクトルとなる場合、スカラー Yは 、同じ自由度を持つ で定義される単変量両側スチューデントt分布に従います。Kibriaらは、アフィン変換を用いて、同じくMV- t となる周辺分布を求めています 。 Θ {\displaystyle \Theta } t 2 = Y 2 / σ 2 {\displaystyle t^{2}=Y^{2}/\sigma ^{2}} ν {\displaystyle \nu }
楕円分布を持つ変数のアフィン変換中、すべてのベクトルは最終的に、要素が「絡み合った」まま統計的に独立していない 1 つの初期等方性球面ベクトルから派生する必要があります。 Z {\displaystyle Z} 独立した学生t サンプルのベクトルは 、多変量 t 分布と一致しません。 独立したカイ2乗サンプルと異なる 値で生成された 2つのサンプル多変量 tベクトルを追加すると、内部的に一貫性のある分布は生成されませんが、 ベーレンス・フィッシャー問題は 発生します 。 [13] ν {\displaystyle \nu } 1 / u 1 / ν 1 , 1 / u 2 / ν 2 {\textstyle {1}/{\sqrt {u_{1}/\nu _{1}}},\;\;{1}/{\sqrt {u_{2}/\nu _{2}}}} タレブは、ファットテール楕円分布 と 非楕円多変量分布の多くの例を比較している。
単変量統計学では、 スチューデントの t 検定は スチューデントの t 分布 を利用する。 楕円型多変量 t 分布は、多変量正規分布の元データを含む線形制約付き最小二乗解において自発的に出現します。例えば、金融ポートフォリオ分析におけるマルコウィッツ大域最小分散解 [14] [15] [2] は、正規乱数ベクトルの集合または乱数行列を扱います。これは、従属変数と独立変数を固定した通常の最小二乗法(OLS)や重回帰分析では発生しません。これらの問題は、正規分布の誤差確率が適切に振る舞う傾向があります。 ホテリングの T 二乗分布は 、多変量統計で発生する分布です。 行列 t 分布は 、 行列構造に配置されたランダム変数の分布です。
参照
参考文献 ^ ab Roth, Michael (2013年4月17日). 「多変量t分布について」 (PDF) . Automatic Control group. Linköpin University, Sweden . 2022年7月31日時点のオリジナルよりアーカイブ (PDF) . 2022年 6月1日 閲覧 。 ^ ab Bodnar, T; Okhrin, Y (2008). 「特異分布、逆分布、一般化逆分布の分割ウィシャート分布の特性」 (PDF) . Journal of Multivariate Analysis . 99 (Eqn.20): 2389– 2405. doi :10.1016/j.jmva.2008.02.024. ^ ボテフ、Z.;チェン、Y.-L. (2022年)。 「第 4 章: 指数関数的傾斜による切り捨てられた多変量スチューデントの計算」。ズドラフコのボテフで。ケラー、アレクサンダー。ルミュー、クリスティアーヌ。タフィン、ブルーノ (編)。 モデリングとシミュレーションの進歩: Pierre L'Ecuyer のフェストシュリフト 。スプリンガー。 pp. 65–87 . 土井 :10.1007/978-3-031-10193-9_4。 ISBN 978-3-031-10192-2 。 ^ Botev, ZI; L'Ecuyer, P. (2015年12月6日). 「切断された多変量学生t分布の効率的な確率推定とシミュレーション」. 2015年冬季シミュレーション会議 (WSC) . ハンティントンビーチ、カリフォルニア州、米国: IEEE. pp. 380– 391. doi :10.1109/WSC.2015.7408180. hdl : 1959.4/unsworks_38275 . ^ Genz, Alan (2009). 多変量正規分布とt分布の確率計算. 統計学講義ノート. 第195巻. Springer. doi :10.1007/978-3-642-01689-9. ISBN 978-3-642-01689-9 . 2022年8月27日時点のオリジナルよりアーカイブ 。 2017年9月5日 閲覧。 ^ ab Muirhead, Robb (1982). 多変量統計理論の諸相 . 米国: Wiley. pp. 32–36 定理1.5.4. ISBN 978-0-47 1-76985-9 。 ^ Cornish, EA (1954). 「正規分布の標本偏差値集合に関連する多変量t分布」. Australian Journal of Physics . 7 : 531–542 . doi : 10.1071/PH550193 . ^ Ding, Peng (2016). 「多変量t分布の条件付き分布について」. アメリカ統計学者 . 70 (3): 293– 295. arXiv : 1604.00561 . doi :10.1080/00031305.2016.1164756. S2CID 55842994. ^ Demarta, Stefano; McNeil, Alexander (2004). 「tコピュラと関連コピュラ」 (PDF) . Risknet . ^ Osiewalski, Jacek; Steele, Mark (1996). 「楕円標本抽出モデルにおける尺度パラメータの事後モーメント」. ベイズ分析 in Statistics and Econometrics . Wiley. pp. 323– 335. ISBN 0-471-11856-7 。 ^ Kibria, KMG; Joarder, AH (2006年1月). 「多変量t分布の簡潔なレビュー」 (PDF) . Journal of Statistical Research . 40 (1): 59– 72. doi :10.1007/s42979-021-00503-0. S2CID 232163198. ^ Aitken, AC - (1948). 『行列式と行列』 (第5版). エディンバラ: Oliver and Boyd. 第4章、第36節。 ^ Giron, Javier; del Castilo, Carmen (2010). 「多変量ベーレンス・フィッシャー分布」. Journal of Multivariate Analysis . 101 (9): 2091– 2102. doi : 10.1016/j.jmva.2010.04.008 . ^ Okhrin, Y; Schmid, W (2006). 「ポートフォリオウェイトの分布特性」. Journal of Econometrics . 134 : 235–256 . doi :10.1016/j.jeconom.2005.06.022. ^ Bodnar, T; Dmytriv, S; Parolya, N; Schmid, W (2019). 「高次元設定におけるグローバル最小分散ポートフォリオの重み付けの検定」. IEEE Transactions on Signal Processing . 67 (17): 4479– 4493. arXiv : 1710.09587 . Bibcode :2019ITSP...67.4479B. doi :10.1109/TSP.2019.2929964.
文学
外部リンク コピュラ法と標準多変量分布:一般自由度を持つ多変量スチューデントT分布 多変量スチューデントt分布
離散 一変数
連続 一変量
制限された間隔 でサポートされている 半無限 間隔 でサポートされている 実数直線 全体で サポートされている さまざまなタイプの サポート付き
混合 単変量
多変量 (ジョイント) 方向性 退化 と 特異性 家族