Concept in statistics
統計学 において 、 行列 t 分布 (または 行列変量 t 分布 )は、 多変量 t 分布 をベクトルから 行列 に一般化したものである。 [1] [2]
行列 t分布は 、行列正規分布が 多変量正規分布 と共有するの と同じ関係を多変量 t 分布と共有します 。行列が1行または1列のみの場合、分布は対応する(ベクトル)多変量分布と等しくなります。行列 t 分布は、 行列正規分布と その共分散行列のいずれかに 逆ウィシャート分布を無限に 混合 して得られる 複合分布です [1]。 多変量 t 分布も同様の方法で生成できます [2] 。
行列正規分布に基づく多変量線形回帰 モデルの ベイズ分析 では 、行列 t 分布が 事後予測分布 となる。 [3]
意味 行列 t 分布の場合、空間 の 点における 確率密度関数 は X {\displaystyle \mathbf {X} } n × p {\displaystyle n\times p}
f ( X ; ν , M , Σ , Ω ) = K × | I n + Σ − 1 ( X − M ) Ω − 1 ( X − M ) T | − ν + n + p − 1 2 , {\displaystyle f(\mathbf {X} ;\nu ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})=K\times \left|\mathbf {I} _{n}+{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-{\frac {\nu +n+p-1}{2}}},} ここで積分定数 K は次のように与えられる。
K = Γ p ( ν + n + p − 1 2 ) ( π ) n p 2 Γ p ( ν + p − 1 2 ) | Ω | − n 2 | Σ | − p 2 . {\displaystyle K={\frac {\Gamma _{p}\left({\frac {\nu +n+p-1}{2}}\right)}{(\pi )^{\frac {np}{2}}\Gamma _{p}\left({\frac {\nu +p-1}{2}}\right)}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}.} 以下は 多変数ガンマ関数 です 。 Γ p {\displaystyle \Gamma _{p}}
プロパティ ならば 、次のような性質がある: [2] X ∼ T n × p ( ν , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\mathcal {T}}_{n\times p}(\nu ,\mathbf {M} ,\mathbf {\Sigma } ,\mathbf {\Omega } )}
期待値 平均または 期待値は 次のようになります 。 ν > 1 {\displaystyle \nu >1}
E [ X ] = M {\displaystyle E[\mathbf {X} ]=\mathbf {M} } そして、次の2次期待値が成り立ちます 。 ν > 2 {\displaystyle \nu >2}
E [ ( X − M ) ( X − M ) T ] = Σ tr ( Ω ) ν − 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )(\mathbf {X} -\mathbf {M} )^{T}]={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {\Omega } )}{\nu -2}}} E [ ( X − M ) T ( X − M ) ] = Ω tr ( Σ ) ν − 2 {\displaystyle E[(\mathbf {X} -\mathbf {M} )^{T}(\mathbf {X} -\mathbf {M} )]={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {\Sigma } )}{\nu -2}}} ここで は トレース を表します 。 tr {\displaystyle \operatorname {tr} }
より一般的には、適切な次元の行列 A 、 B 、 C に対して:
E [ ( X − M ) A ( X − M ) T ] = Σ tr ( A T Ω ) ν − 2 E [ ( X − M ) T B ( X − M ) ] = Ω tr ( B T Σ ) ν − 2 E [ ( X − M ) C ( X − M ) ] = Σ C T Ω ν − 2 {\displaystyle {\begin{aligned}E[(\mathbf {X} -\mathbf {M} )\mathbf {A} (\mathbf {X} -\mathbf {M} )^{T}]&={\frac {\mathbf {\Sigma } \operatorname {tr} (\mathbf {A} ^{T}\mathbf {\Omega } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )^{T}\mathbf {B} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Omega } \operatorname {tr} (\mathbf {B} ^{T}\mathbf {\Sigma } )}{\nu -2}}\\E[(\mathbf {X} -\mathbf {M} )\mathbf {C} (\mathbf {X} -\mathbf {M} )]&={\frac {\mathbf {\Sigma } \mathbf {C} ^{T}\mathbf {\Omega } }{\nu -2}}\end{aligned}}}
転置 変換:
X T ∼ T p × n ( ν , M T , Ω , Σ ) {\displaystyle \mathbf {X} ^{T}\sim {\mathcal {T}}_{p\times n}(\nu ,\mathbf {M} ^{T},\mathbf {\Omega } ,\mathbf {\Sigma } )} 線形変換: A ( r 行 n 列) をフル ランク r ≤ n とし、 B ( p 行 s 列) をフルランク s ≤ p とすると 、次のようになります。
A X B ∼ T r × s ( ν , A M B , A Σ A T , B T Ω B ) {\displaystyle \mathbf {AXB} \sim {\mathcal {T}}_{r\times s}(\nu ,\mathbf {AMB} ,\mathbf {A\Sigma A} ^{T},\mathbf {B} ^{T}\mathbf {\Omega B} )} 特性 関数 とその他のさまざまなプロパティは、再パラメータ化された定式化から導き出すことができます (以下を参照)。
再パラメータ化された行列 t -分布 再パラメータ化された行列t 表記 T n , p ( α , β , M , Σ , Ω ) {\displaystyle {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} パラメータ M {\displaystyle \mathbf {M} } 位置 ( 実行 行列 ) スケール ( 正定値 実行 行列 ) スケール ( 正定値 実行 行列 ) 形状パラメータ n × p {\displaystyle n\times p} Ω {\displaystyle {\boldsymbol {\Omega }}} p × p {\displaystyle p\times p} Σ {\displaystyle {\boldsymbol {\Sigma }}} n × n {\displaystyle n\times n} α > ( p − 1 ) / 2 {\displaystyle \alpha >(p-1)/2}
β > 0 {\displaystyle \beta >0} スケールパラメータ サポート X ∈ R n × p {\displaystyle \mathbf {X} \in \mathbb {R} ^{n\times p}} PDF Γ p ( α + n / 2 ) ( 2 π / β ) n p 2 Γ p ( α ) | Ω | − n 2 | Σ | − p 2 {\displaystyle {\frac {\Gamma _{p}(\alpha +n/2)}{(2\pi /\beta )^{\frac {np}{2}}\Gamma _{p}(\alpha )}}|{\boldsymbol {\Omega }}|^{-{\frac {n}{2}}}|{\boldsymbol {\Sigma }}|^{-{\frac {p}{2}}}}
× | I n + β 2 Σ − 1 ( X − M ) Ω − 1 ( X − M ) T | − ( α + n / 2 ) {\displaystyle \times \left|\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right|^{-(\alpha +n/2)}} CDF 解析表現なし 平均 M {\displaystyle \mathbf {M} } の場合 、それ以外の場合は未定義 α > p / 2 {\displaystyle \alpha >p/2} 分散 2 ( Σ ⊗ Ω ) β ( 2 α − p − 1 ) {\displaystyle {\frac {2({\boldsymbol {\Sigma }}\otimes {\boldsymbol {\Omega }})}{\beta (2\alpha -p-1)}}} の場合 、それ以外の場合は未定義 α > ( p + 1 ) / 2 {\displaystyle \alpha >(p+1)/2} CF 以下を参照してください
行列 t 分布 の別のパラメータ化では、 の代わりに 2つのパラメータ とを使用する 。 [3] α {\displaystyle \alpha } β {\displaystyle \beta } ν {\displaystyle \nu }
この定式化は、次の標準行列 t 分布に帰着する。 β = 2 , α = ν + p − 1 2 . {\displaystyle \beta =2,\alpha ={\frac {\nu +p-1}{2}}.}
この行列 t 分布の定式化は、行列正規分布と、その共分散行列のいずれかに配置された 逆多変量 ガンマ分布の無限 混合 から生じる 複合分布 として導くことができます。
プロパティ もし そうなら [2] [3] X ∼ T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})}
X T ∼ T p , n ( α , β , M T , Ω , Σ ) . {\displaystyle \mathbf {X} ^{\rm {T}}\sim {\rm {T}}_{p,n}(\alpha ,\beta ,\mathbf {M} ^{\rm {T}},{\boldsymbol {\Omega }},{\boldsymbol {\Sigma }}).} 上記の性質は シルベスターの行列式定理 から来ています。
det ( I n + β 2 Σ − 1 ( X − M ) Ω − 1 ( X − M ) T ) = {\displaystyle \det \left(\mathbf {I} _{n}+{\frac {\beta }{2}}{\boldsymbol {\Sigma }}^{-1}(\mathbf {X} -\mathbf {M} ){\boldsymbol {\Omega }}^{-1}(\mathbf {X} -\mathbf {M} )^{\rm {T}}\right)=} det ( I p + β 2 Ω − 1 ( X T − M T ) Σ − 1 ( X T − M T ) T ) . {\displaystyle \det \left(\mathbf {I} _{p}+{\frac {\beta }{2}}{\boldsymbol {\Omega }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}}){\boldsymbol {\Sigma }}^{-1}(\mathbf {X} ^{\rm {T}}-\mathbf {M} ^{\rm {T}})^{\rm {T}}\right).} および およびが 非特異行列 である 場合 、 [2] [3] X ∼ T n , p ( α , β , M , Σ , Ω ) {\displaystyle \mathbf {X} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {M} ,{\boldsymbol {\Sigma }},{\boldsymbol {\Omega }})} A ( n × n ) {\displaystyle \mathbf {A} (n\times n)} B ( p × p ) {\displaystyle \mathbf {B} (p\times p)}
A X B ∼ T n , p ( α , β , A M B , A Σ A T , B T Ω B ) . {\displaystyle \mathbf {AXB} \sim {\rm {T}}_{n,p}(\alpha ,\beta ,\mathbf {AMB} ,\mathbf {A} {\boldsymbol {\Sigma }}\mathbf {A} ^{\rm {T}},\mathbf {B} ^{\rm {T}}{\boldsymbol {\Omega }}\mathbf {B} ).} 特性 関数 は [3]
ϕ T ( Z ) = exp ( t r ( i Z ′ M ) ) | Ω | α Γ p ( α ) ( 2 β ) α p | Z ′ Σ Z | α B α ( 1 2 β Z ′ Σ Z Ω ) , {\displaystyle \phi _{T}(\mathbf {Z} )={\frac {\exp({\rm {tr}}(i\mathbf {Z} '\mathbf {M} ))|{\boldsymbol {\Omega }}|^{\alpha }}{\Gamma _{p}(\alpha )(2\beta )^{\alpha p}}}|\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} |^{\alpha }B_{\alpha }\left({\frac {1}{2\beta }}\mathbf {Z} '{\boldsymbol {\Sigma }}\mathbf {Z} {\boldsymbol {\Omega }}\right),} どこ
B δ ( W Z ) = | W | − δ ∫ S > 0 exp ( t r ( − S W − S − 1 Z ) ) | S | − δ − 1 2 ( p + 1 ) d S , {\displaystyle B_{\delta }(\mathbf {WZ} )=|\mathbf {W} |^{-\delta }\int _{\mathbf {S} >0}\exp \left({\rm {tr}}(-\mathbf {SW} -\mathbf {S^{-1}Z} )\right)|\mathbf {S} |^{-\delta -{\frac {1}{2}}(p+1)}d\mathbf {S} ,} ここで、は 行列引数の ヘルツの 第2型 ベッセル関数です [ 説明が必要 ] 。 B δ {\displaystyle B_{\delta }}
参照
注記 ^ ab Zhu, Shenghuo、Kai Yu、Yihong Gong (2007). 「予測的行列変量tモデル」 JC Platt、D. Koller、Y. Singer、S. Roweis編、『 NIPS '07: Advances in Neural Information Processing Systems 20』、1721~1728ページ。MIT Press、マサチューセッツ州ケンブリッジ、2008年。この記事では、 行列正規分布の 記事との整合性を図るため、表記法を若干変更しています 。 ^ abcde Gupta, Arjun KとNagar, Daya K (1999). 行列変量分布 . CRC Press. pp. 第4章. {{cite book }}: CS1 maint: multiple names: authors list (link )^ abcde Iranmanesh, Anis, M. Arashi, SMM Tabatabaey (2010). 「行列変量正規分布の条件付き応用について」. Iranian Journal of Mathematical Sciences and Informatics , 5:2, pp. 33–43.
外部リンク
離散 一変数
連続 一変量
制限された間隔 でサポートされている 半無限 間隔 でサポートされている 実数直線 全体で サポートされている さまざまなタイプの サポート付き
混合 単変量
多変量 (ジョイント) 方向性 退化 と 特異性 家族