完全性（統計）

統計学において、完全性とは、標本データセットを用いて計算される統計量が、そのデータセットのパラメトリックモデルと関連しているかどうかという特性を指します。これは補助統計量の概念とは対照的です。補助統計量にはモデルのパラメータに関する情報は含まれませんが、完全統計量にはパラメータに関する情報のみが含まれ、補助情報は含まれません。これは、データセットがパラメータに関して提供するすべての情報を含む十分統計量の概念と密接に関連しています。 ^[1]

意味

確率分布がθによってパラメータ化されたパラメトリックモデルP _θに属するランダム変数 Xを考えます。

Tは統計量、つまりランダムサンプルX ₁、...、X _{nを使用した}測定可能な関数の合成であるとします。

統計量TがXの分布に対して完全であるとは、任意の測定可能な関数gに対して、次の条件を満たすときであると言われる。^[1]

{\text{if }}\operatorname {E} _{\theta }(g(T))=0{\text{ for all }}\theta {\text{ then }}\mathbf {P} _{\theta }(g(T)=0)=1{\text{ for all }}\theta .

この含意が、同様に有界であるすべての測定可能な関数gに当てはまる場合、統計量TはXの分布に対して有界完全で あると言われます。

例

ベルヌーイモデル

ベルヌーイモデルは完全な統計量を許容する。[ ^1]Xをn個のランダム標本とし、各X _{i が}パラメータpを持つ同じベルヌーイ分布に従うものとする。Tを標本中に観測される1の数、すなわちとする。TはXの統計量であり、パラメータ( n , p )を持つ二項分布に従う。pのパラメータ空間が(0,1)であれば、Tは完全な統計量となる。これを確認するには、次の点に注意する。 $\textstyle T=\sum _{i=1}^{n}X_{i}$

\operatorname {E} _{p}(g(T))=\sum _{t=0}^{n}{g(t){n \choose t}p^{t}(1-p)^{nt}}=(1-p)^{n}\sum _{t=0}^{n}{g(t){n \choose t}\left({\frac {p}{1-p}}\right)^{t}}.

また、pも1 − pも0にはならないことにも注意してください。したがって、次の場合のみ、 $E_{p}(g(T))=0$

\sum _{t=0}^{n}g(t){n \choose t}\left({\frac {p}{1-p}}\right)^{t}=0.

p /(1 − p ) をrで表すと次の式が得られます。

\sum _{t=0}^{n}g(t){n \choose t}r^{t}=0.

まず、 rの値域は正の実数であることに注目してください。また、E( g ( T )) はrの多項式であるため、すべての係数が 0 の場合、つまりすべてのtに対してg ( t ) = 0 の場合のみ、0 と等しくなります。

すべての係数が0でなければならないという結果は、rの範囲から得られたものであることに注意することが重要です。パラメータ空間が有限で、要素数がn以下であれば、 rの値を代入して得られたg ( t )の線形方程式を解き、0とは異なる解を得ることが可能だったかもしれません。例えば、n = 1でパラメータ空間が{0.5}の場合、観測値とパラメータ値はそれぞれ1つずつであり、Tは完全ではありません。定義から、次の点に注意してください。

g(t)=2(t-0.5),\,

すると、E( g ( T )) = 0 となりますが、g ( t ) はt = 0 でもt = 1 でも 0 にはなりません。

固定分散のガウスモデル

この例では、既知の分散を持つ正規分布から得られたサイズ2の標本X ₁、 X ₂において、統計量X ₁ + X ₂が完全かつ十分であることを示します。X ₁、X _2が独立かつ同一分布に従う確率変数であり、期待値θ、分散1の正規分布に従うと仮定します。

s((X_{1},X_{2}))=X_{1}+X_{2}

はθの完全な統計量です。

これを証明するには、次の式が成り立つような非ゼロ関数は存在しないことを示せば十分である。 $g$

g(s(X_{1},X_{2}))=g(X_{1}+X_{2})

θの値に関係なくゼロのままです。

その事実は次のように理解できる。X 1 + X 2 の確率分布は、_期待値_2θ、分散2の正規分布に従う。したがって、その確率密度関数は $x$

\exp \left(-(x-2\theta )^{2}/4\right).

したがって、上記のgの期待値は定数倍となる。

\int _{-\infty }^{\infty }g(x)\exp \left(-(x-2\theta )^{2}/4\right)\,dx.

少し代数的に計算すると、

k(\theta )\int _{-\infty }^{\infty }h(x)e^{x\theta }\,dx,

ここでk ( θ )はゼロではなく、

h(x)=g(x)e^{-x^{2}/4}.

θの関数として、これはhの両側ラプラス変換であり、hがほぼすべての点でゼロでない限り、完全にゼロになることはありません。^{[2]指数関数はゼロではないので、}gがほぼすべての点でゼロの場合にのみこれが発生します。

対照的に、この統計量は十分ではあるが完全ではない。つまり、0ではない不偏推定値、すなわち0を許容する。 ${\textstyle (X_{1},X_{2})}$ ${\textstyle X_{1}-X_{2}}$

十分であることは完全性を意味するものではない

ほとんどのパラメトリックモデルは、十分統計量を持ちますが、これは完全ではありません。これは、レーマン・シェッフェの定理をこのようなモデルに適用できないため重要です。Galili and Meilijson 2016 ^[3]は、次のような教訓的な例を提案しています。

一様分布からの独立したサンプルを考えてみましょう。 $n$

X_{i}\sim U{\big (}(1-k)\theta ,(1+k)\theta {\big )}\qquad \qquad 0<k<1

$k$ は既知の設計パラメータです。このモデルはスケール族（位置スケール族の特殊なケース）モデルです。サンプルを乗数でスケーリングすると、パラメータが乗算されます。 $c$ $\theta$

GaliliとMeilijsonは、標本の最小値と最大値を合わせると十分な統計量となることを示しています（順序統計量の通常の表記法を使用）。実際、これら2つの値を条件として、標本の残りの分布は、それらが定義する範囲において単純に一様になります。 $X_{(1)},X_{(n)}$ $\left[X_{(1)},X_{(n)}\right]$

しかし、それらの比率はに依存しない分布を示します。これは、これが尺度族であるという事実から導き出されます。尺度の変化は両方の変数に同じ影響を与えます。この分布から平均を引くと、次の式が得られます。 $\theta$ $m$

\mathbb {E} \left[{\frac {X_{(n)}}{X_{(1)}}}\right]-m=0

このように、どこにでも存在するわけではないが、期待値を持つ関数が存在することが示されました。したがって、このペアは完全ではありません。 $g\left(X_{(1)},X_{(n)}\right)$ $0$ $0$

完全性の重要性

完全性の概念は統計学、特に数理統計学の次の定理において多くの応用があります。

レーマン・シェッフェの定理

完全性はレーマン・シェッフェ定理^[1]において現れ、これは、あるパラメータθに対して不偏かつ完全で十分な統計量が存在する場合、それがθに対する最良の平均不偏推定量となることを述べている。言い換えれば、この統計量は任意の凸損失関数に対してより小さい期待損失を持つ。二乗損失関数を用いる多くの実用的応用において、この統計量は同じ期待値を持つ任意の推定量の中でより小さい平均二乗誤差を持つ。

最小十分統計量が完全でない場合、 θの不偏推定値として複数の代替統計量が存在するが、そのうちのいくつかは他のものよりも分散が低いという例がある。^[3]

最小分散不偏推定量も参照してください。

バスの定理

有界完全性はBasuの定理^[1]で発生し、有界完全 かつ十分な統計量は補助統計量から独立していることを述べています。

バハドゥールの定理

有界完全性はバハドゥールの定理にも当てはまる。少なくとも一つの最小十分統計量が存在する場合、十分かつ有界完全である統計量は必然的に最小十分である。^[4]

注記

^ abcde Casella, George; Berger, Roger W. (2001).統計的推論. CRC Press. ISBN 978-1-032-59303-6。
^ Lynn, Paul A. (1986). 「ラプラス変換とZ変換」. 『電子信号とシステム』 . ロンドン: Macmillan Education UK. pp. 225– 272. doi :10.1007/978-1-349-18461-3_6. ISBN 978-0-333-39164-8。
^ Tal Galili; Isaac Meilijson (2016年3月31日). 「改善可能なRao–Blackwell改善法、非効率的な最尤推定法、および不偏一般化ベイズ推定法の例」. The American Statistician . 70 (1): 108– 113. doi :10.1080/00031305.2015.1100683. PMC 4960505. PMID 27499547 .
^ Bahadur, RR (1957). 「一様最小分散の不偏推定値について」. Sankhyā: The Indian Journal of Statistics (1933-1960) . 18 (3/4): 211– 224. ISSN 0036-4452.

[casellaberger-1] Casella, George; Berger, Roger W. (2001).統計的推論. CRC Press. ISBN 978-1-032-59303-6。

[Lynn_1986_pp._225–272-2] Lynn, Paul A. (1986). 「ラプラス変換とZ変換」. 『電子信号とシステム』 . ロンドン: Macmillan Education UK. pp. 225– 272. doi :10.1007/978-1-349-18461-3_6. ISBN 978-0-333-39164-8。

[galili-3] Tal Galili; Isaac Meilijson (2016年3月31日). 「改善可能なRao–Blackwell改善法、非効率的な最尤推定法、および不偏一般化ベイズ推定法の例」. The American Statistician . 70 (1): 108– 113. doi :10.1080/00031305.2015.1100683. PMC 4960505. PMID 27499547 .

[4] Bahadur, RR (1957). 「一様最小分散の不偏推定値について」. Sankhyā: The Indian Journal of Statistics (1933-1960) . 18 (3/4): 211– 224. ISSN 0036-4452.