Notions of probabilistic convergence, applied to estimation and asymptotic analysis
確率論 では 、 確率変数の列の 収束について、 確率収束 、 分布収束 、 ほぼ確実な収束 など、いくつかの異なる概念が存在します。収束に関する異なる概念は、列に関する異なる特性を捉えており、収束の概念の中には他の概念よりも強いものもあります。例えば、分布収束は、確率変数の列の極限 分布 について教えてくれます。これは、分布だけでなく、確率変数が取る値について教えてくれる確率収束よりも弱い概念です。
この概念は確率論、そしてその 統計学 や 確率過程への応用において重要です。より一般的な 数学 では、同じ概念が 確率収束 として知られており 、本質的にランダムまたは予測不可能な一連の事象の特定の特性は、その一連の事象の十分奥にある項目を調べると、本質的に不変の挙動に落ち着くことが期待できるという考えを形式化したものです。収束に関する様々な概念は、そのような挙動をどのように特徴付けるかに関係しています。よく理解されている2つの挙動は、一連の事象が最終的に一定値を取るというものであり、また、一連の事象内の値は変化し続けるものの、不変の確率分布で記述できるというものです。
背景 「確率的収束」とは、本質的にランダムまたは予測不可能な一連の事象が、時としてあるパターンに落ち着くことが期待できるという考えを定式化したものである。そのパターンとは、例えば以下のようなものである。
古典的な意味での固定値への 収束、おそらくそれ自体はランダムなイベントから生じる 純粋に決定論的な関数が生成する結果との類似性が高まっている 特定の結果に対する好みの増加 特定の結果から大きく逸脱することに対する「嫌悪感」の高まり 次の結果を記述する確率分布は、特定の分布にますます類似するようになる可能性がある あまり明白ではない、より理論的なパターンとしては、
発生する可能性のあるこれらの他のタイプのパターンは、研究されてきたさまざまな種類の確率的収束に反映されています。
上記の議論は、単一の級数が極限値に収束することに関するものですが、2 つの級数が互いに収束するという概念も重要です。ただし、これは、2 つの級数の差または比率として定義されるシーケンスを調べることで簡単に処理できます。
例えば、 すべて同じ有限 平均 と 分散を持つ n個の 独立した 確率変数の平均 が次のように与えられるとします。 Y i , i = 1 , … , n {\displaystyle Y_{i},\ i=1,\dots ,n}
X n = 1 n ∑ i = 1 n Y i , {\displaystyle X_{n}={\frac {1}{n}}\sum _{i=1}^{n}Y_{i}\,,} が無限大に向かうにつれて 、 確率収束(下記参照)は 確率変数の 共通 平均 、に 収束します 。この結果は 大数の弱法則として知られています。他の収束の形態は、 中心極限定理 など、他の有用な定理においても重要です 。 n {\displaystyle n} X n {\displaystyle X_{n}} μ {\displaystyle \mu } Y i {\displaystyle Y_{i}}
以下では、 がランダム変数の列であり、 が ランダム変数であり、それらすべてが同じ 確率空間 上で定義されていると仮定します。 ( X n ) {\displaystyle (X_{n})} X {\displaystyle X} ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P} )}
分布の収束 分布の収束の例 新しいサイコロ工場ができたと仮定しましょう。最初の数個のサイコロは、製造工程の不完全さのために、かなり偏った出目になります。それらのサイコロを投げた結果は、望ましい 均一分布 とは大きく異なる分布に従うでしょう。 工場の改良が進むにつれて、サイコロの偏りは徐々に少なくなり、新しく製造されたサイコロを投げた結果は、均一分布にますます近づくでしょう。 X n を、 偏りのないコインをn 回投げたときの表が出る割合とします 。 すると、 X 1 は期待値 μ = 0.5 、分散 σ 2 = 0.25の ベルヌーイ分布 に従います 。以降の確率変数 X 2 、 X 3 、…はすべて 二項 分布します 。n が 大きくなるにつれて、この分布は徐々に 正規分布の ベル曲線 に似た形になり始めます。X n を 適切 にシフトおよび再スケーリングすると、分布 は標準正規 分布に収束 します。これは、有名な 中心極限定理 から導かれる結果です。 Z n = n σ ( X n − μ ) {\displaystyle \scriptstyle Z_{n}={\frac {\sqrt {n}}{\sigma }}(X_{n}-\mu )} { X i }が 一様 U (−1, 1) 確率変数 の iid 列である とする。それらの(正規化された)和を とする。 中心極限定理 によれば、 Z n の分布は 正規分布 N (0, Z n = 1 n ∑ i = 1 n X i {\displaystyle \scriptstyle Z_{n}={\scriptscriptstyle {\frac {1}{\sqrt {n}}}}\sum _{i=1}^{n}X_{i}} 1 / 3 ) 分布。この収束は図に示されています。n が 大きくなるにつれて、確率密度関数の形状はガウス曲線にどんどん近づいていきます。
大まかに言えば、この収束のモードにより、一連のランダム実験における次の結果が、与えられた 確率分布 によってより良くモデル化されるようになることが期待されます。より正確には、一連のランダム実験における関連するランダム変数の分布は、指定された固定分布に任意に近づきます。
分布収束は、本稿で言及する他のすべての収束の種類によって必然的に導かれるため、一般的に議論される収束の中で最も弱い形態です。しかしながら、分布収束は実務において非常に頻繁に用いられ、ほとんどの場合、 中心極限定理 の適用から生じます。
意味 累積分布関数 を持つ 実数値 確率変数 の列は、 累積分布関数 F を持つ 確率変数 Xに 分布収束 、 弱収束 、または 法則収束する とは、次の 場合を言う。 X 1 , X 2 , … {\displaystyle X_{1},X_{2},\ldots } F 1 , F 2 , … {\displaystyle F_{1},F_{2},\ldots }
lim n → ∞ F n ( x ) = F ( x ) , {\displaystyle \lim _{n\to \infty }F_{n}(x)=F(x),} が 連続する任意 の 数に対して 。 x ∈ R {\displaystyle x\in \mathbb {R} } F {\displaystyle F}
の連続点のみを考慮する必要があるという要件は 重要です。例えば、が 区間 に 一様に 分布している場合、この数列は 退化した 確率変数 に分布収束します 。実際、の ときは すべての に対して が、の とき はすべての に対して が成り立ちます 。しかし、この極限確率変数 の場合 、 すべての に対してであっても が成り立ちます。したがって、 が不連続な 点 では、累積分布関数の収束は失敗します 。 F {\displaystyle F} X n {\displaystyle X_{n}} ( 0 , 1 n ) {\displaystyle \left(0,{\frac {1}{n}}\right)} X = 0 {\displaystyle X=0} F n ( x ) = 0 {\displaystyle F_{n}(x)=0} n {\displaystyle n} x ≤ 0 {\displaystyle x\leq 0} F n ( x ) = 1 {\displaystyle F_{n}(x)=1} x ≥ 1 n {\displaystyle x\geq {\frac {1}{n}}} n > 0 {\displaystyle n>0} F ( 0 ) = 1 {\displaystyle F(0)=1} F n ( 0 ) = 0 {\displaystyle F_{n}(0)=0} n {\displaystyle n} x = 0 {\displaystyle x=0} F {\displaystyle F}
分布の収束は次のように表される。
X n → d X , X n → D X , X n → L X , X n → d L X , X n ⇝ X , X n ⇒ X , L ( X n ) → L ( X ) , {\displaystyle {\begin{aligned}{}&X_{n}\ \xrightarrow {d} \ X,\ \ X_{n}\ \xrightarrow {\mathcal {D}} \ X,\ \ X_{n}\ \xrightarrow {\mathcal {L}} \ X,\ \ X_{n}\ \xrightarrow {d} \ {\mathcal {L}}_{X},\\&X_{n}\rightsquigarrow X,\ \ X_{n}\Rightarrow X,\ \ {\mathcal {L}}(X_{n})\to {\mathcal {L}}(X),\\\end{aligned}}} 1
ここでは X の法則(確率分布)です 。例えば、 X が 標準正規分布であれば と書きます 。 L X {\displaystyle \scriptstyle {\mathcal {L}}_{X}} X n → d N ( 0 , 1 ) {\displaystyle X_{n}\,{\xrightarrow {d}}\,{\mathcal {N}}(0,\,1)}
ランダムベクトル の場合、 分布収束は同様に定義されます。この列が ランダム k ベクトル Xに 分布収束する とは、 { X 1 , X 2 , … } ⊂ R k {\displaystyle \left\{X_{1},X_{2},\dots \right\}\subset \mathbb {R} ^{k}}
lim n → ∞ P ( X n ∈ A ) = P ( X ∈ A ) {\displaystyle \lim _{n\to \infty }\mathbb {P} (X_{n}\in A)=\mathbb {P} (X\in A)} 任意の X の 連続集合 に対して 。 A ⊂ R k {\displaystyle A\subset \mathbb {R} ^{k}}
分布における収束の定義は、ランダムベクトルから、任意の 計量空間 におけるより一般的な ランダム要素、さらには測定不可能な「ランダム変数」にまで拡張することができる。これは、例えば 経験的過程 の研究において生じる状況である 。これは「法則が定義されていない法則の弱い収束」であるが、漸近的な収束は除かれる。 [1]
この場合は 弱収束 という用語が適切であり( 測度の弱収束 を参照)、ランダム要素の列 { X n }が X に弱収束する ( X n ⇒ X と表記)とは、
E ∗ h ( X n ) → E h ( X ) {\displaystyle \mathbb {E} ^{*}h(X_{n})\to \mathbb {E} \,h(X)} 全ての連続有界関数 hに対して 成り立つ 。 [2] ここでE*は 外部期待値 、つまり「 h ( Xn ) を支配する最小の測定可能な関数 g 」の期待値を表す。
プロパティ なので、分布の収束とは、 n が 十分に大きい場合、 X n が特定の範囲に入る確率が、 X の値が その範囲に入る確率とほぼ等しいことを意味します 。 F ( a ) = P ( X ≤ a ) {\displaystyle F(a)=\mathbb {P} (X\leq a)} 一般に、分布の収束は、対応する確率密度関数 の列 も収束することを意味するものではない。例えば、密度が f n ( x ) = (1 + cos(2 πnx )) 1 (0,1) である確率変数を考える。これらの確率変数は分布において一様分布 U (0, 1) に収束するが、その密度は全く収束しない。 [3] しかし、 シェッフェの定理 によれば、 確率密度関数 の収束は分布の収束を意味する。 [4] ポルト マントー補題は、 分布収束に関する複数の同値な定義を提供する。これらの定義は直感的ではないものの、多くの統計定理の証明に用いられている。この補題は、 { X n }が 分布収束において X に収束する場合、以下のいずれかの条件が成立する、かつその場合に限る、と述べている。 [5] P ( X n ≤ x ) → P ( X ≤ x ) {\displaystyle \mathbb {P} (X_{n}\leq x)\to \mathbb {P} (X\leq x)} のすべての連続点について ; x ↦ P ( X ≤ x ) {\displaystyle x\mapsto \mathbb {P} (X\leq x)} E f ( X n ) → E f ( X ) {\displaystyle \mathbb {E} f(X_{n})\to \mathbb {E} f(X)} すべての有界 連続関数 (ただし 、 期待値 演算子を表す ) に対して、 f {\displaystyle f} E {\displaystyle \mathbb {E} } E f ( X n ) → E f ( X ) {\displaystyle \mathbb {E} f(X_{n})\to \mathbb {E} f(X)} すべての有界 リプシッツ関数 に対して; f {\displaystyle f} lim inf E f ( X n ) ≥ E f ( X ) {\displaystyle \lim \inf \mathbb {E} f(X_{n})\geq \mathbb {E} f(X)} すべての非負連続関数に対して ; f {\displaystyle f} lim inf P ( X n ∈ G ) ≥ P ( X ∈ G ) {\displaystyle \lim \inf \mathbb {P} (X_{n}\in G)\geq \mathbb {P} (X\in G)} すべての開集合 に対して ; G {\displaystyle G} lim sup P ( X n ∈ F ) ≤ P ( X ∈ F ) {\displaystyle \lim \sup \mathbb {P} (X_{n}\in F)\leq \mathbb {P} (X\in F)} すべての閉集合 に対して ; F {\displaystyle F} P ( X n ∈ B ) → P ( X ∈ B ) {\displaystyle \mathbb {P} (X_{n}\in B)\to \mathbb {P} (X\in B)} 確率変数のすべての 連続集合 について ; B {\displaystyle B} X {\displaystyle X} lim sup E f ( X n ) ≤ E f ( X ) {\displaystyle \limsup \mathbb {E} f(X_{n})\leq \mathbb {E} f(X)} 任意の 上側半連続 関数 に対して; [ 要出典 ] f {\displaystyle f} lim inf E f ( X n ) ≥ E f ( X ) {\displaystyle \liminf \mathbb {E} f(X_{n})\geq \mathbb {E} f(X)} 下側で有界なすべての下側半連続 関数 に対して 。 [ 要出典 ] f {\displaystyle f} 連続 写像定理は 、連続関数 g に対して、シーケンス { X n } が X に分布収束する場合 、 { g ( X n )} は g ( X ) に分布収束することを述べています 。 ただし、 { X n }から X への分布の収束 、および { Y n }から Y への分布の収束 は、一般に { X n + Y n } から X + Y への分布の収束、 または { X n Y n }から XY への分布の収束を意味するもの ではないことに 注意してください。 レヴィの連続性定理 :対応する 特性関数の列 { φ n } が X の 特性関数 φに 点収束する 場合に限り、列 { X n }は X に分布収束する 。 分布の収束は レヴィ・プロホロフ計量 によって 計量化可能 である。 分布の収束への自然なつながりは、 スコロホードの表現定理 です。
確率の収束 確率収束の例 次の実験を考えてみましょう。まず、街中でランダムに人を選びます。 その人の身長を Xとします。これは 事前に 確率変数です。次に、他の人にこの身長を目測で推定してもらいます。最初の n 回の回答の平均を X n とします。すると(系統的誤差 がないと仮定すると ) 、 大数の法則 により、数列 X n は確率的に確率変数X に収束します 。 乱数ジェネレータが 0 から 1 の間の疑似乱数浮動小数点数を生成するとします。乱数変数 X が アルゴリズムによる可能な出力の分布を表すものとします。疑似乱数は決定論的に生成されるため、次の値は完全にランダムではありません。ランダムに生成された数のシーケンスを観察すると、パターンを推測して、次にランダムに生成される数が何であるかをますます正確に予測できるとします。最初の n 個の乱数を観察した後に、次の乱数の値を推測した値を X n とします。パターンを学習して推測がより正確になるにつれて、 X n の分布がX の分布に収束するだけでなく、 X n の結果も X の結果に収束します 。
このタイプの収束の基本的な考え方は、シーケンスが進むにつれて「異常な」結果の確率がどんどん小さくなるというものです。
確率収束の概念は統計学において非常に頻繁に用いられます。例えば、推定量が推定対象量に確率収束する場合、その推定量は 整合的であると呼ばれます。確率収束は 、大数の弱法則 によって確立される収束の一種でもあります 。
意味 確率変数の 列{ X n }は、すべてのε > 0 に対して 確率的に 確率変数 Xに収束する。
lim n → ∞ P ( | X n − X | > ε ) = 0. {\displaystyle \lim _{n\to \infty }\mathbb {P} {\big (}|X_{n}-X|>\varepsilon {\big )}=0.} より明確に言えば、 P n ( ε ) を 、 X n が 半径ε で中心が X である球体の外側に存在する 確率とします 。すると、任意の ε > 0 および任意の δ > 0に対して、任意の n ≥ Nに対して P n ( ε ) < δ を満たすような 数 N ( ε および δ に依存する )が存在するとき 、 X n は 確率的にX に収束するといいます(極限の定義)。
条件を満たすためには、各n に対して確率変数 X と X n が 独立であることは不可能である (したがって、確率収束は結合累積分布関数の条件であるのに対し、分布収束は個々の累積分布関数の条件である)。ただし、 X が弱大数の法則のように決定論的である場合は除く。同時に、決定論的な X の場合 、決定論的な値が不連続点(孤立点ではない)である場合は、分布収束では扱うことができず、不連続点は明示的に除外する必要がある。
確率の収束は、収束を示す矢印の上に 文字 pを追加するか、または「plim」確率限界演算子を使用することによって示されます。
X n → p X , X n → P X , plim n → ∞ X n = X . {\displaystyle X_{n}\ \xrightarrow {p} \ X,\ \ X_{n}\ \xrightarrow {P} \ X,\ \ {\underset {n\to \infty }{\operatorname {plim} }}\,X_{n}=X.} 2
分離可能な計量空間 ( S 、 d ) 上の ランダム元{ Xn } に対して、確率収束は同様に [6]によって定義される。
∀ ε > 0 , P ( d ( X n , X ) ≥ ε ) → 0. {\displaystyle \forall \varepsilon >0,\mathbb {P} {\big (}d(X_{n},X)\geq \varepsilon {\big )}\to 0.}
プロパティ 確率の収束は分布の収束を意味する。 [証明] 逆に、限界確率変数 X が定数である場合、分布の収束は確率の収束を意味します。 [証明] 確率収束はほぼ確実な収束を意味するものではない。 [証明] 連続 写像定理は、 すべての連続関数 に対して 、 で あれば も 成り立つことを述べています 。 g {\displaystyle g} X n → p X {\textstyle X_{n}\xrightarrow {p} X} g ( X n ) → p g ( X ) {\textstyle g(X_{n})\xrightarrow {p} g(X)} 確率収束は、 固定確率空間上の確率変数空間上の 位相を定義する。この位相は Ky Fan 計量 によって 計量化可能 である: [7] あるいは、この計量によって計量化可能である。 d ( X , Y ) = inf { ε > 0 : P ( | X − Y | > ε ) ≤ ε } {\displaystyle d(X,Y)=\inf \!{\big \{}\varepsilon >0:\ \mathbb {P} {\big (}|X-Y|>\varepsilon {\big )}\leq \varepsilon {\big \}}} d ( X , Y ) = E [ min ( | X − Y | , 1 ) ] . {\displaystyle d(X,Y)=\mathbb {E} \left[\min(|X-Y|,1)\right].}
反例 分布において別の確率変数に収束する確率変数の列のすべてが、確率においてもその確率変数に収束するわけではありません。例として、標準正規確率変数の列 と、別の列を考えてみましょう 。 の分布は、 すべての に対して の分布と等しいことに注意してください 。しかし、 X n {\displaystyle X_{n}} Y n = ( − 1 ) n X n {\displaystyle Y_{n}=(-1)^{n}X_{n}} Y n {\displaystyle Y_{n}} X n {\displaystyle X_{n}} n {\displaystyle n} P ( | X n − Y n | ≥ ϵ ) = P ( | X n | ⋅ | ( 1 − ( − 1 ) n ) | ≥ ϵ ) {\displaystyle P(|X_{n}-Y_{n}|\geq \epsilon )=P(|X_{n}|\cdot |(1-(-1)^{n})|\geq \epsilon )}
これは に収束しません 。したがって、確率収束は起こりません。 0 {\displaystyle 0}
ほぼ確実な収束 ほぼ確実な収束の例 寿命の短い動物を考えてみましょう。この動物が1日に摂取する食物の量を記録します。この数値の並びは予測できませんが、ある日その数値がゼロになり、その後ずっとゼロのままであることは ほぼ確実 です。 毎朝7枚のコインを投げる男性を考えてみましょう。彼は毎日午後、表が出た回数に応じて1ポンドを慈善団体に寄付します。しかし、初めてすべて裏だった場合、彼は永久に寄付をやめます。X 1 、 X 2 、…を、 慈善団体が彼から受け取る毎日の金額とします。ある日 、 この金額がゼロになり、その後は永遠にゼロのままであることは ほぼ確実 です。しかし、 有限の 日数を考えると 、終了条件が発生しない確率はゼロではありません。
これは、初等実解析 から知られている 点単位の収束 に最も類似したタイプの確率収束です 。
意味 数列 X n が ほぼ確実に 、 ほぼどこでも 、 確率1で 、あるいは 強く X に 収束すると言うこと は、 P ( lim n → ∞ X n = X ) = 1. {\displaystyle \mathbb {P} \!\left(\lim _{n\to \infty }\!X_{n}=X\right)=1.}
これは、 X n の値が X の値に近づくことを意味し、 X n が X に収束しない 事象の確率が0であるという意味である ( ほぼ確実に を参照)。確率空間と、Ωから R への関数としての確率変数の概念を用いると 、これは以下の式と等価である。 ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},\mathbb {P} )} P ( ω ∈ Ω : lim n → ∞ X n ( ω ) = X ( ω ) ) = 1. {\displaystyle \mathbb {P} {\Bigl (}\omega \in \Omega :\lim _{n\to \infty }X_{n}(\omega )=X(\omega ){\Bigr )}=1.}
集合の列の優位極限 の概念を使用すると 、ほぼ確実な収束は次のように定義することもできます。 P ( lim sup n → ∞ { ω ∈ Ω : | X n ( ω ) − X ( ω ) | > ε } ) = 0 for all ε > 0. {\displaystyle \mathbb {P} {\Bigl (}\limsup _{n\to \infty }{\bigl \{}\omega \in \Omega :|X_{n}(\omega )-X(\omega )|>\varepsilon {\bigr \}}{\Bigr )}=0\quad {\text{for all}}\quad \varepsilon >0.}
ほぼ確実な収束は、収束を示す矢印の上に という 文字を追加することで表されることが多いです。
X n → a . s . X . {\displaystyle {\overset {}{X_{n}\,{\xrightarrow {\mathrm {a.s.} }}\,X.}}} 3
距離空間上の一般的な ランダム元 { X n } の場合 、収束はほぼ確実に同様に定義されます。 ( S , d ) {\displaystyle (S,d)} P ( ω ∈ Ω : d ( X n ( ω ) , X ( ω ) ) ⟶ n → ∞ 0 ) = 1 {\displaystyle \mathbb {P} {\Bigl (}\omega \in \Omega \colon \,d{\big (}X_{n}(\omega ),X(\omega ){\big )}\,{\underset {n\to \infty }{\longrightarrow }}\,0{\Bigr )}=1}
プロパティ ほぼ確実な収束は確率収束を意味し( ファトゥの補題より)、したがって分布収束も意味する。これは 大数の 強法則で用いられる収束の概念である 。 ほぼ確実な収束という概念は、確率変数空間上の 位相 から生まれたものではない。つまり、ほぼ確実に収束する列が、その位相に関して収束する列と完全に一致するような、確率変数空間上の位相は存在しない。特に、ほぼ確実な収束の尺度は存在しない。
反例 およびと なる独立確率変数の 列を考えます 。 は となり 、確率的に に収束します 。 { X n } {\displaystyle \{X_{n}\}} P ( X n = 1 ) = 1 n {\displaystyle P(X_{n}=1)={\frac {1}{n}}} P ( X n = 0 ) = 1 − 1 n {\displaystyle P(X_{n}=0)=1-{\frac {1}{n}}} 0 < ε < 1 / 2 {\displaystyle 0<\varepsilon <1/2} P ( | X n | ≥ ε ) = 1 n {\displaystyle P(|X_{n}|\geq \varepsilon )={\frac {1}{n}}} 0 {\displaystyle 0} X n → 0 {\displaystyle X_{n}\to 0}
であり、イベントは 独立しているので、 第 2 ボレルのカンテリの補題 により、 シーケンスはほとんどどこ にも収束しない ことが保証されます (実際、このシーケンスが収束しないセットには 確率 があります )。 ∑ n ≥ 1 P ( X n = 1 ) → ∞ {\displaystyle \sum _{n\geq 1}P(X_{n}=1)\to \infty } { X n = 1 } {\displaystyle \{X_{n}=1\}} P ( lim sup n { X n = 1 } ) = 1 {\displaystyle P(\limsup _{n}\{X_{n}=1\})=1} { X n } {\displaystyle \{X_{n}\}} 0 {\displaystyle 0} 0 {\displaystyle 0} 1 {\displaystyle 1}
確実な収束か点ごとの収束か 同じ 確率空間 (つまり ランダムプロセス )上で定義された 確率変数 の列 ( X n )がX に向かって 確実に 収束するか、 あらゆる点で 収束するか、 点ごとに収束 する
ということは、
∀ ω ∈ Ω : lim n → ∞ X n ( ω ) = X ( ω ) , {\displaystyle \forall \omega \in \Omega \colon \ \lim _{n\to \infty }X_{n}(\omega )=X(\omega ),}
ここで、Ω は ランダム変数が定義される
基礎となる 確率空間 の サンプル空間です。
これは、関数の列がランダム変数 の列に拡張されて 点ごとに収束する という概念です 。(ランダム変数自体は関数であることに注意してください)。
{ ω ∈ Ω : lim n → ∞ X n ( ω ) = X ( ω ) } = Ω . {\displaystyle \left\{\omega \in \Omega :\lim _{n\to \infty }X_{n}(\omega )=X(\omega )\right\}=\Omega .}
確率変数の確実な収束は、上記で述べた他のすべての種類の収束を意味しますが、 確率論 においては、確実な収束とほぼ確実な収束を比較してもメリットはありません。両者の違いは、確率がゼロの集合においてのみ存在します。これが、確率変数の確実な収束という概念がほとんど用いられない理由です。
平均の収束 実数 r ≥ 1 が 与え られ た
とき 、 X n と X の r 次 の 絶対 モーメント ( | X n | r ) と ( | X | r ) が 存在 し 、 かつ E {\displaystyle \mathbb {E} } E {\displaystyle \mathbb {E} }
lim n → ∞ E ( | X n − X | r ) = 0 , {\displaystyle \lim _{n\to \infty }\mathbb {E} \left(|X_{n}-X|^{r}\right)=0,} ここで、演算子 E は 期待値 を表します。r 次平均収束 と は、 と の差の r 乗の期待値が ゼロに収束することを意味します。 X n {\displaystyle X_{n}} X {\displaystyle X}
このタイプの収束は、収束を示す矢印の上に 文字 L r を追加することで示されることが多いです。
X n → L r X . {\displaystyle {\overset {}{X_{n}\,{\xrightarrow {L^{r}}}\,X.}}} 4
r 次の平均の収束の最も重要なケースは 次のとおりです。
X n が r = 1に対して r 次 平均 で X に収束する場合、 X n は 平均で X に 収束する といいます 。 X n が r = 2に対して r 次平均 で X に収束する場合、 X n は 二乗平均 (または 二次平均 )で X に収束すると いいます 。 r ≥ 1の場合、 r 次の平均の収束は 、確率収束を意味します( マルコフの不等式 により)。さらに、 r > s ≥ 1 の場合、 r 次の平均の収束は s 次の平均の収束を意味します。したがって、平均二乗の収束は平均の収束を意味します。
さらに、
X n → L r X ⇒ lim n → ∞ E [ | X n | r ] = E [ | X | r ] . {\displaystyle {\overset {}{X_{n}\xrightarrow {L^{r}} X}}\quad \Rightarrow \quad \lim _{n\to \infty }\mathbb {E} [|X_{n}|^{r}]=\mathbb {E} [|X|^{r}].} 逆は必ずしも真ではありませんが、 ( シェッフェの補題 のより一般的なバージョンにより ) 場合は真となります。 X n → p X {\displaystyle {\overset {}{X_{n}\,\xrightarrow {p} \,X}}}
プロパティ 確率空間が 完備で あると仮定すると:
かつ ならば 、 ほぼ 確実に となります 。 X n → p X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{p}}}\ X} X n → p Y {\displaystyle X_{n}\ {\xrightarrow {\overset {}{p}}}\ Y} X = Y {\displaystyle X=Y} かつ であれ ば、 ほぼ確実です。 X n → a.s. X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{\text{a.s.}}}}\ X} X n → a.s. Y {\displaystyle X_{n}\ {\xrightarrow {\overset {}{\text{a.s.}}}}\ Y} X = Y {\displaystyle X=Y} かつ であれ ば、 ほぼ確実です。 X n → L r X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ X} X n → L r Y {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ Y} X = Y {\displaystyle X=Y} および の 場合 、 (任意の実数 a および b に対して) および となります 。 X n → p X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{p}}}\ X} Y n → p Y {\displaystyle Y_{n}\ {\xrightarrow {\overset {}{p}}}\ Y} a X n + b Y n → p a X + b Y {\displaystyle aX_{n}+bY_{n}\ {\xrightarrow {\overset {}{p}}}\ aX+bY} X n Y n → p X Y {\displaystyle X_{n}Y_{n}{\xrightarrow {\overset {}{p}}}\ XY} および の 場合 、 (任意の実数 a および b に対して) および となります 。 X n → a.s. X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{\text{a.s.}}}}\ X} Y n → a.s. Y {\displaystyle Y_{n}\ {\xrightarrow {\overset {}{\text{a.s.}}}}\ Y} a X n + b Y n → a.s. a X + b Y {\displaystyle aX_{n}+bY_{n}\ {\xrightarrow {\overset {}{\text{a.s.}}}}\ aX+bY} X n Y n → a.s. X Y {\displaystyle X_{n}Y_{n}{\xrightarrow {\overset {}{\text{a.s.}}}}\ XY} かつの 場合 、 (任意の実数 a および b に対して) 。 X n → L r X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ X} Y n → L r Y {\displaystyle Y_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ Y} a X n + b Y n → L r a X + b Y {\displaystyle aX_{n}+bY_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ aX+bY} 上記の記述はいずれも分布の収束には当てはまりません。 収束に関する様々な概念間の含意の連鎖は、それぞれの節で説明されている。矢印表記を用いると、以下のようになる。
→ L s ⇒ s > r ≥ 1 → L r ⇓ → a.s. ⇒ → p ⇒ → d {\displaystyle {\begin{matrix}{\xrightarrow {\overset {}{L^{s}}}}&{\underset {s>r\geq 1}{\Rightarrow }}&{\xrightarrow {\overset {}{L^{r}}}}&&\\&&\Downarrow &&\\{\xrightarrow {\text{a.s.}}}&\Rightarrow &{\xrightarrow {p}}&\Rightarrow &{\xrightarrow {d}}\end{matrix}}} これらの特性は、他のいくつかの特殊なケースとともに、次のリストにまとめられています。
ほぼ確実な収束は確率収束を意味する: [8] [証明] X n → a.s. X ⇒ X n → p X {\displaystyle X_{n}\ {\xrightarrow {\text{a.s.}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {\overset {}{p}}}\ X} 確率収束は、ほぼ確実に収束する 部分列が存在することを意味する。 [9] ( n k ) {\displaystyle (n_{k})} X n → p X ⇒ X n k → a.s. X {\displaystyle X_{n}\ \xrightarrow {\overset {}{p}} \ X\quad \Rightarrow \quad X_{n_{k}}\ \xrightarrow {\text{a.s.}} \ X} 確率収束は分布収束を意味する: [8] [証明] X n → p X ⇒ X n → d X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{p}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {\overset {}{d}}}\ X} r 次 の平均の収束は確率の収束を意味する: X n → L r X ⇒ X n → p X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {\overset {}{p}}}\ X} 両方の次数が 1 以上であると仮定すると、 r 次の平均の収束は、より低い次数の平均の収束を意味します。 X n → L r X ⇒ X n → L s X , {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ X\quad \Rightarrow \quad X_{n}\ {\xrightarrow {\overset {}{L^{s}}}}\ X,} ただし r ≥ s ≥ 1とする。 X n が 分布収束において定数 c に収束する場合 、 X n は 確率的に c に収束する: [8] [証明] X n → d c ⇒ X n → p c , {\displaystyle X_{n}\ {\xrightarrow {\overset {}{d}}}\ c\quad \Rightarrow \quad X_{n}\ {\xrightarrow {\overset {}{p}}}\ c,} ただし、 c は定数です。 X n が 分布収束において Xに収束し、 X n と Y n の差が 確率収束においてゼロに収束する 場合、 Y n も分布収束においてX に収束する : [8] [証明] X n → d X , | X n − Y n | → p 0 ⇒ Y n → d X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{d}}}\ X,\ \ |X_{n}-Y_{n}|\ {\xrightarrow {\overset {}{p}}}\ 0\ \quad \Rightarrow \quad Y_{n}\ {\xrightarrow {\overset {}{d}}}\ X} X n が X に分布収束し 、 Y n が 定数 c に分布収束する場合 、結合ベクトル ( X n , Y n )は ( X , c ) {\displaystyle (X,c)} に分布収束する : [8] [証明] X n → d X , Y n → d c ⇒ ( X n , Y n ) → d ( X , c ) {\displaystyle X_{n}\ {\xrightarrow {\overset {}{d}}}\ X,\ \ Y_{n}\ {\xrightarrow {\overset {}{d}}}\ c\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {\overset {}{d}}}\ (X,c)} ただし、 c は定数です。 Y n が 定数に収束するという条件が重要であることに注意してください。ランダム変数 Y に収束する場合、 ( X n 、 Y n )が ( X , Y ) {\displaystyle (X,Y)} に収束する と結論付けることはできません 。 X n が 確率収束で X に収束し、 Y n が 確率収束で Y に収束する場合 、結合ベクトル ( X n , Y n ) は確率収束で ( X , Y ) になる: [8] [証明] X n → p X , Y n → p Y ⇒ ( X n , Y n ) → p ( X , Y ) {\displaystyle X_{n}\ {\xrightarrow {\overset {}{p}}}\ X,\ \ Y_{n}\ {\xrightarrow {\overset {}{p}}}\ Y\ \quad \Rightarrow \quad (X_{n},Y_{n})\ {\xrightarrow {\overset {}{p}}}\ (X,Y)} X n が 確率的に X に収束し、 かつすべての n とある bに対して P (| X n | ≤ b ) = 1 が 成り立つならば 、 X n はすべての r ≥ 1 に対して r 次平均 で X に収束する。言い換えれば、 X n が 確率的に X に収束し、すべての確率変数 X n がほぼ確実に上下限で制限されるならば、 X n は 任意のr 次平均においても X に収束する 。 [10] ほぼ確実な表現 。通常、分布収束は必ずしもほぼ確実に収束することを意味するわけではない。しかし、 分布収束が X 0に収束する与えられた系列 { X n } に対して、常に新たな確率空間 (Ω, F , P) と、 その上で定義された確率変数 { Y n , n = 0, 1, ...} が、 n ≥ 0 の各値に対して Y n が 分布収束において X n と等しく、かつ Y n がY 0 に ほぼ確実に収束するような値となるように定義される。 [11] [12] すべてのε > 0 に対して、 ∑ n P ( | X n − X | > ε ) < ∞ , {\displaystyle \sum _{n}\mathbb {P} \left(|X_{n}-X|>\varepsilon \right)<\infty ,} とすると、 X n は X に ほぼ完全に収束する 、 あるいはほぼ確率的に収束する と言えます 。X n が X に ほぼ完全に収束する場合、 X にもほぼ確実に収束します 。言い換えれば、 X n が 十分に速く確率的に Xに収束する場合(つまり、上記の裾確率の列がすべての ε > 0 について合計可能である場合 )、 X n もほぼ確実に Xに収束します。これは 、ボレル・カンテリの補題 から直接導かれる結論です 。 S n が n 個の独立した実数確率変数の和である 場合 : S n = X 1 + ⋯ + X n {\displaystyle S_{n}=X_{1}+\cdots +X_{n}\,} すると、 S n が ほぼ確実に収束することと、 S n が 確率収束することは同じである。証明はKai Lai Chung 著の 126 ページ(定理 5.3.4)に記載されている 。 [13] しかし、互いに独立した確率変数の列の場合、確率収束はほぼ確実な収束を意味するわけではない。 [14] [ 循環参照 ] 優勢 収束定理は、ほぼ確実に収束し、 L 1 収束が成立するための十分な条件を与える 。 X n → a.s. X | X n | < Y E [ Y ] < ∞ } ⇒ X n → L 1 X {\displaystyle \left.{\begin{matrix}X_{n}\xrightarrow {\overset {}{\text{a.s.}}} X\\|X_{n}|<Y\\\mathbb {E} [Y]<\infty \end{matrix}}\right\}\quad \Rightarrow \quad X_{n}\xrightarrow {L^{1}} X} 5
L 1 収束 の必要十分条件 は であり 、数列 ( X n ) は 一様に積分可能 である。 X n → P X {\displaystyle X_{n}{\xrightarrow {\overset {}{P}}}X} の場合 、以下は同値である [15] X n → p X {\displaystyle X_{n}\ \xrightarrow {\overset {}{p}} \ X} X n → L r X {\displaystyle X_{n}\ {\xrightarrow {\overset {}{L^{r}}}}\ X} 、 E [ | X n | r ] → E [ | X | r ] < ∞ {\displaystyle \mathbb {E} [|X_{n}|^{r}]\rightarrow \mathbb {E} [|X|^{r}]<\infty } 、 { | X n | r } {\displaystyle \{|X_{n}|^{r}\}} は一様積分可能で ある 。
参照 ウィキブック 計量経済理論には、「 確率変数の収束」 というトピックに関するページがあります。
注記 ^ Bickel et al. 1998, A.8, 475ページ ^ ファン・デル・ファールト&ウェルナー、1996年、p. 4 ^ ロマーノ&シーゲル 1985、例5.26 ^ Durrett, Rick (2010). 確率:理論と例 . p. 84. ^ ファン・デル・ファールト 1998、補題 2.2 ^ ダドリー 2002、第9章2、287ページ ^ ダドリー 2002, 289ページ ^ abcdef van der Vaart 1998、定理 2.7 ^ Gut , Allan (2005). 確率論:大学院課程 .定理3.4.Springer.ISBN 978-0-387-22833-4 。 {{cite book }}: CS1 maint: location (link )^ グリメット&スターザカー 2020年、354ページ ^ ファン・デル・ファールト 1998年2月19日 ^ Fristedt & Gray 1997、定理14.5 ^ Chung, Kai-lai (2001). 確率論講座 . p. 126. ^ 「確率変数の収束の証明」 Wikipedia 。 2024年9月23日 閲覧 。 ^ 「実解析 - 確率収束のみを用いたシェッフェの補題の一般化」 Mathematics Stack Exchange . 2022年3月12日 閲覧 。
参考文献 Bickel, Peter J.; Klaassen, Chris AJ; Ritov, Ya'acov; Wellner, Jon A. (1998). セミパラメトリックモデルのための効率的かつ適応的な推定法 . ニューヨーク: Springer-Verlag. ISBN 978-0-387-98473-5 。 ビリングスリー、パトリック(1986年) 『確率と測度 』Wileyシリーズ『確率・数理統計』(第2版)Wiley. ビリングスリー、パトリック(1999年) 『確率測度の収束 (第2版)』ジョン・ワイリー・アンド・サンズ、pp. 1–28、 ISBN 978-0-471-19745-4 。 ダドリー, RM (2002). 『実解析と確率 』 ケンブリッジ大学出版局, イギリス. ISBN 978-0-521-80972-6 。 バート・フリステット、ローレンス・グレイ (1997). 確率論への現代的アプローチ . ニューヨーク: シュプリンガー・サイエンス+ビジネス・メディア. doi :10.1007/978-1-4899-2837-5. ISBN 978-1-4899-2837-5 。 グリメット, GR; スティルザカー, DR (1992). 確率とランダム過程 (第2版). クラレンドン・プレス, オックスフォード. pp. 271– 285. ISBN 978-0-19-853665-9 。 ヤコブセン、M. (1992)。 Videregånde Sandsynlighedsregning (高度な確率理論) (第 3 版)。 HCØ-tryk、コペンハーゲン。 18 ~ 20 ページ 。ISBN 978-87-91180-71-2 。 ルドゥ, ミシェル; タラグラン, ミシェル (1991). バナッハ空間における確率 . ベルリン: シュプリンガー・フェアラーク. pp. xii+480. ISBN 978-3-540-52013-9 . MR 1102015。 ロマーノ, ジョセフ・P.; シーゲル, アンドリュー・F. (1985). 『確率と統計における反例 』 イギリス: チャップマン・アンド・ホール. ISBN 978-0-412-98901-8 。 グリメット, ジェフリー・R.; スターザカー, デイヴィッド・R. (2020). 確率とランダム過程 (第4版). オックスフォード大学出版局. ISBN 978-0-198-84760-1 。 ファン・デル・ファールト、アード・ W.ウェルナー、ジョン A. (1996)。 弱い収束と経験的プロセス 。ニューヨーク: Springer-Verlag。 ISBN 978-0-387-94640-5 。 ファン デル ファールト、アード W. (1998)。 漸近統計 。ニューヨーク:ケンブリッジ大学出版局。 ISBN 978-0-521-49603-2 。 ウィリアムズ, D. (1991). マルチンゲール法による確率論 . ケンブリッジ大学出版局. ISBN 978-0-521-40605-5 。 Wong, E.; Hájek, B. (1985). 工学システムにおける確率過程 . ニューヨーク: Springer–Verlag. ジトコビッチ、ゴードン(2013年11月17日)「講義7:弱収束」 (PDF ) この記事には、 Creative Commons Attribution-ShareAlike 3.0 Unported Licenseに基づいてライセンスされているものの、 GFDL に基づいてライセンスされていない Citizendium の 記事「Stochastic convergence」の資料が組み込まれています 。