結合確率分布

同じ[1]確率空間上に定義された確率変数 が与えられた場合の多変量確率分布または結合確率分布、 の各変数が、その変数に対して指定された特定の範囲または離散的な値の集合に含まれる確率を与える確率分布です。確率変数が2つだけの場合には、これは二変量分布と呼ばれますが、この概念は任意の数の確率変数にも一般化されます。

結合確率分布は、結合累積分布関数と、結合確率密度関数(連続変数の場合)または結合確率質量関数(離散変数の場合)のいずれかで表すことができます。これらは、他の2種類の分布を求めるために使用できます。1つは周辺分布で、他の変数の特定の値の範囲を参照せずに、任意の変数の確率を示します。もう1つは条件付き確率分布で、残りの変数の特定の値を条件として、任意の変数のサブセットの確率を示します。

壺から汲み出す

2つの壺にはそれぞれ、赤いボールが青いボールの2倍入っており、他のボールは入っていない。それぞれの壺からランダムに1つのボールが選ばれるが、2回の抽選は互いに独立している。 と を、それぞれ最初の壺と2番目の壺からの抽選結果に対応する離散確率変数とする。どちらの壺からでも赤いボールが選ばれる確率は2/3、青いボールを引く確率は1/3 . 結合確率分布は次の表に示されています。

A=赤A=青P(B)
B=赤2/3 ) ( 2/3 ) =4/91/3 ) ( 2/3 ) =2/94/9 + 2/9 = 2/3
B=青2/3 ) ( 1/3 ) =2/91/3 ) ( 1/3 ) =1/92/9 + 1/9 = 1/3
P(A)4/9 + 2/9 = 2/32/9 + 1/9 = 1/3

内側の4つのセルはそれぞれ、2つの抽選から得られる特定の結果の組み合わせの確率を示しています。これらの確率は結合分布です。各セルにおいて、特定の組み合わせが発生する確率は(抽選は独立しているため)、Aの特定の結果の確率とBの特定の結果の確率の積となります。すべての確率分布と同様に、これら4つのセルの確率の合計は1になります。

さらに、最後の行と最後の列は、それぞれAの周辺確率分布とBの周辺確率分布を示しています。例えば、Aの場合、これらのセルの最初のセルは、セルの上の列にあるBのどの可能性が発生するかに関係なく、Aが赤になる確率の合計を示しています。⁠2/3。したがって、 の周辺確率分布は、に無条件、表の周辺にある の確率を与えます。

コイントス

2枚の公平なコインを投げることを考えてみましょ。1回目と2回目のコイン投げの結果に対応する離散確率変数をそれぞれ とします。各コイン投げはベルヌーイ試行であり、ベルヌーイ分布に従います。コインが「表」になった場合、対応する確率変数は1を、そうでない場合は0をとります。これらの結果の確率はそれぞれ1/2なので、周辺(無条件)密度関数は

と の結合確率質量関数は、結果のペアの確率を定義します。すべての可能な結果は、各結果が等しく発生する可能性があるため、結合確率質量関数は次のようになります。

コイン投げは独立しているので、結合確率質量関数は周辺分布の積になります。

サイコロを振る

公平なサイコロを振って、出たが偶数(つまり2、4、または6)の場合は 、そうでない場合は とします。さらに、出た目が素数(つまり2、3、または5)の場合は 、そうでない場合は とします。

123456
010101
B011010

そして、確率質量関数として表されるの結合分布は、

の組み合わせが発生する確率は1 なので、これらの確率の合計は必然的に 1 になります。

周辺確率分布

ランダム実験において複数の確率変数が定義されている場合、XとYの結合確率分布と各変数の個別確率分布を区別することが重要です。ランダム変数の個々の確率分布は、その周辺確率分布と呼ばれます。一般に、Xの周辺確率分布は、Xと他のランダム変数の結合確率分布から決定できます。

確率変数 X と Y の結合確率密度関数が である場合 、周辺分布を定義する X と Y の周辺確率密度関数は次のように与えられます。

ここで、最初の積分はX=xとなる(X,Y)の範囲内のすべての点についてであり、2番目の積分はY=yとなる(X,Y)の範囲内のすべての点についてである。[2]

結合累積分布関数

確率変数のペアに対して、結合累積分布関数(CDF)は[3]で与えられる:89 

   (式1

ここで、右側の項は、ランダム変数が以下の値を取る確率と、ランダム変数以下の値を取る確率を表します

確率変数の場合、結合CDFは次のように与えられる。

   (式2

ランダム変数をランダムベクトルとして解釈すると、より短い表記法が得られます。

結合密度関数または質量関数

離散的なケース

2 つの離散確率変数結合確率質量関数は次のとおりです。

   (式3

または条件付き分布で表すと、 が与えられた場合の確率に なります

前述の2変数の場合を一般化すると、離散確率変数の結合確率分布は次のようになります。

   (式4

または同等

この恒等式は確率の連鎖律として知られています。

これらは確率なので、2変数の場合

これは離散確率変数に対して 一般化される。

連続ケース

2つの連続確率変数結合確率密度関数は 結合累積分布関数の導関数として定義されます(式1を参照)。

   (式5

これは次と等しい:

ここで、およびはそれぞれ与えられたおよび与えられたの条件付き分布でありおよびはそれぞれおよび周辺分布です

この定義は、2 つ以上のランダム変数に自然に拡張されます。

   (式6

繰り返しますが、これらは確率分布なので、それぞれ

混合ケース

「混合結合密度」は、1つ以上の確率変数が連続で、他の確率変数が離散である場合に定義できます。各タイプの変数が1つずつの場合、連続である確率変数と離散である別の確率変数の累積分布を求めたい状況の一例として、連続分布する結果の値 を条件とする2値結果Yの確率をロジスティック回帰を用いて予測したい場合が挙げられます。入力変数は当初、確率密度関数または確率質量関数のいずれかを一括して割り当てることができないように定義されているため、この2値結果の累積分布を求める際には「混合」結合密度を使用する必要があります。正式には、は とそれぞれのサポート上の積測度に関するの確率密度関数です。これらの2つの分解のいずれかを使用して、結合累積分布関数を復元できます。定義は、任意の数の離散確率変数と連続確率変数の混合に一般化されます。

追加のプロパティ

独立変数の共分布

一般に、2つの確率変数とが独立であるのは、累積分布関数が次式を満たす場合のみである。

2 つの離散確率変数およびは、すべてのおよびに対して結合確率質量関数が を満たす場合にのみ独立です

負の指数法則に従って、独立したランダム イベントの数が増加すると、関連する結合確率値は急速にゼロまで減少します。

同様に、2つの絶対連続確率変数が独立である場合、かつその場合のみ、すべてのおよびに対して独立である。これは、1つ以上の確率変数の値に関する情報を取得すると、他の任意の変数の条件付き分布がその無条件(周辺)分布と同一になることを意味する。したがって、どの変数も他の任意の変数に関する情報を提供しない。

条件付き従属変数の共分布

変数のサブセットが、これらの変数の別のサブセットを与えられた場合に条件付き従属関係にある場合、結合分布の確率質量関数は ですは に等しいです。したがって、これは低次元の確率分布およびによって効率的に表すことができます。このような条件付き独立関係は、ベイジアンネットワークまたはコピュラ関数によって表すことができます

共分散

確率空間上に2つ以上の確率変数が定義されている場合、それらがどのように共変するかを記述することは有用です。つまり、変数間の関係性を測定することは有用です。2つの確率変数間の関係性を示す一般的な指標は共分散です。共分散は、確率変数間の線形関係性を示す指標です。確率変数間の関係性が非線形である場合、共分散はその関係性に敏感ではない可能性があります。つまり、共分散は2つの変数間の相関関係を示さないということです。

確率変数と共分散[4]

相関

2 つのランダム変数間の関係を測る別の尺度があり、これは共分散よりも簡単に解釈できることが多いです。

相関は、各変数の標準偏差の積で共分散をスケールするだけです。したがって、相関は、異なる単位の変数ペア間の線形関係を比較するために使用できる無次元量です。XとYの結合確率分布において、正の確率を受け取る点が正(または負)の傾きの直線に沿う傾向がある場合、ρ XY は+1(または-1)に近くなります。ρ XY が+1または-1に等しい場合、結合確率分布において正の確率を受け取る点は、正確に直線に沿うことがわかります。相関がゼロでない2つの確率変数は、相関していると言われます。共分散と同様に、相関は確率変数間の線形関係の尺度です。

確率変数と相関係数

重要な名前付き分布

統計学で頻繁に登場する名前付きの結合分布には、多変量正規分布多変量安定分布多項分布負の多項分布多変量超幾何分布楕円分布などがあります。

参照

参考文献

  1. ^ ウィリアム・フェラー(1957年)『確率論とその応用入門』第1巻、第3版、pp.  217– 218. ISBN 978-0471257080 {{cite book}}: ISBN / Date incompatibility (help)
  2. ^ モンゴメリー, ダグラス C. (2013年11月19日). 『エンジニアのための応用統計と確率論』 ランガー, ジョージ C. (第6版). ホーボーケン, ニュージャージー州. ISBN 978-1-118-53971-2. OCLC  861273897。{{cite book}}: CS1 maint: location missing publisher (link)
  3. ^ パーク・クン・イル (2018).確率過程の基礎と通信への応用. シュプリンガー. ISBN 978-3-319-68074-3
  4. ^ モンゴメリー, ダグラス C. (2013年11月19日). 『エンジニアのための応用統計と確率論』 ランガー, ジョージ C. (第6版). ホーボーケン, ニュージャージー州. ISBN 978-1-118-53971-2. OCLC  861273897。{{cite book}}: CS1 maint: location missing publisher (link)
Retrieved from "https://en.wikipedia.org/w/index.php?title=Joint_probability_distribution&oldid=1318435247"