比率分布

分布(商分布とも呼ばれる)は、2つの既知の分布を持つ確率変数の分布として構成される確率分布です。2つの(通常は独立した)確率変数XYが与えられたとき、確率変数Zの分布はZ = X / Yの比として形成され、これは比分布と呼ばれます

一例として、コーシー分布正規分布とも呼ばれる)が挙げられます。これは、平均がゼロである2つの正規分布変数の比として生じます。検定統計量でよく用いられる他の2つの分布も比分布です。t分布はガウス分布に従う確率変数を独立したカイ2乗分布に従う確率変数で割った値から生じF分布は2つの独立したカイ2乗分布に従う確率変数の比から生じます。より一般的な比分布についても、文献で考察されています。[1] [2] [ 3] [4] [5] [6] [7] [8] [9]

比率分布は裾が重い傾向にあることが多く、そのような分布を扱い、関連する統計的検定を開発することは困難です。中央値に基づく方法が「回避策」として提案されています。[10]

確率変数の代数

比は確率変数の代数の一種です。比分布に関連するものとしては、積分布、和分布、差分布があります。より一般的には、和、差、積、比の組み合わせについて話すことができます。これらの分布の多くは、メルビン・D・スプリンガーの1979年の著書『確率変数の代数』で説明されています。[8]

通常の数で知られている代数規則は、確率変数の代数には適用されません。例えば、積がC = ABで比がD = C / Aである場合、必ずしもDBの分布が同じであることを意味するわけではありません。実際、コーシー分布には特異な効果が見られます。2つの独立したコーシー分布(同じ尺度パラメータと位置パラメータをゼロに設定した)の積と比は、同じ分布を与えます。[8]これは、コーシー分布自体を、ゼロを意味する2つのガウス分布の比分布と見なすと明らかになります。2つのコーシー確率変数を考え、それぞれが2つのガウス分布から構成されるとします

ここで、最初の項は2つのコーシー分布の比であり、最後の項は2つのそのような分布の積です。

導出

2つの他の確率変数X、Yの結合分布から結合pdfを持つ比分布を導く方法は、次の形式の積分である[3]。

2つの変数が独立であれば 、これは次のようになる。

これは必ずしも簡単ではないかもしれません。例として、2つの標準ガウス分布の標本の比という古典的な問題を考えてみましょう。結合確率密度関数は

定義する

既知の定積分を用いると

これはコーシー分布、またはn = 1 のスチューデントt分布である。

メリン変換は比分布の導出にも提案されている。[8]

正の独立変数の場合は、次のように進めます。図は、正の象限にサポートを持つ分離可能な二変量分布を示しており、比 の pdf を求めます。直線上の斜線部分は、関数 に論理関数 を乗じた累積分布を表します。密度はまず水平方向の帯で積分されます。高さyの水平方向の帯はx = 0からx = Ryまで伸びており、増分確率 を持ちます。次に、水平方向の帯をy全体にわたって上向きに積分すると、直線上の確率 の体積が得られます最後に、について微分してpdf を取得します微分を積分の内部に移動します。そして、 となるので 、 例として、の場合 の比Rの pdf を求めます。

比率の累積分布の評価

Rに関する微分Rのpdfを与える。

ランダム比のモーメント

メリン変換理論によれば、正の半直線 上にのみ存在する分布 に対して、積の恒等式が成り立ちますこれは独立です。 のような標本比の場合、この恒等式を利用するには、逆分布のモーメントを使用する必要があります。を と設定します。したがって、のモーメントを別々に決定できる場合、 のモーメントを求めることができます。 のモーメントはの逆確率密度関数から決定され、多くの場合、扱いやすい計算です。最も単純な場合、 です

説明のために、次モーメントが である標準ガンマ分布からサンプリングされたものとします。

は、パラメータ の逆ガンマ分布から抽出され、確率密度関数 を持つ。この確率密度関数のモーメントは、

対応するモーメントを掛け合わせると

独立に、2つのガンマサンプルの比はベータプライム分布に従うことが分かっている。そのモーメントは

代入すると、上記のモーメントの積と一致するものが 得られます 。

ランダム比率の平均と分散

積分布のセクションではメリン変換理論(上記セクション参照)から導かれるが、独立変数の積の平均はそれらの平均の積に等しいことが分かる。比の場合、

これは確率分布の観点からは、

つまり

独立変数の比の分散は

正規比分布

無相関中心正規比

XYが独立で、平均がゼロのガウス分布に従う場合、それらの比分布の形はコーシー分布となる。これは、 と設定し、 が円対称性 を持つことを示すことで導出できる。二変量無相関ガウス分布の場合、以下の式が成り立つ 。

がrのみの関数である場合、 は密度 で一様分布するので、問題はの写像の下で のZの確率分布を求めることに帰着します 。確率保存則と の設定により、が得られます。ここには 2 という誤った係数があります。実際には、だけ離れたの2つの値がzの同じ値に写像されるため、密度は2倍になり、最終結果は次のようになります。

2つの正規分布のいずれかが非心分布である場合、比の分布の結果ははるかに複雑になり、David Hinkley [6]によって提示された簡潔な形式で以下に示す。しかし、比の三角法は、密度が半径のみに依存する2変量正規分布や2変量スチューデントt分布などの放射状分布には拡張される。これは、1自由度に対して以下のセクションで示すコーシー比を与える 2つの独立したスチューデントt分布の比には拡張されない。

無相関非心正規比

相関がない場合、 2正規変数X = NμXσX2)とY = NμYσY2の比Z = X / Yの確率密度関数はいくつかの情報源から導かれた次の式で正確に与えられます。[ 6 ]

どこ

  • いくつかの仮定(実用では通常満たされる)の下で、PDFの高精度な実近似を導出することが可能です。主な利点は、式の複雑さの軽減、閉形式CDF、簡潔に定義された中央値、明確に定義された誤差管理などです。簡略化のために、パラメータを導入します:および。すると、無相関非心正規比PDFのいわゆる実近似は、式[11]で表されます。
  • 特定の条件下では、分散を伴った正規近似が可能である:[12]

相関中心正規比

変数XYに相関がある場合、上記の式はより複雑になります。しかしより一般的なコーシー分布が得られると、

ここでρXY相関係数であり、

複素分布はクンマーの合流型超幾何関数エルミート関数でも表現される。[9]

相関非心正規比

これは Springer 1979 の問題 4.28 に示されました。

対数領域への変換はKatz(1978)によって提案された(以下の二項式のセクションを参照)。比を

ログを取ると、その後漸近的 に

あるいは、Geary(1930)は、がほぼ標準ガウス分布に従うと示唆した。[1]この変換はGeary–Hinkley変換と呼ばれている[7] Yが負の値を取る可能性が低い場合、基本的に、この近似は適切である

正確な相関非心正規比

これは、Dale(Springer 1979 問題4.28)とHinkley 1969によって発展しました。Gearyは、相関比を近似ガウス分布に変換する方法を示し、負の分母値がほぼゼロになる確率に依存する近似値を発展させました。Fiellerによる後の相関比分析は正確ですが、現代の数学パッケージと古い文献の言語的条件を組み合わせる際には注意が必要です。Pham-Ghiaはこれらの手法について徹底的に議論しています。Hinkleyの相関結果は正確ですが、以下に示すように、相関比条件は非相関条件にも変換できるため、上記の簡略化されたHinkley方程式のみが必要であり、完全な相関比バージョンは必要ありません。

比を次のように定義する:ここで、は平均ゼロで相関があり、分散と平均を持つ正規変数である。無相関になり、標準偏差を持つと書く。比:はこの変換で不変であり、同じ確率密度関数を維持する。分子の項は展開することで分離可能になるように見える:となりzは不変のzオフセットを持つ無相関の非心正規標本の比となる(これは正式には証明されていないが、Gearyによって用いられたと思われる)。

最後に、明示的に言えば、相関変数の比率の pdf は、修正されたパラメータとを上記の Hinkley 方程式に入力することによって求められます。この方程式は、定数オフセットを持つ相関比率の pdf を返します

上の図は、正の相関関係にある比率の例を示しています。ここで、網掛けのくさびは、所定の比率によって選択された領域の増分を表し、分布と重なる部分で確率が累積します。議論中の方程式とHinkleyの方程式を組み合わせて導出された理論的な分布は、5,000サンプルを用いたシミュレーション結果と非常によく一致しています。上の図では、ある比率においてくさびが分布の主要部分をほぼ完全に迂回していることが明確に示されており、これが理論的なpdfにおける局所的最小値を説明しています。逆に、が一方に近づくか離れるにつれて、くさびは中心部分により長く広がり、より高い確率が累積します。

複素正規比

相関ゼロ平均円対称複素正規分布変数の比は、Baxleyら[13]によって決定され、その後、非ゼロ平均および非対称の場合に拡張されました[14] 。相関ゼロ平均の場合、 xy の結合分布

どこ

はエルミート転置であり、

のPDFは次のようになります

通常、私たちが

CDF のさらに閉じた形式の結果も示されます。

相関複素変数の比分布、ρ = 0.7 exp( i π /4)

このグラフは、相関係数が である2つの複素正規変数の比の確率密度関数(pdf)を示しています。確率密度関数のピークは、スケールダウンされた の複素共役付近で発生します

対数正規分布の比率

独立または相関のある対数正規分布の比は対数正規分布である。これは、とが対数正規分布に従う場合、とが正規分布することから導かれる。これらが独立であるか、それらの対数が二変量正規分布に従う場合、それらの比の対数は、独立または相関のある正規分布に従う確率変数の差であり、これは正規分布に従う。[注 1]

これは、正でなければならない確率変数の比を必要とする多くの応用において重要です。この場合、 と の共分布は対数正規分布で適切に近似されます。これは、 が多数の小さなパーセンテージ変化の蓄積の結果であり、 が正で近似的に対数正規分布に従う必要がある場合の、乗法中心極限定理(ジブラの法則としても知られています)の一般的な帰結です。 [15]

均一比率分布

例えば、一様分布に従う2つの独立した確率変数の場合比分布は次のようになる。

コーシー比分布

2つの独立確率変数XYがそれぞれ、中央値が0で形状係数が であるコーシー分布に従う場合 、確率変数の比分布は[16]である。この分布は に依存せず、Springer [8] (p158 質問4.6)が述べた結果は正しくない。比分布は、確率変数の積分布に似ているが同じではない。[8]より一般的には、2つの独立確率変数XYがそれぞれ、中央値が0で形状係数が であるコーシー分布に従う場合、次の式が成り立つ。

  1. 確率変数の比率分布は[16]である。
  2. 確率変数の積分布は[16]である。

比率分布の結果は、積分布を次のように置き換えることによって得られる。

標準法線と標準均一の比

Xが標準正規分布を持ち、Yが標準一様分布を持つ場合、 Z  =  X  /  Yはスラッシュ分布と呼ばれる分布を持ち、確率密度関数はφ( z )が標準正規分布の確率密度関数である。[17]

カイ二乗分布、ガンマ分布、ベータ分布

Gを正規分布(0,1)、YZをそれぞれ自由度mnを持つカイ2乗分布としすべて独立とする

  • スチューデントt分布
  • すなわちフィッシャーのF検定分布
  • ベータ分布
  • 標準ベータプライム分布

非心カイ二乗分布およびがから独立している場合、非心 F 分布 となります

または、フィッシャーの F 密度分布、つまり自由度 がm、nの 2 つのカイ 2 乗の比の PDF を 定義します。

F表に見られるフィッシャー密度のCDFは、ベータプライム分布の記事で定義されています。m = 3n = 4、右側の裾に5%の確率を持つF検定表を入力すると、臨界値は6.59になります。これは積分値と一致します。

任意の形状パラメータα 1およびα 2を持ち、尺度パラメータが両方とも1に設定されているガンマ分布 UおよびV、つまり、ここで

ならば。ここでθは速度パラメータではなくスケールパラメータであることに注意してください。

ならば パラメータを1に 再スケールすると、

したがって、一般化ベータプライム分布を表します

以上のことから、 ならばであることは明らかである。より明確に言えば、ならばある ので、

レイリー分布

XYがレイリー分布 から独立に抽出された場合 、比Z = X / Yは分布に従う[18]

であり、累積 分布関数は レイリー分布の唯一のパラメータはスケーリングである。 の分布はあり、累積 分布関数は

分数ガンマ分布(カイ、カイ二乗、指数、レイリー、ワイブルを含む)

一般化ガンマ分布

これには、分数べきを含む、正規分布、ガンマ分布、カイ分布、カイ二乗分布、指数分布、レイリー分布、仲上分布、ワイブル分布が含まれます。ここで、aは速度パラメータではなく尺度パラメータでありdは形状パラメータであることに注意してください。

もし

その後[19]

どこ

異なるスケーリング係数の混合モデル化

上記の比率では、ガンマ サンプルUV のサンプル サイズは異なる場合がありますが、等しいスケーリングで同じ分布から抽出される必要があります

UVのスケールが異なる場合、変数変換によって修正ランダム比pdfを決定できます。ここで任意の値とし、上記より、 とします

Vを任意に再スケールし、定義する

となり、 Yに代入する

XをY変換する

ついに

したがって、ように分布する。

Yの分布はここでは区間[0,1]に限定されている。これを一般化するには、 次の ようにスケーリングすればよい。

どこ

次は、

ベータ分布からのサンプルの逆数

2 つの変数の比率分布ではありませんが、1 つの変数に対する次の恒等式は便利です。

  • もしそうなら
  • 後者の2つの式を組み合わせると、
  • もしそうなら
  • もしそうなら

推論

、サンプルの逆数の分布

もしそうならそして

さらなる結果は逆分布の記事で見ることができます

  • が平均μ の独立した指数確率変数である場合X  −  Yは平均 0 でスケール μの二重指数確率変数です

二項分布

この結果はKatzら[20]によって導き出された。

および、が独立である仮定します。 とします

すると、 は平均と分散で近似的に正規分布します

二項比分布は臨床試験において重要です。Tの分布が上記のように分かっていれば与えられた比が純粋に偶然に生じる確率、すなわち偽陽性試験の確率を推定することができます。二項比の異なる近似値の堅牢性を比較した論文は数多くあります。[要出典]

ポアソン分布と切断ポアソン分布

ポアソン変数の比R = X/Yにおいて、 Yが有限確率でゼロとなるためRは未定義となるという問題があります。これに対処するために、 Yのゼロサンプルを無視した、打ち切り比R' = X/Y'を検討します。さらに、多くの医療調査では、XとYの両方のゼロサンプルの信頼性に体系的な問題があり、いずれにしてもゼロサンプルを無視することが賢明な場合があります。

ポアソン分布のヌル標本が である確率は、左切断ポアソン分布の一般的なpdfは

コーエン[21]によれば、 n回の独立試行に対する多次元切断確率密度関数は

そして対数尤度は微分すると次の ようになり、ゼロにすると最大尤度推定値が得られる。

となるので、切り捨て最尤推定値は、切り捨て分布と切り捨てられていない分布の両方に対して正しいものの、切り捨てられた平均値は切り捨てられていない平均値に比べて大きく偏っていることに注意してください。しかしながら、 は前の式の標本平均を通じてのみデータに依存するため、 は に対して十分な統計量であると思われます。これは、従来のポアソン分布の手法と一致しています

閉じた形式の解が存在しない場合は、切り捨てられた の次の近似値が範囲全体にわたって有効です

これを、単純に である非切り捨てバージョンと比較します。 は左切り捨てモデルですが、 は非切り捨てモデルを使用しているにもかかわらず、比率を取ることは有効な操作です。

(およびクラメール・ラオ境界漸近大分散は

ここでLを代入すると次の式が得られる。そして上の式から代入するとコーエンの分散推定値が得られる。

n回の試行に基づく平均の点推定値の分散は、 nが無限大に増加するにつれて漸近的にゼロに減少する。小さい場合、これは例えば Springael [22]の切断pdf分散から乖離する。Springaelは、このセクションの冒頭に示した左切断pdfにおいて、 nサンプルに対する分散を引用している。Cohenは、pdfの分散に対する推定値の分散は、大きい場合(100%効率)の1から、0に近づくにつれて(50%効率)2までの範囲になることを示した

これらの平均および分散パラメータ推定値は、Xの平行推定値と併せて、ポアソン比の正規近似または二項近似に適用できます。試行からのサンプルはポアソン過程に適合しない可能性があります。ポアソン打ち切りに関する詳細な議論はDietzとBohning [23]によるものであり、Wikipediaにはゼロ打ち切りポアソン分布に関する項目があります

ダブルロマックス分布

この分布は2つのラプラス分布の比である[24] XYを標準ラプラス分布に従う同一確率変数とし、 z = X / Yとすると、 zの確率分布

XYの平均をaとすると、標準二重ロマックス分布はaを中心に対称になります。

この分布には無限の平均と分散があります。

Z が標準の二重 Lomax 分布を持つ場合、1/ Zも標準の二重 Lomax 分布を持ちます。

標準の Lomax 分布は単峰性で、ラプラス分布よりも裾が重くなります。

0 < a < 1 の場合、a番目のモーメントが存在します。

ここでΓはガンマ関数です

多変量解析における比率分布

比分布は多変量解析にも現れる。[25]ランダム行列XYがウィシャート分布に従う場合、行列式の比は

は独立したF個の確率変数の積に比例する。XY独立した標準化ウィシャート分布に従う場合、比はウィルクスのラムダ分布に従う

ウィシャート行列を含む二次形式の比

ウィシャート行列分布に関して、が標本ウィシャート行列であり、ベクトルが任意だが統計的に独立である場合、ミュアヘッド[26]の系3.2.9は次のように述べている 。

標本数の1つの不一致は、標本共分散を形成する際に標本平均を推定することから生じており、これはコクランの定理の結果である。同様に、これはミュアヘッドの定理3.2.12である。[26]

参照

注記

  1. ^ ただし、と はそれぞれ対数正規分布に従うものの、二変量対数正規分布に従うわけではないことに注意してください。2022年6月8日現在、Wikipediaの「コピュラ(確率論)」の記事には、二変量正規分布に従うわけではない、ガンベルコピュラと共存する2つの正規分布の密度分布と等高線図が掲載されています。

参考文献

  1. ^ ab Geary, RC (1930). 「2つの正規分布の商の頻度分布」.王立統計学会誌. 93 (3): 442– 446. doi :10.2307/2342070. JSTOR  2342070.
  2. ^ Fieller, EC (1932年11月). 「正規二変量集団における指数の分布」. Biometrika . 24 (3/4): 428– 440. doi :10.2307/2331976. JSTOR  2331976.
  3. ^ ab Curtiss, JH (1941年12月). 「2つの確率変数の商の分布について」.数理統計年報. 12 (4): 409– 421. doi : 10.1214/aoms/1177731679 . JSTOR  2235953.
  4. ^ George Marsaglia (1964年4月).正規変数の比と一様変数の和の比.国防技術情報センター.
  5. ^ Marsaglia, George (1965年3月). 「正規変数の比率と一様変数の合計の比率」. Journal of the American Statistical Association . 60 (309): 193– 204. doi :10.2307/2283145. JSTOR 2283145. 2017年9月23日時点のオリジナル よりアーカイブ
  6. ^ abc Hinkley, DV (1969年12月). 「2つの相関する正規確率変数の比について」. Biometrika . 56 (3): 635– 639. doi :10.2307/2334671. JSTOR  2334671.
  7. ^ ab Hayya, Jack ; Armstrong, Donald ; Gressis, Nicolas (1975年7月). 「2つの正規分布変数の比率に関するノート」. Management Science . 21 (11): 1338– 1341. doi :10.1287/mnsc.21.11.1338. JSTOR  2629897.
  8. ^ abcdef Springer, Melvin Dale (1979). The Algebra of Random Variables . Wiley . ISBN 0-471-01406-0
  9. ^ ab Pham-Gia, T.; Turkkan, N.; Marchand, E. (2006). 「2つの正規確率変数の比の密度とその応用」. Communications in Statistics – Theory and Methods . 35 (9). Taylor & Francis : 1569–1591 . doi :10.1080/03610920600683689. S2CID  120891296.
  10. ^ Brody, James P.; Williams, Brian A.; Wold, Barbara J.; Quake, Stephen R. (2002年10月). 「DNAマイクロアレイデータ解析における有意性と統計誤差」(PDF) . Proc Natl Acad Sci USA . 99 (20): 12975– 12978. Bibcode :2002PNAS...9912975B. doi : 10.1073/pnas.162468199 . PMC 130571. PMID  12235357 . 
  11. ^ Šimon, Ján; Ftorek, Branislav (2022-09-15). 「結び目の効率に関する基本的な統計的性質」. Symmetry . 14 (9). MDPI: 1926. Bibcode :2022Symm...14.1926S. doi : 10.3390/sym14091926 . ISSN  2073-8994.
  12. ^ Díaz-Francés, Eloísa; Rubio, Francisco J. (2012-01-24). 「2つの独立した正規確率変数の比の分布に対する正規近似の存在について」.統計論文. 54 (2). Springer Science and Business Media LLC: 309– 323. doi :10.1007/s00362-012-0429-2. ISSN  0932-5026. S2CID  122038290.
  13. ^ Baxley, RT; Waldenhorst, BT; Acosta-Marum, G (2010). 「複素ガウス比分布と不完全なCSIを持つフェージングチャネルにおける誤り率計算への応用」2010 IEEE Global Telecommunications Conference GLOBECOM 2010. pp.  1– 5. doi :10.1109/GLOCOM.2010.5683407. ISBN 978-1-4244-5636-9. S2CID  14100052。
  14. ^ Sourisseau, M.; Wu, H.-T.; Zhou, Z. (2022年10月). 「シンクロスクイージング変換の漸近解析—非線形型時間周波数解析による統計的推論に向けて」Annals of Statistics . 50 (5): 2694– 2712. arXiv : 1904.09534 . doi :10.1214/22-AOS2203.
  15. ^ もちろん、中心極限定理を適用する場合は、有限分散など、適切かつ一般的に満たされる正則性条件を前提とします。
  16. ^ abc カーモンド, ジョン (2010). 「確率変数代数入門」.ビクトリア数学協会第47回年次大会議事録 – 新しいカリキュラムと新たな機会.ビクトリア数学協会: 1–16 . ISBN 978-1-876949-50-1
  17. ^ "SLAPPF". 国立研究開発法人科学技術研究所統計工学研究部. 2009年7月2日閲覧。
  18. ^ Hamedani, GG (2013年10月). 「レイリー確率変数の比の分布の特徴づけ」.パキスタン統計ジャーナル. 29 (4): 369– 376.
  19. ^ Raja Rao, B.; Garg., ML (1969). 「一般化(正)コーシー分布に関する注記」. Canadian Mathematical Bulletin . 12 (6): 865– 868. doi : 10.4153/CMB-1969-114-2 .
  20. ^ Katz D. et al .(1978) コホート研究におけるリスク比の信頼区間の取得. バイオメトリクス 34:469–474
  21. ^ Cohen, A Clifford (1960年6月). 「条件付きポアソン分布におけるパラメータの推定」.バイオメトリクス. 60 (2): 203– 211. doi :10.2307/2527552. JSTOR  2527552.
  22. ^ Springael, Johan (2006). 「独立ゼロ切断ポアソン確率変数の和について」(PDF) .アントワープ大学経営経済学部.
  23. ^ Dietz, Ekkehart; Bohning, Dankmar (2000). 「ゼロ修正ポアソンモデルにおけるポアソンパラメータの推定について」.計算統計とデータ分析. 34 (4): 441– 459. doi :10.1016/S0167-9473(99)00111-5.
  24. ^ Bindu PとSangita K (2015) 二重ロマックス分布とその応用. Statistica LXXV (3) 331–342
  25. ^ Brennan, LE; Reed, IS (1982年1月). 「通信のためのアダプティブアレイ信号処理アルゴリズム」. IEEE Transactions on Aerospace and Electronic Systems . AES-18 No 1: 124– 130. Bibcode :1982ITAES..18..124B. doi :10.1109/TAES.1982.309212. S2CID  45721922.
  26. ^ ab Muirhead, Robb (1982).多変量統計理論の諸側面. 米国: Wiley. p. 96 (定理3.2.12).
Retrieved from "https://en.wikipedia.org/w/index.php?title=Ratio_distribution&oldid=1319675542"