| 正規分布 | |||
|---|---|---|---|
確率密度関数 赤い曲線は標準正規分布です。 | |||
累積分布関数 | |||
| 表記 | |||
| パラメータ | =平均(位置)=分散(二乗スケール) | ||
| サポート | |||
| CDF | |||
| 四分位数 | |||
| 平均 | |||
| 中央値 | |||
| モード | |||
| 分散 | |||
| 狂った | |||
| AAD | |||
| 歪度 | |||
| 過剰尖度 | |||
| エントロピ | |||
| MGF | |||
| CF | |||
| フィッシャー情報 | |||
| カルバック・ライブラー距離 | |||
| 予想される不足額 | [ 1 ] | ||
| 統計に関するシリーズの一部 |
| 確率論 |
|---|
確率論と統計学において、正規分布またはガウス分布は、実数値確率変数に対する連続確率分布の一種である。その確率密度関数の一般的な形は[ 2 ] [ 3 ] [ 4 ]である。
パラメータ は分布の平均または期待値(および中央値と最頻値)であり、パラメータは分散です。分布の標準偏差は (シグマ)です。ガウス分布に従う確率変数は正規分布に従うと言われ、正規偏差と呼ばれます。
正規分布は統計学において重要であり、自然科学や社会科学において、分布が未知である実数値のランダム変数を表すためによく用いられる。 [ 5 ] [ 6 ]正規分布の重要性は、中心極限定理に一部起因する。中心極限定理とは、ある条件下では、有限の平均と分散を持つランダム変数の多数のサンプル(観測値)の平均は、それ自体がランダム変数であり、その分布はサンプル数が増えるにつれて正規分布に収束するというものである。したがって、測定誤差など、多くの独立したプロセスの合計であると予想される物理量は、ほぼ正規分布となることが多い。[ 7 ]
さらに、ガウス分布は解析研究において有用ないくつかの独特な性質を持っています。例えば、独立した正規偏差の固定集合の任意の線形結合は正規偏差です。不確実性の伝播や最小二乗法[ 8 ]によるパラメータフィッティングなど、多くの結果や手法は、関連する変数が正規分布している場合、明示的に解析的に導くことができます。
正規分布は非公式にはベル曲線と呼ばれることもあります。[ 9 ] [ 10 ]ただし、ベル曲線の形状を持つ分布は他にも数多くあります(コーシー分布、スチューデントのt分布、ロジスティック分布など)。(その他の名称については命名を参照してください。)
単変量確率分布は、多変量正規分布のベクトルと行列正規分布の行列に対して一般化されます。
定義
[編集]標準正規分布
[編集]正規分布の最も単純なケースは、標準正規分布または単位正規分布として知られています。これは、およびの特別なケースであり、次の確率密度関数(または密度)で記述されます。 [ 11 ]変数 の平均は0、分散と標準偏差は1です。密度は でピークとなり、 で変曲点となります。
上記の密度は標準正規分布として最もよく知られていますが、他のバージョンの正規分布を説明するためにこの用語を使用している著者もいます。例えば、カール・フリードリヒ・ガウスはかつて標準正規分布を次のように定義し 、その分散は です。また、スティーブン・スティグラー[ 12 ]はかつて標準正規分布を次のように定義し、その単純な関数形と分散は
一般正規分布
[編集]すべての正規分布は、標準正規分布の定義域が係数 (標準偏差)で引き伸ばされ、次に (平均値) で変換されたバージョンです。
確率密度は、積分が 1 のままになるようにスケーリングする必要があります。
が標準正規偏差の場合、 は期待値 、標準偏差 の正規分布になります。これは、標準正規分布 を係数 で拡大/縮小し、 シフトして、 と呼ばれる別の正規分布を生成できるということと同じです。逆に、 がパラメータ およびを持つ正規偏差の場合、この 分布は、式を使用して再拡大縮小およびシフトすることで標準正規分布に変換できます。この変量は の標準化された形式とも呼ばれます。
表記
[編集]標準ガウス分布(平均ゼロ、分散1の標準正規分布)の確率密度は、ギリシャ文字の (ファイ) で表されることが多い。[ 13 ]ギリシャ文字ファイの代替形である もよく使われる。
正規分布は、しばしばまたはと呼ばれます。[ 14 ]したがって、確率変数が平均 と標準偏差 で正規分布している場合、次のように書くことができます。
代替パラメータ化
[編集]一部の著者は、分布の幅を定義するパラメータとして、標準偏差や分散の代わりに精度を用いることを提唱している。精度は通常、分散の逆数 として定義される。[ 15 ]分布の式は次のようになる。
この選択は、 がゼロに非常に近い場合の数値計算で利点があり、多変量正規分布を持つ変数のベイズ推論など、いくつかのコンテキストで式を簡素化すると主張されています。
あるいは、標準偏差の逆数を精度として定義すると、正規分布の式は次のようになる。
スティグラーによれば、この定式化は、式がはるかに単純で覚えやすく、分布の分位数の近似式が単純であるため有利です。
正規分布は、自然パラメータおよび、自然統計量xおよびx 2を持つ指数分布族を形成します。正規分布の双対期待パラメータは、η 1 = μおよびη 2 = μ 2 + σ 2です。
累積分布関数
[編集]標準正規分布の累積分布関数(CDF)は、通常ギリシャ文字の大文字で表記され、積分である。
誤差関数
[編集]関連する誤差関数は、平均0、分散1/2の正規分布に従う確率変数が の範囲に入る確率を与えます。つまり、
これらの積分は初等関数では表現できず、しばしば特殊関数と呼ばれる。しかし、多くの数値近似が知られている。詳細は以下を参照のこと。
2つの機能は密接に関連しており、
密度 、平均 、分散 を持つ一般的な正規分布の場合、累積分布関数は
標準正規累積分布関数の補関数は、特に工学の教科書ではQ関数と呼ばれることが多い。[ 16 ] [ 17 ]これは、標準正規確率変数の値が : を超える確率を与える。 関数の他の定義(すべて の単純な変換である)も時々使用される。[ 18 ]
標準正規累積分布関数 のグラフは、点 (0,1/2) を中心に2回回転対称性を持ちます。つまり、 です。その不定積分は次のように表されます。
標準正規分布の累積分布関数は、部分を積分して級数に展開することができます。ここで、 は二重階乗を表します。
大きなxに対する累積分布関数の漸近展開は、部分積分を用いて導くこともできる。詳しくは、誤差関数§漸近展開を参照のこと。[ 19 ]
標準正規分布の累積分布関数の近似値は、テイラー級数近似を使用して簡単に求めることができます。
テイラー級数展開による再帰計算
[編集]導関数族の再帰的性質を利用すると、分布の既知の値の任意の点についての再帰要素を使用した、急速に収束するテイラー級数展開を簡単に構築できます。ここで、
逆関数にテイラー級数とニュートン法を用いる
[編集]上記のテイラー級数展開の応用として、ニュートン法を用いて計算を逆にすることができます。つまり、累積分布関数の値が分かっているものの、を得るのに必要な x が分からない場合、ニュートン法を用いて x を求め、上記のテイラー級数展開を用いて計算回数を最小限に抑えることができます。ニュートン法はこの問題を解くのに最適です。なぜなら、 の一次導関数は正規標準分布の積分であり、正規標準分布そのものであり、ニュートン法の解法に容易に利用できるからです。
解くには、既知の近似解 を、目的の に選択します。 は分布表の値、またはインテリジェントな推定値から任意の計算手段を用いて を計算します。 のこの値と上記のテイラー級数展開を使用して、計算を最小限に抑えます。
計算された値と目的の ( と呼ぶ)の差が 、10 −5、10 −15などの許容できる小さな誤差以下になるまで、以下のプロセスを繰り返します。ここで
- は、テイラー級数解から、および
繰り返し計算が、選択された許容できるほど小さい値以下の誤差に収束すると、x は目的の値 のa を取得するために必要な値になります。
標準偏差とカバレッジ
[編集]
正規分布から抽出された値の約68%は平均値から1標準偏差σ以内にあり、約95%は2標準偏差σ以内にあり、約99.7%は3標準偏差σ以内にあります。 [ 9 ]これは68-95-99.7(経験)則、または3シグマ則として知られています。
より正確には、正規分布が から までの範囲にある確率は、で与えられます。 12 桁の有効数字の場合、 の値は次のようになります。
| | OEIS | |||||
|---|---|---|---|---|---|---|
| 1 | 0.682 689 492 137 | 0.317 310 507 863 |
| OEIS : A178647 | ||
| 2 | 0.954 499 736 104 | 0.045 500 263 896 |
| OEIS : A110894 | ||
| 3 | 0.997 300 203 937 | 0.002 699 796 063 |
| OEIS : A270712 | ||
| 4 | 0.999 936 657 516 | 0.000 063 342 484 |
| |||
| 5 | 0.999 999 426 697 | 0.000 000 573 303 |
| |||
| 6 | 0.999 999 998 027 | 0.000 000 001 973 |
|
が大きい場合、近似値を使用できます。
分位関数
[編集]分布の分位関数は、累積分布関数の逆です。標準正規分布の分位関数はプロビット関数と呼ばれ、逆誤差関数で表すことができます。 平均 、分散の正規ランダム変数の場合、分位関数は です。標準正規分布の分位数は、一般的に と表記されます。これらの値は、仮説検定、信頼区間の構築、Q–Q プロットで使用されます。正規ランダム変数 は、確率 で区間外となり、確率 で区間外となります。特に、分位数は1.96であるため、正規ランダム変数が区間外となるのは 5% のケースのみです。
次の表は、 が指定された確率 で範囲内に入るような分位数を示しています。これらの値は、正規分布(または漸近正規分布)における標本平均やその他の統計的推定値の許容区間を決定するのに役立ちます。[ 20 ]次の表は、上記の定義とは異なります。
| | | |||
|---|---|---|---|---|
| 0.80 | 1.281 551 565 545 | 0.999 | 3.290 526 731 492 | |
| 0.90 | 1.644 853 626 951 | 0.9999 | 3.890 591 886 413 | |
| 0.95 | 1.959 963 984 540 | 0.99999 | 4.417 173 413 469 | |
| 0.98 | 2.326 347 874 041 | 0.999999 | 4.891 638 475 699 | |
| 0.99 | 2.575 829 303 549 | 0.9999999 | 5.326 723 886 384 | |
| 0.995 | 2.807 033 768 344 | 0.99999999 | 5.730 728 868 236 | |
| 0.998 | 3.090 232 306 168 | 0.999999999 | 6.109 410 204 869 |
が小さい場合、分位関数は有用な漸近展開を持つ[要出典]
プロパティ
[編集]正規分布は、最初の2つ(つまり平均と分散以外)を超えるキュムラントがゼロとなる唯一の分布です。また、指定された平均と分散に対して最大エントロピーを持つ連続分布でもあります。 [ 21 ] [ 22 ]ギアリーは、平均と分散が有限であると仮定した場合、一連の独立した抽出から計算された平均と分散が互いに独立である唯一の分布は正規分布であることを示しました。[ 23 ] [ 24 ]
正規分布は楕円分布のサブクラスです。正規分布は平均を中心に対称であり、実数直線全体にわたって非ゼロです。そのため、人の体重や株価など、本質的に正の値を持つ変数や大きく歪んだ変数には適したモデルではない可能性があります。このような変数は、対数正規分布やパレート分布などの他の分布によってより適切に説明される場合があります。
正規密度の値は、平均値から数標準偏差以上離れている場合、実質的にゼロになります(例えば、3標準偏差の広がりは、分布全体の0.27%を除くすべてをカバーします)。したがって、外れ値(平均値から多くの標準偏差離れた値)がかなりの割合で存在すると予想される場合、このモデルは適切ではない可能性があります。また、正規分布する変数に最適な最小二乗法などの統計的推論手法は、そのようなデータに適用すると、信頼性が非常に低くなることがよくあります。このような場合は、より裾の重い分布を仮定し、適切なロバストな統計的推論手法を適用する必要があります。
ガウス分布は、平均や分散が有限であるかどうかに関わらず、独立かつ同一分布の分布の和のアトラクターとなる安定分布の族に属します。極限ケースであるガウス分布を除き、すべての安定分布は裾が重く、分散は無限大です。ガウス分布は、安定しており、確率密度関数を解析的に表現できる数少ない分布の一つであり、他にはコーシー分布とレヴィ分布があります。
対称性と微分
[編集]密度(平均 と分散)を持つ正規分布には、次の特性があります。
- これは分布の最頻値、中央値、平均値を兼ねる点を中心に対称である。 [ 25 ]
- これは単峰性である。1次導関数は、 に対しては正、に対しては負、 に対しては0である。
- 曲線と軸によって囲まれた領域は1 (つまり 1 に等しい) です。
- その一次導関数は
- その2次導関数は
- その密度には2つの変曲点( 2次導関数がゼロで符号が変わる点)があり、平均値から1標準偏差離れたところ、つまり[ 25 ]と[ 26 ]にある。
- その密度は対数凹面である。[ 25 ]
- その密度は無限に微分可能であり、実際2次の超滑らかさを持つ。 [ 26 ]
さらに、標準正規分布の密度 (つまり、および) には次の特性もあります。
- その一次導関数は
- その2次導関数は
- より一般的には、そのn次導関数は、n次(確率論的)エルミート多項式である。[ 27 ]
- が既知で、特定のセットに含まれる正規分布変数 の確率は、分数が標準正規分布に従うと仮定して計算できます。
瞬間
[編集]変数 の単純モーメントと絶対モーメントは、それぞれ と の期待値です。 の期待値がゼロの場合、これらのパラメータは中心モーメントと呼ばれ、そうでない場合は非中心モーメントと呼ばれます。通常、整数位 のモーメントのみに着目します。
が正規分布に従う場合、実部が−1より大きい任意の に対して非中心モーメントが存在し、有限である。任意の非負整数 に対して、単純中心モーメントは次のようになる。[ 28 ]ここで は二重階乗、つまり から1までのすべての数の積で と同じ偶奇性を持つものを表す。
中心絶対モーメントはすべての偶数次数に対しては単純モーメントと一致するが、奇数次数に対しては非ゼロとなる。任意の非負整数に対して
最後の式は、任意の非整数に対しても有効である。平均が、平モーメントと絶対モーメントは、合流型超幾何関数で表すことができ、[ 29 ]
これらの式は、 が整数でない場合でも有効です。一般化エルミート多項式も参照してください。
| 注文 | 非中心モーメント、 | 中心モーメント、 |
|---|---|---|
| 0 | | |
| 1 | | |
| 2 | ||
| 3 | | |
| 4 | ||
| 5 | | |
| 6 | ||
| 7 | | |
| 8 |
が区間内にあるという事象を条件とする の期待値は、 と は それぞれ の密度と累積分布関数です。これは逆ミルズ比として知られています。上記では、逆ミルズ比のように標準正規密度の代わりに の密度 が使用されていることに注意してください。つまり、ここでは の代わりに が使用されています。
フーリエ変換と特性関数
[編集]平均と分散を持つ正規密度のフーリエ変換は[ 30 ]である。
ここで、 は虚数単位です。平均が の場合、最初の因子は 1 であり、フーリエ変換は、定数因子を除けば、平均 0、分散 の周波数領域上の正規密度です。特に、標準正規分布 はフーリエ変換の固有関数です。
確率論において、実数値確率変数 の確率分布のフーリエ変換は、その変数の特性関数 と密接に関連しており、特性関数は、実変数 (フーリエ変換の周波数パラメータ)の関数としての の期待値として定義されます。この定義は、複素数値変数 に解析的に拡張できます。[ 31 ]両者の関係は以下のとおりです。
の実部と虚部はそれぞれ次の式で 表される。
同様に、 および 。
で評価されるこれらの式は、ガウス確率変数上のこれらの基本的な三角関数と双曲線関数の期待値を与え、それはまたイッサーリスの定理の結果として見ることもできます。
モーメント生成関数とキュムラント生成関数
[編集]実数確率変数 のモーメント生成関数は、実パラメータ の関数としての の期待値です。密度 、平均 、分散 の正規分布の場合、モーメント生成関数は存在し、次の式に等しくなります 。
任意の について、モーメント母関数 ( の指数級数として表される) における の係数は、正規分布の期待値 です。
キュムラント母関数はモーメント母関数の対数であり、すなわち
この指数級数の係数はキュムラントを定義しますが、これは の二次多項式であるため、最初の 2 つのキュムラント、つまり平均 と分散 のみがゼロ以外になります。
一部の著者は、代わりに特性関数 E[ e itX ] = e iμt − σ 2 t 2 /2およびln E[ e itX ] = iμt − を用いることを好む。1/2 σ 2 t 2。
シュタイン演算子とクラス
[編集]スタイン法では、スタイン演算子と確率変数のクラスは 、 となるすべての絶対連続関数 のクラスです。
ゼロ分散限界
[編集]がゼロに近づく極限では、確率密度はを除くすべての場所でゼロに近づく。では確率密度は に近づくが、その積分は1のままである。正規分布を分散がゼロの場合に拡張することは、ディラックのデルタ測度を用いて定義できるが、結果として得られる確率変数は絶対的に連続ではないため、確率密度関数を持たない。このような確率変数の累積分布関数は、平均 によって変換されたヘヴィサイドのステップ関数、すなわち
最大エントロピー
[編集]指定された有限平均 と有限分散 を持つ実数上のすべての確率分布のうち、正規分布は最大エントロピーを持つ分布です。[ 21 ]これを確認するために、 を確率密度 を持つ連続ランダム変数とします。 のエントロピーは次のように定義されます[ 32 ] [ 33 ] [ 34 ]ここで、 の場合は常に 0 になります。 この関数は、分布が適切に正規化され、指定された平均と分散を持つという制約の下で、変分計算を使用して最大化できます。 3 つのラグランジュ乗数を持つ関数が定義されます。
エントロピーが最大になると、 についての小さな変化によって についての変化が生じ、これは 0 に等しくなります。
これは任意の小さな に対して成り立つため、 を乗じる係数はゼロでなければならず、 について解くと次の式が得られます。
が適切に正規化され、指定された平均と分散を持つというラグランジュ制約は、 、 、および が次のように選択される 場合にのみ満たされます。正規分布のエントロピーは に等しく、平均 とは無関係です。
その他の特性
[編集]- ある確率変数 の特性関数がゼロの近傍で の形式である場合(ここで は多項式)、Marcinkiewicz の定理(Józef Marcinkiewiczにちなんで名付けられている)によれば、 はせいぜい二次多項式であり、したがって は正規確率変数であると主張しています。[ 35 ]この結果から、正規分布は有限個(2 個)の非ゼロキュムラントを持つ唯一の分布であることがわかります。
- と が共に正規分布かつ無相関である場合、それらは独立である。 と が共に正規分布であるという要件は不可欠であり、それがなければこの性質は成り立たない。[ 36 ] [ 37 ] [証明]非正規分布の確率変数の場合、無相関であることは独立性を意味しない。
- ある正規分布と別の正規分布のカルバック・ライブラー距離は次のように与えられる:[ 38 ]同じ分布間のヘリンガー距離は次のように表される。
- に対する正規分布のフィッシャー情報行列は対角行列であり、次の形をとる。
- 正規分布の平均の共役事前分布は別の正規分布である。[ 39 ]具体的には、がiidで事前分布がの場合、 の推定値の事後分布は
- 正規分布族は指数分布族(EF)を形成するだけでなく、実際には二次分散関数(NEF-QVF )を持つ自然指数分布族(NEF)を形成します。正規分布の多くの特性は、NEF-QVF分布、NEF分布、あるいは一般的にはEF分布の特性に一般化されます。NEF-QVF分布は、ポアソン分布、ガンマ分布、二項分布、負の二項分布を含む6つの分布族で構成されますが、確率論や統計学で研究される一般的な分布族の多くはNEFまたはEFです。
- 情報幾何学において、正規分布族は一定曲率を持つ統計多様体を形成する。この族は(±1)接続とに関して平坦である。[ 40 ]
- が に従って分布している場合、 となる。独立性の仮定は存在しないことに注意すること。[ 41 ]
関連ディストリビューション
[編集]中心極限定理
[編集]

中心極限定理は、ある特定の(かなり一般的な)条件下では、多数の確率変数の和が近似的に正規分布に従うことを述べています。より具体的には、は独立かつ同一分布に従う確率変数で、同じ任意分布、ゼロ平均、分散を持ち、 はそれらの平均を で尺度化した値です。すると、 が増加するにつれて、 の確率分布は、平均ゼロ、分散 の正規分布に近づくようになります。
依存度と分布のモーメントに特定の制約が課される場合、定理は独立していない変数および/または同一に分布していない変数に拡張できます。
実際に遭遇する多くの検定統計量、スコア、推定値には、特定の確率変数の和が含まれており、さらに多くの推定値は影響関数を用いることで確率変数の和として表すことができます。中心極限定理は、これらの統計パラメータが漸近的に正規分布に従うことを示唆しています。
中心極限定理は、特定の分布が正規分布で近似できることも意味します。たとえば、
- 二項分布は 、平均と分散が大きい場合、および が0または 1 に近すぎない場合、ほぼ正規分布になります。
- パラメータ のポアソン分布は、 の値が大きい場合、平均 と分散 を持つ正規分布に近似します。[ 42 ]
- カイ二乗分布は、 が大きい場合、平均 、分散でほぼ正規分布になります。
- が大きい場合、スチューデントのt分布は 平均0、分散1でほぼ正規分布になります。
これらの近似値が十分に正確であるかどうかは、それが必要とされる目的と正規分布への収束率に依存します。通常、このような近似値は分布の裾野では精度が低くなります。
中心極限定理における近似誤差の一般的な上限はベリー・エッシーンの定理によって与えられ、近似の改良はエッジワース展開によって与えられます。
この定理は、多数の均一なノイズ源の和をガウスノイズとしてモデル化することを正当化するためにも用いられる。AWGNを参照。
通常の変数の演算と機能
[編集]
倍 = 10 , σ2
歳 = 20、ρ xy = 0.495。d : 4つのiid標準正規分布変数の関数| x 1 | + ... + | x 4 |の確率密度。これらはレイトレーシング法によって計算される。[ 43 ]
1つ以上の独立または相関のある正規変数からなる任意の関数の確率密度、累積分布、および逆累積分布は、光線追跡法[ 43 ](Matlabコード)を用いて計算することができる。以下の節では、いくつかの特殊なケースについて考察する。
単一の通常変数に対する演算
[編集] が平均 、分散で正規分布している場合、
- は、任意の実数 と に対して、平均と分散 の正規分布に従います。つまり、正規分布族は線形変換に対して閉じています。
- の指数は対数正規分布します: 。
- の標準シグモイドはロジット正規分布に従います。
- の絶対値は折り畳み正規分布に従います: 。これは半正規分布と呼ばれます。
- 正規化された残差の絶対値 は、自由度 1 のカイ 分布に従います。
- の平方は、自由度が1の非心カイ2乗分布に従います。 の場合、分布は単にカイ2乗と呼ばれます。
- 正規変数の対数尤度は、単にその確率密度関数の対数です。これは標準正規変数のスケーリングおよびシフトされた平方であるため、スケーリングおよびシフトされたカイ二乗変数として分布します。
- 変数の分布が区間に制限されている場合、これを切断正規分布と呼びます。
- 位置 0 、スケール のレヴィ分布に従います。
2つの独立した正規変数に対する演算
[編集]- と が、平均、分散、を持つ2 つの独立した正規確率変数である場合、それらの合計も正規分布し、[証明]平均、分散になります。
- 特に、 と が平均0、分散 の独立した正規分布に従う場合、とも独立で正規分布に従い、平均0、分散 となる。これは分極恒等式の特別な場合である。[ 44 ]
- 、が平均、分散 の2つの独立した正規偏差であり、、が任意の実数である場合、変数も平均、分散の正規分布に従います。したがって、正規分布は安定(指数)です。
- 、が正規分布である場合、それらの正規化された幾何平均は、およびを満たす正規分布になります。
2つの独立した標準正規変数に対する演算
[編集]とが平均0、分散1の2つの独立した標準正規確率変数である場合、
- それらの和と差は、平均 0、分散 2 で正規分布します。
- それらの積は、密度関数 の積分布[ 45 ]に従う。ここで、は第二種修正ベッセル関数である。この分布はゼロの周りで対称で、 で非有界であり、特性関数を持つ。
- それらの比率は標準のコーシー分布に従います。
- それらのユークリッドノルムはレイリー分布に従います。
複数の独立した正規変数に対する演算
[編集]- 独立した正規偏差の任意の線形結合は正規偏差です。
- が独立した標準正規分布に従う場合、それらの平方和は自由度が のカイ二乗分布に従う。
- が平均 と分散 を持つ独立した正規分布の確率変数である場合、それらの標本平均は標本標準偏差から独立しており、[ 46 ]これはBasuの定理またはCochranの定理を使用して証明できます。[ 47 ]これら2つの量の比は、自由度を持つスチューデントのt分布に従います。
- が独立した標準正規確率変数である場合、それらの正規化された平方和の比は自由度が( n , m )のF分布に従う: [ 48 ]
複数の相関正規変数に対する演算
[編集]密度関数の演算
[編集]分割正規分布は、異なる正規分布の密度関数の尺度区間を結合し、密度を再尺度化して1つに統合するという形で最も直接的に定義されます。切断正規分布は、単一の密度関数の区間を再尺度化することで得られます。
無限割り算とクラメールの定理
[編集]任意の正の整数nに対して、平均 と分散 を持つ任意の正規分布は、それぞれ平均と分散 を持つn個の独立した正規偏差の和の分布である。この性質は無限割り切れる可能性と呼ばれる。[ 49 ]
逆に、とが独立した確率変数であり、それらの和が正規分布に従う場合、との両方が正規偏差でなければならない。[ 50 ]
この結果はクラメールの分解定理として知られており、 2つの分布の畳み込みが正規分布となるのは、両方が正規分布である場合に限る、ということを意味する。クラメールの定理は、独立した非ガウス分布変数の線形結合は、正規分布に任意に近づくことはあっても、厳密に正規分布となることは決してないということを意味している。[ 35 ]
カック・バーンスタイン定理
[編集]カック・ベルンシュタインの定理は、 XとYが独立で、かつXとYも独立であれば、XとYは必ず正規分布に従うことを述べている。 [ 51 ] [ 52 ]
より一般的には、が独立した確率変数である場合、2つの異なる線形結合とが独立であることは、すべてが正規分布で、がの分散を表す場合、かつその場合に限ります。[ 51 ]
拡張機能
[編集]確率論において最も重要な分布の一つである正規分布の概念は、単変数(つまり1次元)の場合(ケース1)の標準的な枠組みをはるかに超えて拡張されています。これらの拡張はすべて正規分布やガウス分布とも呼ばれるため、名称にはある程度の曖昧さが存在します。
- 多変量正規分布は、k次元ユークリッド空間におけるガウスの法則を記述する。ベクトルX∈Rkが多変量正規分布に従うとは、その成分Σの任意の線形結合がkj
= 1a j X jは(一変量)正規分布に従う。X の分散はk × k 対称正定値行列Vである。多変量正規分布は楕円分布の特殊なケースである。したがって、 k = 2の場合の等密度軌跡は楕円であり、任意のkの場合の等密度軌跡は楕円体である。 - 修正ガウス分布は、すべての負の要素が 0 にリセットされた、正規分布の修正バージョンです。
- 複素正規分布は複素正規ベクトルを扱います。複素ベクトルX ∈ C k は、その実数成分と虚数成分の両方が2 k次元多変量正規分布に従う場合、正規分布であると言われます。X の分散共分散構造は、分散行列Γと関係行列Cという2つの行列で記述されます。
- 行列正規分布は、正規分布する行列の場合を説明します。
- ガウス過程は正規分布する確率過程である。これらは無限次元ヒルベルト空間 Hの元とみなすことができ、 k = ∞の場合の多変数正規ベクトルの類似物となる。任意の定数a ∈ Hに対してスカラー積( a , h )が(一変量)正規分布に従うとき、ランダム元h ∈ Hは正規であるとされる。このようなガウスランダム元の分散構造は、線形共分散演算子K : H → Hで記述できる。いくつかのガウス過程は、独自の名前が付けられるほど広く知られるようになった。
- ガウス q 分布は、正規分布のq 類似物を表す抽象的な数学的構成です。
- q-ガウス分布は、ツァリスエントロピーを最大化するという意味でガウス分布の類似物であり、ツァリス分布の一種です。この分布は、上記のガウスq分布とは異なります。
- カニアダキスκ-ガウス分布は、カニアダキス統計から生じるガウス分布の一般化であり、カニアダキス分布の 1 つです。
確率変数Xは、 μが平均、σが2つの部分
からなる分布に従うとき、2つの部分からなる正規分布に従う。2
1 およびσ2
2 それぞれ平均の左側と右側の分布の分散です。
この分布の平均E( X )、分散V( X )、および3次中心モーメントT( X )は決定されている[ 53 ]
ガウス法則の主な実用的用途の一つは、実際に遭遇する様々な確率変数の経験分布をモデル化することです。このような場合、より豊富な分布族、つまり2つ以上のパラメータを持つ分布族を拡張することで、経験分布をより正確に近似できるようになることが考えられます。このような拡張の例としては、以下のものがあります。
- ピアソン分布— 正規法則を拡張して、異なる歪度と尖度の値を含む 4 つのパラメータを持つ確率分布の族。
- 一般化正規分布は指数分布とも呼ばれ、漸近挙動がより厚くなったり薄くなったりする分布の裾を許容します。
統計的推論
[編集]パラメータの推定
[編集]正規分布のパラメータが分からず、推定したい場合がよくあります。つまり、正規分布の母集団から標本を抽出し、パラメータ と のおおよその値を知りたいのです。この問題に対する標準的なアプローチは最尤法であり、対数尤度関数 を最大化する必要があります。 と について導関数をとり、結果として得られる一階条件系を解くと、最大尤度推定値が得られます。
次に次のようになります。
標本平均
[編集]推定量はすべての観測値の算術平均であるため、標本平均と呼ばれます。この統計量は に対して完全かつ十分であるため、レーマン・シェッフェの定理により、一様最小分散不偏(UMVU) 推定量となります。[ 54 ]有限標本では正規分布します。 つまり、この推定量の分散は、逆フィッシャー情報行列のμμ要素に等しくなります。これは、推定量が有限標本効率的であることを意味します。実用上重要なのは、 の標準誤差がに比例することです。つまり、標準誤差を 10 分の 1 に減らしたい場合は、標本内の点の数を 100 倍に増やす必要があります。この事実は、世論調査の標本サイズやモンテカルロシミュレーションの試行回数を決定する際に広く使用されています。
漸近理論の観点から見ると、は に整合しており、つまりのとき確率的にに収束する。推定値は漸近的に正規 でもある。これは有限サンプルにおいて正規であることの単純な系である。
標本分散
[編集]推定値は標本分散と呼ばれます。これは標本 ( ) の分散だからです。実際には、 の代わりに別の推定値がよく使用されます。この別の推定値は と表記され 、標本分散とも呼ばれますが、これは用語の曖昧さを表しています。その平方根 は標本標準偏差と呼ばれます。推定値は、分母にnではなく ( n − 1)を持つ点でと異なります(いわゆるベッセル補正)。と の差は、nが大きい場合は無視できるほど小さくなります。ただし、有限標本では、 を使用する理由は、が基礎パラメータ の不偏推定値であるのに対し、は偏っているからです。また、レーマン・シェッフェの定理により、推定値は一様最小分散不偏 ( UMVU ) であり、[ 54 ]すべての不偏推定値の中で「最良」の推定値となります。しかし、平均二乗誤差(MSE)基準に関しては、偏りのある推定値の方が よりも優れていることが示されます。有限サンプルでは、 とはどちらも自由度(n − 1)の尺度カイ二乗分布に従います。これらの式の最初の式は、 の分散が に等しく、逆フィッシャー情報行列 の σσ 要素()よりもわずかに大きいことを示しています。したがって、は の効率的な推定値ではなく、さらに はUMVU であるため、 の有限サンプルの効率的な推定値は存在しないと結論付けることができます。
漸近理論を適用すると、推定量と推定量はどちらも矛盾がなく、つまり、サンプルサイズ のときに確率が に収束します。また、2つの推定量はどちらも漸近的に正規分布に従います。特に、どちらの推定量も に対して漸近的に効率的です 。
信頼区間
[編集]コクランの定理によれば、正規分布では標本平均と標本分散s 2は独立しており、これはそれらの共分布を考慮しても利点がないことを意味する。また逆の定理もあり、標本において標本平均と標本分散が独立している場合、その標本は正規分布から来ているに違いない。とsの間の独立性は、いわゆるt統計量を構成するために用いることができる。この量tは自由度( n − 1)のスチューデントt分布を持ち、補助統計量(パラメータの値に依存しない)である。このt統計量の分布を反転すると、 μの信頼区間を構成することができる。[ 55 ]同様に、統計量s 2のχ 2分布を反転すると、 σ 2の信頼区間が得られる。[ 56 ]ここでt k,pおよびχ 2
k、p はそれぞれt分布とχ 2分布のp番目の分位数です。これらの信頼区間の信頼水準は1 − αです。つまり、真の値μとσ 2は、確率(または有意水準)αでこれらの区間から外れます。実際には、 α = 5%とするのが一般的で、その結果は95%信頼区間となります。σの信頼区間は、σ 2の区間境界の平方根を取ることで求められます。
およびs 2の漸近分布から近似式を導くことができます。近似式はnの大きな値に対して有効となり、標準正規分布の四分位数z α /2はnに依存しないため、手計算に便利です。特に、最も一般的なα = 5%の値は、 | z 0.025 | = 1.96となります。
正規性検定
[編集]正規性検定は、与えられたデータセット{ x 1 , ..., x n }が正規分布に従う尤度を評価する。典型的には、帰無仮説 H 0は観測値が不特定の平均μと分散σ 2で正規分布するというもの、対立仮説H a は分布が任意であるというものである。この問題に対して、多くの検定法(40種類以上)が考案されている。その中でも特に著名なものを以下に概説する。
診断プロットは直感的に魅力的ですが、帰無仮説を受け入れるか拒否するかを非公式な人間の判断に依存するため、同時に主観的です。
- Q-Qプロット(正規確率プロットまたはランクイットプロットとも呼ばれる)は、データセットからソートされた値を、標準正規分布の対応する分位点の期待値に対してプロットしたものです。つまり、(Φ −1 ( p k ), x ( k ) ) という形式の点のプロットです。プロット点p kはp k = ( k − α )/( n + 1 − 2 α )に等しく、 αは調整定数で、0から1の間の任意の値をとります。帰無仮説が真である場合、プロットされた点はほぼ直線上に並ぶはずです。
- P-Pプロット– Q-Qプロットに似ていますが、あまり使用されません。この手法は、点(Φ( z ( k ) ), p k )をプロットすることで構成されます。ここで、正規分布に従うデータの場合、このプロットは(0, 0)と(1, 1)の間の直線上に位置します。
適合度検定:
モーメントベースのテスト:
- ダゴスティーノのK二乗検定
- ジャック・ベラテスト
- シャピロ・ウィルク検定:これは、Q-Qプロットの傾きがσである直線に基づいています。この検定では、傾きの最小二乗推定値と標本分散の値を比較し、これら2つの量が有意に異なる場合に帰無仮説を棄却します。
経験分布関数に基づくテスト:
正規分布のベイズ分析
[編集]正規分布データのベイズ分析は、考えられるさまざまな可能性によって複雑になります。
- 平均または分散のいずれか、あるいはどちらも固定量と見なすことができます。
- 分散が不明な場合、分析は分散を用いて直接行うか、分散の逆数である精度を用いて行うことができます。式を精度で表す理由は、ほとんどの場合、分析が簡略化されるためです。
- 単変量と多変量の両方のケースを考慮する必要があります。
- 未知の変数には共役事前分布または不適切な 事前分布のいずれかが適用される場合があります。
- ベイズ線形回帰では、基本モデルにおいてデータが正規分布すると仮定し、回帰係数に正規事前分布を適用するという追加のケース群が存在します。結果として得られる分析は、独立かつ同一分布するデータの基本ケースと同様です。
非線形回帰の場合の式は共役先行論文にまとめられています。
2つの二次方程式の和
[編集]スカラー形式
[編集]次の補助式は、事後更新方程式を簡素化するのに役立ちます。事後更新方程式は、そうでなければかなり面倒になります。
この式は、 xの2つの二次方程式の和を、平方展開、xの項のグループ化、平方完成によって書き直したものです。いくつかの項に付随する複素定数因子については、以下の点に注意してください。
- 係数はyとzの加重平均の形式をとります。
- これは、この係数が量aとbの逆数が直接加算される状況から生じるものと考えられることを示しています。したがって、 aとb自体を加算するには、元の単位に戻すために、結果を逆数化し、加算し、さらに逆数化する必要があります。これはまさに調和平均によって実行される操作であり、が aとbの調和平均の半分であることは驚くべきことではありません。
ベクトル形式
[編集]同様の式は、2つのベクトル二次方程式の和に対しても書けます。x 、y、zが長さkのベクトルで、AとBが対称で逆行列のサイズがのとき、
どこ
x ′ A xの形式は二次形式と呼ばれ、スカラーである。言い換えれば、xの要素のペアの積のすべての可能な組み合わせを、それぞれ別々の係数で和したものである。さらに であるため、 Aの非対角要素については和のみが重要であり、 Aが対称 であると仮定しても一般性は損なわれない。さらに、Aが対称である場合、形式
平均からの差の合計
[編集]もう一つの便利な式は次のとおりです。
既知の差異あり
[編集]各点xが既知の分散σ 2に従う、サイズnのiid正規分布データ ポイントXのセットの場合、共役事前分布も正規分布になります。
これは、分散を精度として書き直すことで、つまり τ = 1/σ 2を用いることで、より簡単に示すことができます。そして とであれば、以下のように進めます。
まず、尤度関数は次のようになります (平均からの差の合計については上記の式を使用)。
次に、次のように進めます。
上記の導出では、2つの二次方程式の和に上記の公式を使用し、 μを含まない定数因子をすべて除去しました。その結果は、平均と精度を持つ正規分布の核、すなわち
これは、事前パラメータに関する事後パラメータのベイズ更新方程式のセットとして記述できます。
つまり、総精度がnτ(または、総分散がn / σ 2)で平均値がであるn 個のデータ点を結合し、データの総精度を事前総精度に加算するだけで新しい総精度を導出し、精度加重平均(つまり、データ平均と事前平均をそれぞれ関連する総精度で重み付けした加重平均)によって新しい平均を形成します。精度が観測値の確実性を示すものと考えれば、これは論理的に意味を成します。事後平均の分布では、各入力要素がその確実性によって重み付けされ、この分布の確実性は個々の確実性の合計です。(このことを直感的に理解するには、「全体は(または全体は)部分の合計よりも大きい」という表現と比較してください。さらに、事後分布の知識は事前分布と尤度に関する知識の組み合わせから得られるため、事後分布のほうがその要素のいずれよりも確実であるというのは理にかなっています。)
上記の式は、正規分布の共役事前分布をベイズ分析する方が、精度の観点からより便利である理由を明らかにしています。事後精度は、事前精度と尤度精度の和に過ぎず、事後平均は前述のように精度加重平均によって計算されます。同じ式を分散の観点から書くと、すべての精度を逆数にすることで、より見苦しい式が得られます。
平均値がわかっている場合
[編集]大きさnのiid正規分布を持つデータ点Xの集合において、各点xが既知の平均μに従う場合、分散の共役事前分布は逆ガンマ分布または尺度逆カイ二乗分布に従う。これら2つは、パラメータ化が異なることを除いて等価である。逆ガンマ分布の方が一般的に用いられるが、便宜上、尺度逆カイ二乗分布を用いる。σ 2の事前分布は以下のとおりである。
上記の尤度関数を分散の観点から書くと次のようになる。ここで
それから:
上記は、スケール逆カイ二乗分布でもあり、
逆ガンマ分布の観点から再パラメータ化すると、結果は次のようになります。
平均値と分散が不明の場合
[編集]大きさnのiid正規分布に従うデータ点Xの集合において、各点xが未知の平均μと未知の分散σ2に従う場合、平均と分散に対して、正規逆ガンマ分布からなる複合(多変量)共役事前分布が配置される。論理的には、これは次のように定義される。
- 平均は不明だが分散が既知のケースの分析から、更新方程式には、データ ポイントの平均と、データ ポイントの合計分散(既知の分散をデータ ポイントの数で割って計算) で構成されるデータから計算された十分な統計量が含まれることがわかります。
- 分散は不明だが平均値は既知のケースの分析から、更新方程式にはデータ ポイントの数と偏差の二乗和で構成されるデータに対する十分な統計量が含まれていることがわかります。
- 事後更新値は、さらにデータを処理する際の事前分布として機能することを覚えておいてください。したがって、前述の十分統計量に基づいて事前分布を論理的に考え、可能な限り同じ意味論を念頭に置く必要があります。
- 平均と分散の両方が未知のケースを扱うには、平均と分散に独立した事前分布を配置し、平均、総分散、分散事前分布を計算するために使用されるデータ ポイントの数、および偏差の二乗和を固定推定することができます。ただし、実際には、平均の総分散は未知の分散に依存し、分散事前分布に入る偏差の二乗和は未知の平均に依存する(ように見える)ことに注意してください。実際には、後者の依存関係は比較的重要ではありません。実際の平均をシフトすると、生成されるポイントが同じ量だけシフトし、平均して偏差の二乗は同じままになります。ただし、平均の総分散の場合はそうではありません。未知の分散が増加すると、平均の総分散も比例して増加するため、この依存関係を捉えたいと考えます。
- これは、未知の分散に対する平均の条件付き事前分布を作成し、事前分布に関連付けられた疑似観測の平均を指定するハイパーパラメータと、疑似観測の数を指定する別のパラメータを作成することを示唆しています。 この数は分散のスケーリングパラメータとして機能し、実際の分散パラメータに対する平均の全体的な分散を制御できるようになります。 分散の事前分布にも 2 つのハイパーパラメータがあり、1 つは事前分布に関連付けられた疑似観測の偏差の二乗和を指定し、もう 1 つは再び疑似観測の数を指定します。 各事前分布には疑似観測の数を指定するハイパーパラメータがあり、それぞれの場合でその事前分布の相対的な分散を制御します。 これらは 2 つの別々のハイパーパラメータとして指定されるため、2 つの事前分布の分散 (信頼度とも呼ばれます) を個別に制御できます。
- これにより、すぐに正規逆ガンマ分布が得られます。これは、共役事前分布(分散上の逆ガンマ分布と、分散を条件とする平均上の正規分布)が使用され、定義したのと同じ 4 つのパラメータを使用して、定義した 2 つの分布の積になります。
事前確率は通常、次のように定義されます。
更新方程式は次のように導出できます。疑似観測値の個数に実際の観測値を加算します。新しい平均ハイパーパラメータはここでも加重平均ですが、今回は観測値の相対数で重み付けされます。最後に、の更新は既知の平均値の場合と同様ですが、この場合、真の平均値ではなく観測データ平均値を基準とした偏差の二乗和が取られます。そのため、事前平均値とデータ平均値の偏差に起因する追加の誤差要因に対処するために、新たな相互作用項を追加する必要があります。
発生と応用
[編集]実際の問題における正規分布の出現は、大まかに次の 4 つのカテゴリに分類できます。
- 正確には正規分布です。
- 近似的に正規な法則、例えば、そのような近似が中心極限定理によって正当化される場合、そして
- 正規分布としてモデル化された分布 – 正規分布は、与えられた平均と分散に対してエントロピーが最大となる分布です。
- 回帰問題 - 体系的な効果が十分にモデル化された後に正規分布が見つかる。
正確な正規性
[編集]
正規分布はいくつかの物理理論で発生します。
- 独立して運動する完全に弾性のある球の速度分布。これはマクスウェルの気体力学理論第1部(1860年)の結果である。[ 57 ] [ 58 ]
- 量子調和振動子の位置空間における基底状態 波動関数。[ 59 ]
- 拡散を受ける粒子の位置。[要出典]粒子が初期に特定の点に位置する場合(つまり、その確率分布がディラックのデルタ関数である場合)、時刻t以降、その位置は分散tの正規分布で記述され、拡散方程式 を満たす。初期位置が特定の密度関数で与えられる場合、時刻tにおける密度はgと正規確率密度関数の畳み込みとなる。
おおよその正規性
[編集]中心極限定理によって説明されるように、近似的に正規分布が成立する状況は数多く存在します。結果が多数の小さな効果を独立して加法的に作用させることによって生じる場合、その分布は正規分布に近似します。効果が加法的ではなく乗法的に作用する場合、あるいは他の効果よりも著しく大きな大きさを持つ単一の外部影響がある場合、正規分布の近似は有効ではありません。
- 計数問題では、中心極限定理が離散から連続への近似を含み、無限に分割可能かつ分解可能な分布が関係している。
- 熱放射は、中心極限定理により、非常に短い時間スケールではボーズ・アインシュタイン分布を示し、より長い時間スケールでは正規分布を示します。
想定される正規性
[編集]
正規曲線、つまり誤差のラプラシアン曲線の出現は、非常に異常な現象としか認識できません。これは特定の分布において大まかに近似されます。そのため、そしてその美しい単純さゆえに、特に理論的な研究においては、おそらく第一近似として用いることができるでしょう。
この仮定を経験的にテストする統計的手法があります。上記の正規性テストのセクションを参照してください。
- 生物学では、さまざまな変数の対数は正規分布、つまり(男性/女性の集団に分けた後)対数正規分布になる傾向があり、その例には次のものがあります。
- 生体組織の大きさの測定(長さ、高さ、皮膚面積、重量)[ 60 ]
- 生物標本の不活性な付属肢(毛、爪、爪、歯)の成長方向の長さ。おそらく樹皮の厚さもこの範疇に入る。
- 成人の血圧など、特定の生理学的測定値。
- 金融、特にブラック・ショールズ・モデルにおいては、為替レート、物価指数、株価指数の対数の変化は正規分布に従うと仮定されている(これらの変数は単利ではなく複利のように振舞うため、乗法的である)。ブノワ・マンデルブロなどの数学者の中には、裾が厚い対数レヴィ分布の方が、特に株価暴落の分析にはより適切なモデルであると主張する者もいる。金融モデルにおける正規分布の仮定の使用は、ナシム・ニコラス・タレブの著作においても批判されている。
- 物理実験における測定誤差は、しばしば正規分布によってモデル化されます。正規分布の使用は、測定誤差が正規分布に従うと仮定していることを意味するのではなく、むしろ、誤差の平均と分散に関する知識のみに基づいて、可能な限り最も保守的な予測を生成することを意味します。[ 61 ]
- 標準化されたテストでは、問題数と難易度を選択するか(IQテストのように)、生のテストスコアを正規分布に当てはめて出力スコアに変換することで、結果を正規分布に沿わせることができます。例えば、SATの従来の200~800点の範囲は、平均500点、標準偏差100点の正規分布に基づいています。

- 多くのスコアは正規分布から導出されます。これには、パーセンタイルランク(パーセンタイルまたはクォンタイル)、正規曲線相当値、スタンニン、Zスコア、Tスコアが含まれます。さらに、一部の行動統計手法では、スコアが正規分布することを前提としています。例えば、t検定や分散分析などです。ベルカーブグレーディングでは、スコアの正規分布に基づいて相対的な成績が割り当てられます。
- 水文学において、長期間の河川流量や降雨量(例えば月間総量や年間総量)の分布は、中心極限定理に従って、しばしば実質的に正規分布に従うと考えられる。[ 62 ]右のグラフは、10月の降雨量を順位付けし、二項分布に基づく90%信頼区間を示した正規分布を当てはめた例を示している。降雨量データは、累積頻度分析の一部としてプロットされた位置によって表されている。
方法論的問題と査読
[編集]ジョン・イオアニディスは 、研究結果を検証するための基準として正規分布する標準偏差を使用すると、正規分布しない現象についての反証可能な予測が検証されないままになると主張した。これには、たとえば、すべての必要条件が存在し、加算のように一方が他方の代わりになることができない場合にだけ現れる現象や、ランダムに分布していない現象が含まれる。イオアニディスは、標準偏差中心の検証は、反証可能な予測のうち反証可能な予測のうち証拠がある部分が、反証可能な予測の範囲の非正規分布部分にある場合があり、場合によってはその部分にあるため、すべてではないものの一部の反証可能な予測がある仮説や理論に、正当であるかのような誤った印象を与えるだけでなく、反証可能な予測のいずれも正規分布していない仮説を、実際には反証可能な予測をしているにもかかわらず、あたかも反証不可能であるかのように根拠もなく却下することになる、と主張している。イオアニディスは、相互に排他的な理論が研究雑誌によって検証済みとして受け入れられるケースの多くは、非正規分布の予測に対する実証的な反証を雑誌が考慮に入れなかったことが原因で、相互に排他的な理論が正しいからではないと主張している。相互に排他的な理論が正しいということはあり得ないが、2つの相互に排他的な理論が両方とも間違っていて、3つ目の理論が正しいということはあり得る。[ 63 ]
計算方法
[編集]正規分布から値を生成する
[編集]
コンピュータシミュレーション、特にモンテカルロ法の応用においては、正規分布に従う値を生成することが望ましい場合が多い。以下に挙げるアルゴリズムはすべて標準正規偏差を生成する。これは、N ( μ , σ 2 )がX = μ + σZ(ここでZは標準正規分布)として生成できるためである。これらのアルゴリズムはすべて、一様乱数を生成できる乱数生成器 U が利用可能であることを前提としている。
- 最も簡単な方法は、確率積分変換の性質に基づくものである。すなわち、 Uが(0,1)に均一に分布する場合、Φ −1 ( U )は標準正規分布に従う。この方法の欠点は、プロビット関数Φ −1の計算に依存しており、これは解析的に行うことができないことである。いくつかの近似法は、Hart (1968)およびerf論文に記載されている。Wichuraはこの関数を小数点16桁まで計算する高速アルゴリズムを提示しており、[ 64 ] Rは正規分布のランダム変量を計算するためにこのアルゴリズムを使用している。
- 中心極限定理に基づく、プログラムしやすい近似手法は以下のとおりです。12個の均一なU (0,1)偏差を生成し、それらをすべて加算し、6を引くと、結果として得られるランダム変数はほぼ標準正規分布に従います。実際には、分布はアーウィン・ホール分布、つまり正規分布の12セクション11次多項式近似になります。このランダム偏差の範囲は(-6, 6)に限定されます。[ 65 ]真の正規分布では、全サンプルのわずか0.00034%が±6σの範囲外になることに注意してください。
- ボックス・ミュラー法では、(0,1)上に一様分布する2つの独立した乱数UとVを用いる。この場合、2つの乱数変数XとYはともに標準正規分布に従い、独立となる。この定式化は、2変量正規乱数ベクトル( X , Y )に対して、2乗ノルムX 2 + Y 2が自由度2のカイ2乗分布に従うことから生じる。カイ2乗分布は、これらの式における量−2 ln( U )に対応する、容易に生成可能な指数乱数変数である。また、角度は乱数変数Vによって選択される円周上に一様分布する。
- マルサリア極座標法は、ボックス・ミュラー法の修正版であり、正弦関数と余弦関数の計算を必要としません。この方法では、UとVを一様分布(-1,1)から抽出し、S = U 2 + V 2を計算します。Sが1以上の場合は、この手順を最初からやり直し、それ以外の場合は2つの値を返します。ここでも、XとYは独立した標準正規分布の確率変数です。
- 比率法[ 66 ]は棄却法である。アルゴリズムは以下のように進行する。
- 2 つの独立した均一偏差UとVを生成します。
- X = √ 8/ e ( V − 0.5)/ Uを計算します。
- オプション: X 2 ≤ 5 − 4 e 1/4 Uの場合、 Xを受け入れてアルゴリズムを終了します。
- オプション: X 2 ≥ 4 e −1.35 / U + 1.4の場合はXを拒否し、手順1からやり直します。
- X 2 ≤ −4 ln Uの場合はXを受け入れ、それ以外の場合はアルゴリズムを最初からやり直します。
- 2つのオプションステップにより、最終ステップでの対数評価はほとんどの場合回避できます。これらのステップは大幅に改善することができ[ 67 ]、対数評価はほとんど行われなくなります。
- ジッグラトアルゴリズム[ 68 ]はボックス・ミュラー変換よりも高速でありながら、正確性も維持しています。全ケースの約97%において、2つの乱数(1つはランダム整数、もう1つはランダム一様乱数)、1つの乗算、そして条件判定のみを使用します。これら2つの乱数の組み合わせが「ジッグラトの核」(対数を用いた一種の棄却標本抽出)の外側にくる3%のケースにおいてのみ、指数関数やより一様性の高い乱数を使用する必要があります。
- 標準正規分布からサンプリングするには整数演算を使用することができる。[ 69 ] [ 70 ]この方法は理想的な近似の条件を満たすという意味で正確である。[ 71 ]つまり、標準正規分布から実数をサンプリングし、これを最も近い表現可能な浮動小数点数に丸めるのと同じである。
- 高速アダマール変換と正規分布の関係についても研究がなされている[ 72 ]。この変換は加算と減算のみを用いており、中心極限定理により、ほぼあらゆる分布の乱数は正規分布に変換されるからである。この点において、一連のアダマール変換とランダムな順列を組み合わせることで、任意のデータセットを正規分布のデータに変換することができる。
正規累積分布関数と正規分位関数の数値近似
[編集]標準正規累積分布関数は、科学計算や統計計算で広く使用されています。
Φ( x )の値は、数値積分、テイラー級数、漸近級数、連分数など、様々な手法によって非常に正確に近似することができます。求められる精度レベルに応じて、様々な近似法が用いられます。
- Zelen & Severo (1964)は、絶対誤差| ε ( x ) |<7.5·10−8 (アルゴリズム26.2.17)で、 x > 0のΦ( x )の近似値を与えている。ここで、ϕ ( x )は標準正規確率密度関数、b 0 = 0.2316419、b 1 = 0.319381530、b 2 = −0.356563782、b 3 = 1.781477937、b 4 = −1.821255978、b 5 = 1.330274429である。
- Hart (1968)は、erfc()関数の近似法として、指数関数の有無を問わず、有理関数を用いた数十種類の近似法を挙げています。彼のアルゴリズムは、複雑さの度合いと得られる精度がそれぞれ異なり、絶対精度は最大で24桁です。West (2009)のアルゴリズムは、Hart のアルゴリズム 5666 と末尾の連分数近似を組み合わせることで、16桁の精度を持つ高速計算アルゴリズムを実現しています。
- Cody (1969)は、Hart68の解法がerfには適していないことを思い出した後、有理チェビシェフ近似によって、相対誤差が最大となるerfとerfcの両方の解法を与えた。
- Marsaglia (2004) は、テイラー級数展開に基づく、任意精度のΦ( x )を計算するための単純なアルゴリズム[注 1 ]を提案しました。このアルゴリズムの欠点は、計算時間が比較的遅いことです(例えば、x = 10の場合、16桁の精度で関数を計算するには300回以上の反復処理が必要です)。
- GNU科学ライブラリは、ハートのアルゴリズムとチェビシェフ多項式による近似を使用して、標準正規累積分布関数の値を計算します。
- Dia (2023)は、絶対値での最大相対誤差が 未満となるの次の近似を提案している:および の場合、
ショア(1982)は、信頼性工学や在庫分析といった工学・オペレーションズ・リサーチの確率的最適化モデルに組み込むことができる単純な近似を導入した。p = Φ( z ) と表記すると、分位関数の最も単純な近似は次のようになる。
この近似では、zの最大絶対誤差は0.026(0.5 ≤ p ≤ 0.9999、0 ≤ z ≤ 3.719に対応)となる。p < 1/2の場合は、pを1 − pに置き換え、符号を変える。もう少し精度の低い近似として、単一パラメータ近似がある。
後者は、正規分布の損失積分の簡単な近似を導き出すのに役立ち、次のように定義される。
この近似は、特に右端において正確である(z ≥ 1.4で最大誤差は10 −3)。累積分布関数の高精度近似は、レスポンスモデリング手法(RMM、Shore, 2011, 2012)に基づいており、Shore (2005)に示されている。
その他の近似については、誤差関数#基本関数による近似を参照してください。特に、累積分布関数 と分位関数の全領域における相対誤差が小さいことは、2008年にSergei Winitzkiによって明示的に可逆な式によって実現されています。
歴史
[編集]発達
[編集]一部の著者[ 73 ] [ 74 ]は、正規分布の発見をド・モアブルに帰しています。彼は1738年[注 2 ]に『確率論』第2版で、( a + b ) nの二項展開における係数の研究を発表しました。ド・モアブルは、この展開の中間項がおよその大きさを持ち、「mまたは1/2 n が無限に大きい量であるとすると、中央から区間ℓだけ離れた項が中央の項に対して持つ比の対数は である。」[ 75 ]この定理は正規確率法則の最初のわかりにくい表現として解釈できるが、スティグラーは、ド・モアブル自身がその結果を二項係数のおおよその規則以上のものとして解釈しておらず、特にド・モアブルには確率密度関数の概念が欠けていたと指摘している。[ 76 ]

1823年、ガウスは、モノグラフ「Theoria combinis observationum erroribus minimis obnoxiae」を出版し、その中で、最小二乗法、最大尤度法、正規分布など、いくつかの重要な統計概念を紹介しました。ガウスは、未知の量Vの測定値を表すために M、M ′、M ″ などを使用し、その量の最も可能性の高い推定値、つまり、観測された実験結果が得られる確率φ ( M − V ) · φ ( M ′ − V ) · φ ( M ″ − V ) · ...を最大化する推定値を模索しました。彼の表記法では、 φΔ は大きさ Δ の測定誤差の確率密度関数です。関数φがわからないため、ガウスは、彼の方法が測定値の算術平均というよく知られた答えに簡約されることを要求しました。[注 3 ]これらの原理から出発して、ガウスは、位置パラメータの推定値として算術平均を選択することを正当化する唯一の法則は、誤差の正規法則であることを証明した。[ 77 ] ここで、hは「観測精度の尺度」である。ガウスはこの正規法則を実験における誤差の一般的なモデルとして用い、現在では非線形加重最小二乗法として知られる法則を定式化した。[ 78 ]

正規分布の法則を最初に提案したのはガウスだが、ラプラスも重要な貢献をした。[注 4 ] 1774年に複数の観測値を集約する問題を初めて提起したのはラプラスであったが、[ 79 ]彼自身の解決策はラプラス分布につながった。1782年に積分∫ e − t 2 dt = √ πの値を初めて計算し、正規分布の正規化定数を与えたのもラプラスであった。[ 80 ]この業績に対して、ガウスはラプラスの先駆性を認めた。[ 81 ]そして、1810年に基本的な中心極限定理を証明してアカデミーに提示したのはラプラスであり、これは正規分布の理論的重要性を強調した。[ 82 ]
1809年にアイルランド系アメリカ人の数学者ロバート・アドレインが、ガウスとは独立して、洞察に富んでいるが欠陥のある正規確率法則の導出を2つ同時に発表したことは興味深い。 [ 83 ]彼の研究は科学界ではほとんど注目されなかったが、1871年にアッベによって発掘された。[ 84 ]
19世紀半ばにマクスウェルは正規分布が単に便利な数学的ツールであるだけでなく、自然現象にも起こり得ることを証明した。[ 57 ]ある方向に分解した速度がxとx + dxの間にある粒子の数は
ネーミング
[編集]今日、この概念は英語では通常、正規分布またはガウス分布として知られています。他にあまり一般的ではない名称としては、ガウス分布、ラプラス・ガウス分布、誤差の法則、誤差の容易さの法則、ラプラスの第二法則、ガウスの法則などがあります。
ガウス自身は、その応用に関係する「正規方程式」に言及してこの用語を造語したようで、正規とは「通常の」ではなく「直交」という専門用語の意味を持つ。[ 85 ]しかし、19世紀末には、一部の著者[注 5 ]が正規分布という名称を使い始め、「正規」という言葉は形容詞として用いられた。この用語は、この分布が典型的、一般的、つまり正規であるとみなされていることを反映していると考えられるようになった。パース(これらの著者の一人)はかつて「正規」を次のように定義した。「…『正規』とは、実際に起こることの平均(あるいは他の種類の平均値)ではなく、ある状況下で長期的に起こるであろうことの平均値である。」[ 86 ] 20世紀初頭、ピアソンはこの分布の名称として「正規」という用語を普及させた。 [ 87 ]
何年も前に、私はラプラス・ガウス曲線を正規曲線と呼びました。この名前は、国際的な優先権の問題を回避しますが、他のすべての頻度分布が何らかの意味で「異常」であると人々に信じさせるという欠点があります。
また、この分布を現代の表記法である標準偏差σを用いて初めて記述したのはピアソンでした。その後まもなく、1915年にフィッシャーは正規分布の式に位置パラメータを追加し、現在の表記法で表現しました。
標準正規分布という用語は、平均がゼロで分散が1の正規分布を表すもので、1950年代頃にP. G. Hoel (1947)の『数理統計入門』やAlexander M. Mood (1950)の『統計理論入門』といった教科書に登場して広く使われるようになりました。[ 88 ] [ 89 ] [ 90 ]
参照
[編集]- ベイツ分布- アーウィン・ホール分布に似ているが、0から1の範囲に再スケールされている
- ベーレンス・フィッシャー問題– 異なる分散を持つ 2 つの正規分布サンプルの平均が同じかどうかを検定するという長年の問題。
- バタチャリヤ距離– 正規分布の混合物を分離するために使用される方法
- エルデシュ・カッツ定理–数論における正規分布の出現について
- 半値全幅
- ガウスぼかし-畳み込み、正規分布をカーネルとして使用します
- ガウス関数
- のpdfを持つ修正半正規分布[ 91 ]は で与えられ、ここで はフォックス・ライトのプサイ関数を表す。
- 正規分布と無相関は独立性を意味するものではない
- 比率正規分布
- 逆正規分布
- 標準正規表
- シュタインの補題
- 準ガウス分布
- 正規分布する確率変数の合計
- Tweedie 分布– 正規分布は、Tweedie指数分散モデルファミリーのメンバーです。
- ラップ正規分布– 円形領域に適用された正規分布
- Z検定– 正規分布を用いる
注記
[編集]- ^ たとえば、このアルゴリズムはBc プログラミング言語の記事に記載されています。
- ^ ド・モアブルは1733年に、個人配布のみを目的としたパンフレット『近似値二項項 (a + b)n の拡張シリーズにおける総括』で、初めて自身の研究成果を発表した。しかし、彼がその成果を公表したのは1738年になってからであった。最初のパンフレットは何度か再版されている。例えば、ウォーカー(1985)を参照のこと。
- ^ 「ある量が、同一の状況下で、同一の注意を払って行われた複数の直接観測によって決定された場合、観測値の算術平均は、厳密にはなくても少なくともほぼ最も確からしい値を与えるという仮説を公理とみなすのが慣例となっている。したがって、常にこの仮説に従うのが最も安全である。」—ガウス (1809年、第177節)
- ^ 「この曲線をガウス・ラプラシアン曲線、あるいは正規曲線と呼ぶ私の習慣は、二人の偉大な天文学者数学者の間で発見の功績を比例させる必要がないようにするものだ。」ピアソン(1905年、189ページ)からの引用
- ^ ここで具体的に言及されているもの以外にも、 1875年頃のPeirce、 Galton( Galton(1889)、第5章)やLexis( Lexis(1878)、 Rohrbasser&Véron(2003))の著作にも同様の用法が見られる。 [要出典]
参考文献
[編集]引用
[編集]- ^ Norton, Matthew; Khokhlov, Valentyn; Uryasev, Stan (2019). 「共通確率分布のCVaRとbPOEの計算とポートフォリオ最適化および密度推定への応用」 (PDF) . Annals of Operations Research . 299 ( 1– 2). Springer: 1281– 1315. arXiv : 1811.11301 . doi : 10.1007/s10479-019-03373-1 . S2CID 254231768. 2023年3月31日時点のオリジナル (PDF)からのアーカイブ。 2023年2月27日閲覧。
- ^ ツォコス、クリス;ウーテン、レベッカ(2016年1月1日)。ツォコス、クリス。ウーテン、レベッカ(編)。有限数学の楽しさ。ボストン:アカデミックプレス。 pp. 231–263 .土井: 10.1016/b978-0-12-802967-1.00007-3。ISBN 978-0-12-802967-1。
- ^ Harris, Frank E. (2014年1月1日). Harris, Frank E. (編).物理科学と工学のための数学. ボストン: アカデミック・プレス. pp. 663– 709. doi : 10.1016/b978-0-12-801000-6.00018-3 . ISBN 978-0-12-801000-6。
- ^ Hoel (1947 , p. 31 )とMood (1950 , p. 109 )は、わずかに異なる表記法でこの定義を与えている。
- ^ 正規分布、ゲイル心理学百科事典
- ^ カセラ&バーガー(2001年、102ページ)
- ^ Lyon, A. (2014).正規分布はなぜ正規分布なのか? , 英国科学哲学ジャーナル.
- ^ Jorge, Nocedal; Stephan, J. Wright (2006).数値最適化(第2版). Springer. p. 249. ISBN 978-0387-30303-1。
- ^ a b 「正規分布」www.mathsisfun.com . 2020年8月15日閲覧。
- ^ 「ベル曲線」。Merriam -Webster.com辞書。 2025年5月25日閲覧。
- ^ Mood (1950 , p. 112 ) は標準正規分布を明確に定義しています。対照的に、 Hoel (1947) は標準正規曲線 を明確に定義し(p. 33) 、標準正規分布 という用語を導入しています(p. 69)。
- ^ スティグラー(1982)
- ^ ハルペリン、ハートレー、ホエル (1965、項目 7)
- ^ マクファーソン(1990年、110ページ)
- ^ ベルナルド&スミス(2000年、121ページ)
- ^ スコット、クレイトン、ノワック、ロバート(2003年8月7日)「Q関数」Connexions。
- ^ Barak, Ohad (2006年4月6日). 「Q関数と誤差関数」(PDF) . テルアビブ大学. 2009年3月25日時点のオリジナル(PDF)からアーカイブ。
- ^ Weisstein, Eric W.「正規分布関数」MathWorld .
- ^ アブラモウィッツ、ミルトン、ステガン、アイリーン・アン編 (1983) [1964年6月]。「第26章、式26.2.12」。『数式、グラフ、数表付き数学関数ハンドブック』。応用数学シリーズ。第55巻(1972年12月発行の第10刷に訂正を加えた第9刷、初版)。ワシントンD.C.、ニューヨーク:米国商務省、国立標準局、ドーバー出版。932ページ。ISBN 978-0-486-61272-0. LCCN 64-60036 . MR 0167642 . LCCN 65-12253 .
- ^ Vaart, AW van der (1998年10月13日).漸近統計学. ケンブリッジ大学出版局. doi : 10.1017/cbo9780511802256 . ISBN 978-0-511-80225-6。
- ^ a b Cover & Thomas (2006)、254ページ。
- ^ Park, Sung Y.; Bera, Anil K. (2009). 「最大エントロピー自己回帰条件付き不均一分散モデル」(PDF) . Journal of Econometrics . 150 (2): 219– 230. CiteSeerX 10.1.1.511.9750 . doi : 10.1016/j.jeconom.2008.12.014 . 2016年3月7日時点のオリジナル(PDF)からアーカイブ。 2011年6月2日閲覧。
- ^ Geary RC(1936)「非正規分布サンプルにおけるスチューデント比」の分布。王立統計学会誌補足3(2):178–184
- ^ ルカーチ, ユージン(1942年3月) . 「正規分布の特徴づけ」. Annals of Mathematical Statistics . 13 (1): 91– 93. doi : 10.1214 /AOMS/1177731647 . ISSN 0003-4851 . JSTOR 2236166. MR 0006626. Zbl 0060.28509 . Wikidata Q55897617 .
- ^ a b c パテル&リード(1996、[2.1.4])
- ^ ファン(1991年、1258ページ)
- ^ パテル&リード(1996年、[2.1.8])
- ^ パプーリス、アタナシオス.確率、ランダム変数、確率過程(第4版). p. 148.
- ^ Winkelbauer, Andreas (2012). 「正規分布のモーメントと絶対モーメント」. arXiv : 1209.4340 [ math.ST ].
- ^ ブリュック(1995年、23ページ)
- ^ ブリュック(1995年、24ページ)
- ^ ウィリアムズ、デイビッド (2001). 『オッズを計る:確率と統計のコース』(再版)ケンブリッジ大学出版局. pp. 197–199 . ISBN 978-0-521-00618-7。
- ^ José M. Bernardo; Adrian FM Smith (2000).ベイズ理論(復刻版). Chichester [ua]: Wiley. pp. 209 , 366. ISBN 978-0-471-49464-5。
- ^ O'Hagan, A. (1994) Kendallの統計理論の高度化、第2B巻、ベイズ推論、エドワード・アーノルド。ISBN 0-340-52922-9(セクション5.40)
- ^ a b ブリュック(1995年、35ページ)
- ^ UIUC、講義21。多変量正規分布、21.6:「個別ガウス分布と結合ガウス分布」。
- ^ Edward L. MelnickとAaron Tenenbein、「正規分布の誤った仕様」、 The American Statistician、第36巻、第4号、1982年11月、372-373ページ
- ^ 「2つの正規(ガウス)確率分布のカルバック・ライブラー(KL)距離」 Allisons.org 2007年12月5日2017年3月3日閲覧。
- ^ Jordan, Michael I. (2010年2月8日). 「Stat260: ベイズモデリングと推論:正規分布の共役事前分布」(PDF) .
- ^ 甘利&長岡 (2000)
- ^ 「ガウス分布の確率変数の最大値の期待値」 Mathematics Stack Exchange . 2024年4月7日閲覧。
- ^ 「ポアソン分布の正規近似」Stat.ucla.edu . 2017年3月3日閲覧。
- ^ a b Das, Abhranil (2021). 「正規分布の積分と分類の方法」 . Journal of Vision . 21 (10): 1. arXiv : 2012.14331 . doi : 10.1167/jov.21.10.1 . PMC 8419883. PMID 34468706 .
- ^ ブリュック(1995年、27ページ)
- ^ Weisstein, Eric W. 「正規積分布」 . MathWorld . wolfram.com.
- ^ ルカーチ, ユージン (1942). 「正規分布の特徴づけ」 .数理統計年報. 13 (1): 91–3 . doi : 10.1214/aoms/1177731647 . ISSN 0003-4851 . JSTOR 2236166 .
- ^ Basu, D.; Laha, RG (1954). 「正規分布のいくつかの特徴づけについて」. Sankhyā . 13 (4): 359–62 . ISSN 0036-4452 . JSTOR 25048183 .
- ^ レーマン, EL (1997).統計的仮説検定(第2版). シュプリンガー. p. 199. ISBN 978-0-387-94919-2。
- ^ パテル&リード(1996年、[2.3.6])
- ^ ガランボス & シモネリ (2004、定理 3.5)
- ^ a b ルカーチとキング(1954)
- ^ Quine, MP (1993). 「正規分布の3つの特徴について」 .確率と数理統計. 14 (2): 257–263 .
- ^ John, S (1982). 「3パラメータ2ピース正規分布族とそのフィッティング」. Communications in Statistics – Theory and Methods . 11 (8): 879– 885. doi : 10.1080/03610928208828279 .
- ^ a b クリシュナムーシー(2006年、127ページ)
- ^ クリシュナムーシー(2006年、130ページ)
- ^ クリシュナムーシー(2006年、133ページ)
- ^ a b マクスウェル(1860)、23ページ。
- ^ Bryc (1995)、1ページ。
- ^ ラーコスキ, アンドリュー・J. (2023). 『量子力学:数学入門』 イギリス: ケンブリッジ大学出版局. pp. 120– 121. ISBN 978-1-009-12222-1. 2025年5月30日閲覧。
- ^ ハクスリー(1932)
- ^ ジェインズ、エドウィン・T. (2003).確率論:科学の論理. ケンブリッジ大学出版局. pp. 592– 593. ISBN 9780521592710。
- ^ Oosterbaan, Roland J. (1994). 「第6章 水文データの頻度分析と回帰分析」(PDF) . Ritzema, Henk P. (編). 『排水の原理と応用』, Publication 16 (第2改訂版). オランダ、ワーゲニンゲン: 国際土地改良研究所 (ILRI). pp. 175– 224. ISBN 978-90-70754-33-4。
- ^ 出版された研究結果のほとんどがなぜ誤りなのか、ジョン・P・A・イオアニディス、2005年
- ^ Wichura, Michael J. (1988). 「アルゴリズムAS241:正規分布のパーセントポイント」.応用統計. 37 (3): 477–84 . doi : 10.2307/2347330 . JSTOR 2347330 .
- ^ ジョンソン、コッツ、バラクリシュナン(1995年、式(26.48))
- ^ キンダーマン&モナハン(1977)
- ^ レヴァ(1992)
- ^ マルサリア&ツァン(2000)
- ^ カーニー(2016)
- ^ デュ、ファン、ウェイ (2022)
- ^ モナハン(1985年、第2節)
- ^ ウォレス(1996)
- ^ ジョンソン、コッツ、バラクリシュナン(1994年、85ページ)
- ^ Le Cam & Lo Yang (2000 , p. 74)
- ^ ド・モアブル、アブラハム(1733)、系I –ウォーカー(1985、p.77を参照)
- ^ スティグラー(1986年、 76ページ)
- ^ ガウス(1809年、第177節)
- ^ ガウス(1809年、第179節)
- ^ ラプラス(1774年、問題III)
- ^ ピアソン(1905年、189ページ)
- ^ ガウス(1809年、第177節)
- ^ スティグラー(1986年、144ページ)
- ^ スティグラー(1978年、243ページ)
- ^ スティグラー(1978年、244ページ)
- ^ ジェインズ、エドウィン J.;確率論:科学の論理、第7章。
- ^ ピアース、チャールズ・S.(1909年頃写本)、 Collected Papers v. 6、パラグラフ327。
- ^ クラスカル&スティグラー(1997)。
- ^ 「最も初期の使用...(エントリー標準正規曲線)」。
- ^ Hoel (1947)は標準正規曲線 (p. 33)と標準正規分布 (p. 69)という用語を導入しています。
- ^ Mood(1950)は標準正規分布 を明確に定義しています(p.112)。
- ^ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (2021年6月22日). 「修正半正規分布:特性と効率的なサンプリング手法」 . Communications in Statistics – Theory and Methods . 52 (5): 1591– 1613. doi : 10.1080/03610926.2021.1934700 . ISSN 0361-0926 . S2CID 237919587 .
出典
[編集]- アルドリッチ、ジョン、ミラー、ジェフ。「確率と統計における記号の初期の使用」
- アルドリッチ、ジョン、ミラー、ジェフ。「数学用語の最も古い使用例」特に、「ベル型とベル曲線」、「正規分布」、「ガウス分布」、「誤差、誤差の法則、誤差の理論など」の項目。
- 天理俊一、長岡宏 (2000). 『情報幾何学の方法』オックスフォード大学出版局. ISBN 978-0-8218-0531-2。
- ベルナルド, ホセ・M. ;スミス, エイドリアン・FM (2000).ベイズ理論. Wiley. ISBN 978-0-471-49464-5。
- ブリュック、ウォジミエシュ (1995). 『正規分布:その特徴と応用』シュプリンガー・フェアラーク. ISBN 978-0-387-97990-8。
- カセラ、ジョージ、バーガー、ロジャー・L. (2001).統計的推論(第2版). ダックスベリー. ISBN 978-0-534-24312-8。
- コーディ, ウィリアム J. (1969). 「誤差関数の有理チェビシェフ近似」 .計算数学. 23 (107): 631– 638. doi : 10.1090/S0025-5718-1969-0247736-4 .
- Cover, Thomas M. ; Thomas, Joy A. (2006). 『情報理論の要素』 John Wiley and Sons. ISBN 9780471241959。
- Dia, Yaya D. (2023). 「近似不完全積分、相補誤差関数への応用」 . SSRN . doi : 10.2139/ssrn.4487559 . S2CID 259689086 .
- ド・モアブル、アブラハム(2000) [初版1738年] 『偶然性の教義』 アメリカ数学会ISBN 978-0-8218-2103-9。
- Du, Y.; Fan, B.; Wei, B. (2022). 「標準正規分布のための改良型厳密サンプリングアルゴリズム」.計算統計. 37 (2): 721– 737. arXiv : 2008.03855 . doi : 10.1007/s00180-021-01136-w .
- Fan, Jianqing (1991). 「ノンパラメトリックデコンボリューション問題における最適収束速度について」 . 『統計年報』 . 19 (3): 1257–1272 . doi : 10.1214/aos/1176348248 . JSTOR 2241949 .
- ゴルトン、フランシス(1889)『自然遺伝』 (PDF)ロンドン、イギリス:リチャード・クレイ・アンド・サンズ。
- ガランボス、ヤノス、シモネッリ、イタロ (2004). 『確率変数の積:物理学の問題と算術関数への応用』マルセル・デッカー社ISBN 978-0-8247-5402-0。
- ガウス、カロロ・フリデリコ(1809). Theoria motvs corporvm coelestivm in sectionibvs conicis Solem ambientivm [太陽の周りを円錐断面で運動する天体の運動理論] (ラテン語). ハンブルギ、シュムティブス F. ペルテス et IH ベッサー.英語訳.
- グールド、スティーブン・ジェイ(1981年)『人間の誤測』(初版)WWノートン、ISBN 978-0-393-01489-1。
- ハルペリン, マックス; ハートレー, ハーマン・O.; ホエル, ポール・G. (1965). 「統計記号と表記に関する推奨標準.COPSS記号・表記委員会」.アメリカ統計学者.19 (3): 12– 14. doi : 10.2307/2681417 . JSTOR 2681417 .
- ハート、ジョン F.他。 (1968年)。コンピュータによる近似。ニューヨーク州ニューヨーク: John Wiley & Sons, Inc. ISBN 978-0-88275-642-4。
- 「正規分布」、数学百科事典、EMSプレス、2001 [1994]
- ハーンスタイン、リチャード・J.、マレー、チャールズ(1994年)『ベルカーブ:アメリカ社会における知能と階級構造』フリープレス、ISBN 978-0-02-914673-6。
- ポール・G・ホーエル(1947年)『数理統計学入門』ニューヨーク:ワイリー。
- ハクスリー、ジュリアン・S.(1972)[初版1932年] 『相対的成長の問題』ロンドン、ISBN 978-0-486-61114-3. OCLC 476909537 .
- ジョンソン、ノーマン・L. ;コッツ、サミュエル; バラクリシュナン、ナラヤナスワミ (1994).連続一変量分布 第1巻. Wiley. ISBN 978-0-471-58495-7。
- ジョンソン、ノーマン・L.、コッツ、サミュエル、バラクリシュナン、ナラヤナスワミ (1995).連続一変量分布 第2巻. Wiley. ISBN 978-0-471-58494-0。
- Karney, CFF (2016). 「正規分布からの正確なサンプリング」. ACM Transactions on Mathematical Software . 42 (1): 3:1–14. arXiv : 1303.6257 . doi : 10.1145/2710016 . S2CID 14252035 .
- Kinderman, Albert J.; Monahan, John F. (1977). 「一様偏差比を用いたコンピュータによるランダム変数の生成」 . ACM Transactions on Mathematical Software . 3 (3): 257– 260. doi : 10.1145/355744.355750 . S2CID 12884505 .
- クリシュナムーシー、カリムトゥ (2006).統計分布ハンドブックとその応用. チャップマン&ホール/CRC. ISBN 978-1-58488-635-8。
- Kruskal, William H. ; Stigler, Stephen M. (1997). Spencer, Bruce D. (編).規範的用語:統計学およびその他の分野における「正規」.統計と公共政策.オックスフォード大学出版局.ISBN 978-0-19-852341-3。
- ラプラス、ピエール=シモン・ド(1774)。「出来事の原因に関する記憶」。Mémoires de l'Académie Royale des Sciences de Paris (Savants étrangers)、Tome 6 : 621–656。スティーブン・M・スティグラー訳、Statistical Science 1 (3)、1986: JSTOR 2245476。
- ラプラス、ピエール=シモン(1812年)。Théorie Analytique des probabilités [確率の分析理論]。パリ、ヴェーダ州クルシエ。
- ル・カム、ルシアン、ロー・ヤン、グレース(2000). 『統計学における漸近論:基本概念』(第2版). シュプリンガー. ISBN 978-0-387-95036-5。
- Leva, Joseph L. (1992). 「高速正規乱数生成器」 (PDF) . ACM Transactions on Mathematical Software . 18 (4): 449– 453. CiteSeerX 10.1.1.544.5806 . doi : 10.1145/138351.138364 . S2CID 15802663. 2010年7月16日時点のオリジナル (PDF)からのアーカイブ。
- レクシス、ヴィルヘルム(1878)。 「人間社会の正常な生活と統計の安定性を保証する」。国際人口統計誌。Ⅱ.パリ: 447–462。
- ルカーチ, ユージン; キング, エドガー P. (1954). 「正規分布の性質」 .数理統計年報. 25 (2): 389– 394. doi : 10.1214/aoms/1177728796 . JSTOR 2236741 .
- マクファーソン、グレン(1990年)『科学的研究における統計学:その基礎、応用、解釈』シュプリンガー・フェアラーク社、ISBN 978-0-387-97137-7。
- Marsaglia, George ; Tsang, Wai Wan (2000). 「ジッグラト法によるランダム変数生成」 . Journal of Statistical Software . 5 (8). doi : 10.18637/jss.v005.i08 .
- Marsaglia, George (2004). 「正規分布の評価」 . Journal of Statistical Software . 11 (4). doi : 10.18637/jss.v011.i04 .
- マクスウェル、ジェームズ・クラーク(1860). 「V. 気体の力学理論の例示 ― 第1部:完全弾性球の運動と衝突について」 .哲学雑誌. シリーズ4. 19 (124): 19– 32. doi : 10.1080/14786446008642818 .
- Monahan, JF (1985). 「乱数生成における精度」 .計算数学. 45 (172): 559– 568. doi : 10.1090/S0025-5718-1985-0804945-X .
- ムード、アレクサンダー・マクファーレン(1950年)『統計理論入門』ニューヨーク:マグロウヒル。
- パテル, ジャグディッシュ・K.; リード, キャンベル・B. (1996).正規分布ハンドブック(第2版). CRC Press. ISBN 978-0-8247-9342-5。
- ピアソン、カール(1901). 「空間における点の系に最もよく適合する直線と平面について」 (PDF) .哲学雑誌. 6. 2 (11): 559– 572. doi : 10.1080/14786440109462720 . S2CID 125037489 .
- ピアソン、カール(1905)。「フェヒナーとピアソンによるフェールゲセッツとセーヌのフェラルゲマイネルンゲン」。再結合」。Biometrika。4 (1): 169–212。doi : 10.2307/2331536。JSTOR 2331536。
- ピアソン、カール (1920). 「相関の歴史に関するノート」 .バイオメトリカ. 13 (1): 25– 45. doi : 10.1093/biomet/13.1.25 . JSTOR 2331722 .
- ローアバッサー、ジャン=マルク、ヴェロン、ジャック(2003年)「ヴィルヘルム・レクシス:『事物の性質』の表現としての通常の寿命」「 .人口.58 (3) : 303–322.doi : 10.3917 / pope.303.0303 .
- ショア, H (1982). 「正規分布の逆累積関数、密度関数、損失積分の簡単な近似」.英国王立統計学会誌. シリーズC (応用統計) . 31 (2): 108–114 . doi : 10.2307/2347972 . JSTOR 2347972 .
- Shore, H (2005). 「正規分布のCDFに対する正確なRMMベースの近似」. Communications in Statistics – Theory and Methods . 34 (3): 507– 513. doi : 10.1081/sta-200052102 . S2CID 122148043 .
- Shore, H (2011). 「レスポンスモデリング手法」. WIREs Comput Stat . 3 (4): 357– 372. doi : 10.1002/wics.151 . S2CID 62021374 .
- Shore, H (2012). 「レスポンスモデリング手法モデルの推定」. WIREs Comput Stat . 4 (3): 323– 333. doi : 10.1002/wics.1199 . S2CID 122366147 .
- スティグラー、スティーブン・M. (1978). 「初期の数理統計学」 . 『統計年報』 . 6 (2): 239– 265. doi : 10.1214/aos/1176344123 . JSTOR 2958876 .
- スティグラー、スティーブン・M. (1982). 「控えめな提案:正常のための新しい基準」.アメリカ統計学者. 36 (2): 137–138 . doi : 10.2307/2684031 . JSTOR 2684031 .
- スティグラー、スティーブン・M.(1986年)『統計の歴史:1900年以前の不確実性の測定』ハーバード大学出版局、ISBN 978-0-674-40340-6。
- スティグラー、スティーブン・M.(1999年)『表にみる統計』ハーバード大学出版局、ISBN 978-0-674-83601-3。
- ウォーカー、ヘレン・M. (1985). 「ド・モアブルの正規確率法則について」 (PDF) . スミス、デイヴィッド・ユージーン編. 『数学の源』ドーバー. ISBN 978-0-486-64690-9。
- Wallace, CS (1996). 「正規分布および指数分布のための高速擬似乱数生成器」 . ACM Transactions on Mathematical Software . 22 (1): 119– 127. doi : 10.1145/225545.225554 . S2CID 18514848 .
- ワイスタイン、エリック W. 「正規分布」。マスワールド。
- West, Graeme (2009). 「累積正規関数のより良い近似」 (PDF) . Wilmott Magazine : 70– 76. 2012年2月29日時点のオリジナル (PDF)からのアーカイブ。
- ゼレン、マーヴィン、セベロ、ノーマン・C. (1972) [初版1964年].確率関数(第26章) .数式、グラフ、数表付き数学関数ハンドブック. アブラモウィッツ、M.、ステガン、IA著:国立標準局. ニューヨーク州ドーバー. ISBN 978-0-486-61272-0。