分散

確率論と統計学において、分散とは、確率変数の平均からの偏差の二乗の期待値です。標準偏差（SD）は、分散の平方根として得られます。分散は、分散の尺度であり、一連の数値が平均値からどれだけ離れているかを示す尺度です。分散は分布の第二中心モーメントであり、確率変数とそれ自身との共分散であり、多くの場合、、、、、またはで表されます。^[1] $\sigma ^{2}$ $s^{2}$ $\operatorname {Var} (X)$ $V(X)$ $\mathbb {V} (X)$

分散を分散の尺度として用いる利点は、期待絶対偏差などの他の分散尺度よりも代数的な処理が容易なことです。例えば、無相関の確率変数の和の分散は、それらの分散の和に等しくなります。実用上、分散の欠点は、標準偏差とは異なり、その単位が確率変数の単位と異なることです。そのため、計算終了後は、分散の尺度として標準偏差が報告されることが多いのです。もう一つの欠点は、多くの分布において分散が有限ではないことです。

「分散」と呼ばれる概念は2つあります。1つは前述の通り、理論的な確率分布の一部であり、方程式によって定義されます。もう1つの分散は、観測値集合の特性です。観測値から分散を計算する場合、それらの観測値は通常、現実世界のシステムから測定されます。システムのすべての観測値が存在する場合、計算された分散は母集団分散と呼ばれます。ただし、通常はサブセットのみが利用可能であり、そこから計算された分散は標本分散と呼ばれます。標本から計算された分散は、母集団全体の分散の推定値とみなされます。母集団分散の推定値を計算する方法は複数あり、以下のセクションで説明します。

2種類の分散は密接に関連しています。その関連性を理解するために、理論的な確率分布を仮説的な観測値の生成器として使用できることを考えてみましょう。ある分布を用いて無限数の観測値を生成すると、その無限集合から計算される標本分散は、その分布の分散方程式を用いて計算された値と一致します。分散は統計学において中心的な役割を果たしており、それを用いた概念としては、記述統計、統計的推論、仮説検定、適合度、モンテカルロサンプリングなどがあります。

意味

確率変数の分散は、平均からの偏差の二乗の期待値です。この定義には、離散的、連続的、どちらでもない、あるいは混合的なプロセスによって生成される確率変数が含まれます。分散は、確率変数とそれ自身との共分散と考えることもできます。 $X$ $X$ $\mu =\operatorname {E} [X]$ $\operatorname {Var} (X)=\operatorname {E} \left[(X-\mu )^{2}\right].$

$\operatorname {Var} (X)=\operatorname {Cov} (X,X).$ 分散は、を生成する確率分布の2番目のキュムラントとも等価です。分散は通常、あるいはや、あるいは記号的に、あるいは単に（「シグマスクエアード」と発音します）と表されます。分散の式は次のように展開できます。 $X$ $\operatorname {Var} (X)$ $V(X)$ $\mathbb {V} (X)$ $\sigma _{X}^{2}$ $\sigma ^{2}$ ${\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} \left[{\left(X-\operatorname {E} [X]\right)}^{2}\right]\\[4pt]&=\operatorname {E} \left[X^{2}-2X\operatorname {E} [X]+\operatorname {E} [X]^{2}\right]\\[4pt]&=\operatorname {E} \left[X^{2}\right]-2\operatorname {E} [X]\operatorname {E} [X]+\operatorname {E} [X]^{2}\\[4pt]&=\operatorname {E} \left[X^{2}\right]-2\operatorname {E} [X]^{2}+\operatorname {E} [X]^{2}\\[4pt]&=\operatorname {E} \left[X^{2}\right]-\operatorname {E} [X]^{2}\end{aligned}}$

言い換えれば、 $Xの分散は、$ $X$ の2乗の平均から $X$ の平均の2乗を引いたものに等しい。この式は、浮動小数点演算を用いた計算には使用すべきではない。なぜなら、式の2つの要素の大きさが近い場合、破滅的な相殺が生じるからである。数値的に安定した他の代替方法については、分散を計算するアルゴリズムを参照のこと。

離散確率変数

確率変数の生成器が確率質量関数を持つ離散的である場合、 $X$ $x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}$

$\operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot {\left(x_{i}-\mu \right)}^{2},$

ここで期待値は、 $\mu$

$\mu =\sum _{i=1}^{n}p_{i}x_{i}.$

(このような離散加重分散が、合計が 1 でない重みによって指定される場合、重みの合計で割ります。)

等確率の値の集合の分散は次のように表される。 $n$

$\operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}$

ここで平均値は、 $\mu$

$\mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.$

等確率の値の集合の分散は、平均を直接参照することなく、点同士の距離の二乗偏差で表現することができる。^[2] $n$

$\operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}{\left(x_{i}-x_{j}\right)}^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}{\left(x_{i}-x_{j}\right)}^{2}.$

絶対連続確率変数

確率変数が確率密度関数を持ち、対応する累積分布関数である場合、 $X$ $f(x)$ $F(x)$

${\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int _{\mathbb {R} }{\left(x-\mu \right)}^{2}f(x)\,dx\\[4pt]&=\int _{\mathbb {R} }x^{2}f(x)\,dx-2\mu \int _{\mathbb {R} }xf(x)\,dx+\mu ^{2}\int _{\mathbb {R} }f(x)\,dx\\[4pt]&=\int _{\mathbb {R} }x^{2}\,dF(x)-2\mu \int _{\mathbb {R} }x\,dF(x)+\mu ^{2}\int _{\mathbb {R} }\,dF(x)\\[4pt]&=\int _{\mathbb {R} }x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int _{\mathbb {R} }x^{2}\,dF(x)-\mu ^{2},\end{aligned}}$

あるいは同等に、

$\operatorname {Var} (X)=\int _{\mathbb {R} }x^{2}f(x)\,dx-\mu ^{2},$

ここでの期待値は $\mu$ $X$

$\mu =\int _{\mathbb {R} }xf(x)\,dx=\int _{\mathbb {R} }x\,dF(x).$

これらの式では、とに関する積分はそれぞれルベーグ積分とルベーグ・スティルチェス積分です。 $dx$ $dF(x)$

関数が任意の有限区間でリーマン積分可能である場合、 $x^{2}f(x)$ $[a,b]\subset \mathbb {R} ,$

$\operatorname {Var} (X)=\int _{-\infty }^{+\infty }x^{2}f(x)\,dx-\mu ^{2},$

ここで積分は不定リーマン積分である。

例

指数分布

パラメータ $λ > 0の$ 指数分布は、区間 $[0,\infty)において$ 確率密度関数が与えられる連続分布である。その平均は次のように示される。 $f(x)=\lambda e^{-\lambda x}$ $\operatorname {E} [X]=\int _{0}^{\infty }x\lambda e^{-\lambda x}\,dx={\frac {1}{\lambda }}.$

部分積分を使用し、すでに計算された期待値を利用すると、次のようになります。 ${\begin{aligned}\operatorname {E} \left[X^{2}\right]&=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx\\&={\left[-x^{2}e^{-\lambda x}\right]}_{0}^{\infty }+\int _{0}^{\infty }2xe^{-\lambda x}\,dx\\&=0+{\frac {2}{\lambda }}\operatorname {E} [X]\\&={\frac {2}{\lambda ^{2}}}.\end{aligned}}$

$したがって、 X$ の分散は次のように与えられる。 $\operatorname {Var} (X)=\operatorname {E} \left[X^{2}\right]-\operatorname {E} [X]^{2}={\frac {2}{\lambda ^{2}}}-\left({\frac {1}{\lambda }}\right)^{2}={\frac {1}{\lambda ^{2}}}.$

フェアダイ

公平な6面サイコロは、1から6までの出目がそれぞれ1/6の等確率で現れる離散確率変数 $X$ としてモデル化できる $。X$ の期待値は、したがって、 $X$ の分散は、 $(1+2+3+4+5+6)/6=7/2.$ ${\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}$

$n$ 面サイコロの出目 $X$ の分散の一般的な式は ${\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} \left(X^{2}\right)-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}$

よく使われる確率分布

次の表は、一般的に使用されるいくつかの確率分布の分散を示しています。

確率分布の名前	確率分布関数	平均	分散
二項分布	$\Pr \,(X=k)={\binom {n}{k}}p^{k}(1-p)^{n-k}$	$np$	$np(1-p)$
幾何分布	$\Pr \,(X=k)=(1-p)^{k-1}p$	${\frac {1}{p}}$	${\frac {(1-p)}{p^{2}}}$
正規分布	$f\left(x\mid \mu ,\sigma ^{2}\right)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {1}{2}}{\left({\frac {x-\mu }{\sigma }}\right)}^{2}}$	$\mu$	$\sigma ^{2}$
均一分布（連続）	$f(x\mid a,b)={\begin{cases}{\frac {1}{b-a}}&{\text{for }}a\leq x\leq b,\\[3pt]0&{\text{for }}x<a{\text{ or }}x>b\end{cases}}$	${\frac {a+b}{2}}$	${\frac {(b-a)^{2}}{12}}$
指数分布	$f(x\mid \lambda )=\lambda e^{-\lambda x}$	${\frac {1}{\lambda }}$	${\frac {1}{\lambda ^{2}}}$
ポアソン分布	$f(k\mid \lambda )={\frac {e^{-\lambda }\lambda ^{k}}{k!}}$	$\lambda$	$\lambda$

プロパティ

基本的なプロパティ

平方が正またはゼロなので、分散は非負です。 $\operatorname {Var} (X)\geq 0.$

定数の分散はゼロです。 $\operatorname {Var} (a)=0.$

逆に、確率変数の分散が0の場合、それはほぼ確実に定数です。つまり、常に同じ値を持ちます。 $\operatorname {Var} (X)=0\iff \exists a:P(X=a)=1.$

有限性の問題

コーシー分布のように、分布が有限の期待値を持たない場合、分散も有限にはならない。しかし、分布によっては、期待値が有限であっても、分散が有限ではない場合がある。例えば、指数が $k$ $1<k\leq 2.$

分解

分散分解または全分散の法則の一般的な公式は次の通りである。とが2つの確率変数であり、の分散が存在する場合、 $X$ $Y$ $X$

$\operatorname {Var} [X]=\operatorname {E} (\operatorname {Var} [X\mid Y])+\operatorname {Var} (\operatorname {E} [X\mid Y]).$

与えられたの条件付き期待値と条件付き分散は、次のように理解できる。確率変数 Yの任意の特定の値yが与えられた場合、事象 Y = yが与えられたときの条件付き期待値が与えられる。この量は特定の値 yに依存する関数である。この同じ関数を確率変数Yで評価したものが条件付き期待値である。 $\operatorname {E} (X\mid Y)$ $X$ $Y$ $\operatorname {Var} (X\mid Y)$ $\operatorname {E} (X\mid Y=y)$ $g(y)=\operatorname {E} (X\mid Y=y)$ $\operatorname {E} (X\mid Y)=g(Y).$

特に、が対応する確率を持つ可能な値を仮定する離散確率変数である場合、全分散の式において、右辺の最初の項は $Y$ $y_{1},y_{2},y_{3}\ldots$ $p_{1},p_{2},p_{3}\ldots ,$

$\operatorname {E} (\operatorname {Var} [X\mid Y])=\sum _{i}p_{i}\sigma _{i}^{2},$

ここで、同様に、右辺の2番目の項は $\sigma _{i}^{2}=\operatorname {Var} [X\mid Y=y_{i}]$

$\operatorname {Var} (\operatorname {E} [X\mid Y])=\sum _{i}p_{i}\mu _{i}^{2}-\left(\sum _{i}p_{i}\mu _{i}\right)^{2}=\sum _{i}p_{i}\mu _{i}^{2}-\mu ^{2},$

ここで、およびである。したがって、全分散は次のように与えられる。 $\mu _{i}=\operatorname {E} [X\mid Y=y_{i}]$ ${\textstyle \mu =\sum _{i}p_{i}\mu _{i}}$

$\operatorname {Var} [X]=\sum _{i}p_{i}\sigma _{i}^{2}+\left(\sum _{i}p_{i}\mu _{i}^{2}-\mu ^{2}\right).$

同様の式が分散分析にも適用され、対応する式は次のようになる。

${\mathit {MS}}_{\text{total}}={\mathit {MS}}_{\text{between}}+{\mathit {MS}}_{\text{within}};$

ここでの二乗平均は二乗平均を指します。線型回帰分析では、対応する式は次のようになります。 ${\mathit {MS}}$

${\mathit {MS}}_{\text{total}}={\mathit {MS}}_{\text{regression}}+{\mathit {MS}}_{\text{residual}}.$

これは分散の加法性からも導き出すことができます。合計（観測）スコアは予測スコアとエラースコアの合計であり、後者の 2 つは無相関であるためです。

偏差の二乗和（平方和、）についても同様の分解が可能です。 ${\mathit {SS}}$ ${\mathit {SS}}_{\text{total}}={\mathit {SS}}_{\text{between}}+{\mathit {SS}}_{\text{within}},$ ${\mathit {SS}}_{\text{total}}={\mathit {SS}}_{\text{regression}}+{\mathit {SS}}_{\text{residual}}.$

CDFからの計算

非負確率変数の母分散は、累積分布関数 Fを用いて次のように表すことができます。

$2\int _{0}^{\infty }u(1-F(u))\,du-{\left[\int _{0}^{\infty }(1-F(u))\,du\right]}^{2}.$

この式は、密度ではなく CDF を簡単に表現できる場合に分散を計算するために使用できます。

特性特性

確率変数の2次モーメントは、その1次モーメント（つまり平均）を中心としてとったときに最小値、すなわちとなる。逆に、連続関数がすべての確率変数Xに対してを満たす場合、それは必然的に（a > 0 ）の形をとる。これは多次元の場合にも当てはまる。^[3] $\mathrm {argmin} _{m}\,\mathrm {E} \left(\left(X-m\right)^{2}\right)=\mathrm {E} (X)$ $\varphi$ $\mathrm {argmin} _{m}\,\mathrm {E} (\varphi (X-m))=\mathrm {E} (X)$ $\varphi (x)=ax^{2}+b$

測定単位

期待絶対偏差とは異なり、変数の分散は、変数自体の単位の2乗を単位とします。例えば、メートル単位で測定された変数の分散は、メートルの2乗で測定されます。このため、データセットを記述する際には、分散よりも標準偏差または二乗平均平方根偏差を用いる方が好まれることが多いです。サイコロの例では $、$ 標準偏差は√2.9 ≈ 1.7 となり $、期待$ 絶対偏差の1.5よりもわずかに大きくなります。

標準偏差と期待絶対偏差はどちらも、分布の「広がり」を示す指標として用いることができます。標準偏差は期待絶対偏差よりも代数的な処理が容易であり、分散とその一般化共分散とともに、理論統計学において頻繁に用いられます。しかし、期待絶対偏差は、測定の異常や過度に裾の厚い分布に起因する外れ値の影響を受けにくいため、より頑健な傾向があります。

伝搬

定数による加算と乗算

分散は位置パラメータの変化に対して不変である。つまり、変数のすべての値に定数を加えても、分散は変化しない。 $\operatorname {Var} (X+a)=\operatorname {Var} (X).$

すべての値が定数でスケーリングされる場合、分散はその定数の 2 乗でスケーリングされます。 $\operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).$

2つの確率変数の和の分散は次のように与えられる。 ${\begin{aligned}\operatorname {Var} (aX+bY)&=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y)\\[1ex]\operatorname {Var} (aX-bY)&=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y)\end{aligned}}$

共分散はどこにあるか。 $\operatorname {Cov} (X,Y)$

線形結合

一般に、確率変数の合計の場合、分散は次のようになります。一般的なビエネメの恒等式も参照してください。 $N$ $\{X_{1},\dots ,X_{N}\}$ $\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i,j=1,i\neq j}^{N}\operatorname {Cov} (X_{i},X_{j}),$

これらの結果から、線形結合の分散は次のようになります。

${\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\neq j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}$

確率変数がとなる場合、それらは無相関であると言われます。前述の式から直ちに分かるように、確率変数が無相関である場合、それらの和の分散はそれらの分散の和に等しくなります。つまり、記号的に表現すると、 $X_{1},\dots ,X_{N}$ $\operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),$ $X_{1},\dots ,X_{N}$

$\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).$

独立確率変数は常に無相関であるため（共分散 § 無相関と独立性を参照）、上記の式は特に確率変数が独立している場合に成立します。したがって、和の分散が分散の和と等しくなるためには独立性は十分ですが、必須ではありません。 $X_{1},\dots ,X_{n}$

線形結合の分散の行列表記

を確率変数の列ベクトルとして定義し、をスカラーの列ベクトルとして定義する。したがって、はこれらの確率変数の線形結合であり、はの転置を表す。また、をの共分散行列とする。の分散は次のように与えられる。^[4] $X$ $n$ $X_{1},\ldots ,X_{n}$ $c$ $n$ $c_{1},\ldots ,c_{n}$ $c^{\mathsf {T}}X$ $c^{\mathsf {T}}$ $c$ $\Sigma$ $X$ $c^{\mathsf {T}}X$

$\operatorname {Var} \left(c^{\mathsf {T}}X\right)=c^{\mathsf {T}}\Sigma c.$

これは、平均の分散が（1の列ベクトルで）次のように表せることを意味する。

$\operatorname {Var} \left({\bar {x}}\right)=\operatorname {Var} \left({\frac {1}{n}}1'X\right)={\frac {1}{n^{2}}}1'\Sigma 1.$

変数の合計

相関のない変数の合計

他の分散の尺度よりも分散が優先される理由の 1 つは、相関のないランダム変数の合計 (または差) の分散が、それらの分散の合計であるためです。

$\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)=\sum _{i=1}^{n}\operatorname {Var} (X_{i}).$

この命題はビエネメの公式^[5]と呼ばれ、1853年に発見されました^[6]^{[7]。この公式は、変数が}独立であるというより強い条件がしばしば用いられますが、無相関であれば十分です。したがって、すべての変数が同じ分散σ ²を持つ場合、nで割ることは線形変換であるため、この公式は直ちにそれらの平均の分散が

$\operatorname {Var} \left({\overline {X}}\right)=\operatorname {Var} \left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\operatorname {Var} \left(X_{i}\right)={\frac {1}{n^{2}}}n\sigma ^{2}={\frac {\sigma ^{2}}{n}}.$

つまり、nが増加すると平均の分散は減少します。この平均の分散の式は、中心極限定理で使用される標本平均の標準誤差の定義に使用されます。

最初の主張を証明するには、次のことを示せば十分である。

$\operatorname {Var} (X+Y)=\operatorname {Var} (X)+\operatorname {Var} (Y).$

一般的な結果は帰納法によって導かれる。定義から始めると、

${\begin{aligned}\operatorname {Var} (X+Y)&=\operatorname {E} \left[(X+Y)^{2}\right]-(\operatorname {E} [X+Y])^{2}\\[5pt]&=\operatorname {E} \left[X^{2}+2XY+Y^{2}\right]-(\operatorname {E} [X]+\operatorname {E} [Y])^{2}.\end{aligned}}$

期待値演算子の線形性と、 XとYの独立性（または無相関性）の仮定を使用すると、これは次のようにさらに単純化されます。

${\begin{aligned}\operatorname {Var} (X+Y)&=\operatorname {E} {\left[X^{2}\right]}+2\operatorname {E} [XY]+\operatorname {E} {\left[Y^{2}\right]}-\left(\operatorname {E} [X]^{2}+2\operatorname {E} [X]\operatorname {E} [Y]+\operatorname {E} [Y]^{2}\right)\\[5pt]&=\operatorname {E} \left[X^{2}\right]+\operatorname {E} \left[Y^{2}\right]-\operatorname {E} [X]^{2}-\operatorname {E} [Y]^{2}\\[5pt]&=\operatorname {Var} (X)+\operatorname {Var} (Y).\end{aligned}}$

相関変数の合計

固定サンプルサイズの相関変数の合計

$一般に、 n$ 個の変数の合計の分散は、それらの共分散の合計です。

$\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)=\sum _{i=1}^{n}\sum _{j=1}^{n}\operatorname {Cov} \left(X_{i},X_{j}\right)=\sum _{i=1}^{n}\operatorname {Var} \left(X_{i}\right)+2\sum _{1\leq i<j\leq n}\operatorname {Cov} \left(X_{i},X_{j}\right).$

$（注：2番目の等式は、Cov(X i 、 X i) = Var(X i)$ という事実から生じます。）

ここで、は共分散であり、独立確率変数（存在する場合）に対しては0となります。この式は、和の分散は、成分の共分散行列のすべての要素の和に等しいことを示しています。次の式は、和の分散は共分散行列の対角成分の和に、その上三角成分（または下三角成分）の和の2倍を加えたものであることを示しています。これは、共分散行列が対称であることを強調しています。この式は、古典検定理論におけるクロンバックのα理論で用いられています。 $\operatorname {Cov} (\cdot ,\cdot )$

したがって、変数の分散がσ ²で、異なる変数の平均相関がρである場合、それらの平均の分散は

$\operatorname {Var} \left({\overline {X}}\right)={\frac {\sigma ^{2}}{n}}+{\frac {n-1}{n}}\rho \sigma ^{2}.$

これは、平均の分散が相関の平均とともに増加することを意味します。言い換えれば、相関のある観測値を追加しても、独立した観測値を追加した場合ほど平均の不確実性を低減する効果はありません。さらに、変数が単位分散を持つ場合、例えば標準化されている場合、これは次のように単純化されます。

$\operatorname {Var} \left({\overline {X}}\right)={\frac {1}{n}}+{\frac {n-1}{n}}\rho .$

この式は、古典的検定理論におけるスピアマン・ブラウン予測式で用いられている。平均相関が一定であるか収束する限り、 nが無限大になるとρに収束する。したがって、等相関または収束する平均相関を持つ標準化変数の平均の分散は、次のように表される。

$\lim _{n\to \infty }\operatorname {Var} \left({\overline {X}}\right)=\rho .$

したがって、多数の標準化変数の平均の分散は、それらの平均相関とほぼ等しくなります。これは、大数の法則によれば独立変数の標本平均は収束するとされていますが、相関のある変数の標本平均は一般に母平均に収束しないことを示しています。

ランダムサンプルサイズを持つ無相関変数の合計

ある基準に照らして許容できる観測値がいくつあるかを事前に知らずに標本を採取する場合があります。そのような場合、標本サイズ $Nは確率変数であり、その変動は$ $X$ の変動に加算されます。つまり、^[8]は全分散の法則から導かれます。 $\operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\operatorname {E} \left[N\right]\operatorname {Var} (X)+\operatorname {Var} (N)(\operatorname {E} \left[X\right])^{2}$

$N が$ ポアソン分布に従う場合、推定値 $n$ = $N$ が成り立ちます。したがって、の推定値はとなり、次の式が成り立ちます（標本平均の標準誤差を参照）。 $\operatorname {E} [N]=\operatorname {Var} (N)$ $\operatorname {Var} \left(\sum _{i=1}^{n}X_{i}\right)$ $n{S_{x}}^{2}+n{\bar {X}}^{2}$ $\operatorname {SE} ({\bar {X}})={\sqrt {\frac {{S_{x}}^{2}+{\bar {X}}^{2}}{n}}}$

変数の加重合計

スケーリング特性とビエネメの公式は、共分散 $Cov(aX, bY)= abCov (X, Y)$ の性質と相まって、次のことを意味する。

$\operatorname {Var} (aX\pm bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)\pm 2ab\,\operatorname {Cov} (X,Y).$

これは、変数の重み付け和において、重みが最も大きい変数が全体の分散に対して不均衡に大きな重みを持つことを意味します。例えば、XとYが無相関で、 Xの重みがYの重みの2倍である場合、 Xの分散の重みはYの分散の重みの4倍になります。

上記の式は、複数の変数の加重合計に拡張できます。

$\operatorname {Var} \left(\sum _{i}^{n}a_{i}X_{i}\right)=\sum _{i=1}^{n}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i}\sum _{<j\leq n}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})$

変数の積

独立変数の積

2つの変数XとYが独立である場合、それらの積の分散は^{[9]で与えられる。} $\operatorname {Var} (XY)=[\operatorname {E} (X)]^{2}\operatorname {Var} (Y)+[\operatorname {E} (Y)]^{2}\operatorname {Var} (X)+\operatorname {Var} (X)\operatorname {Var} (Y).$

同様に、期待値の基本的な性質を用いると、次のように表される。

$\operatorname {Var} (XY)=\operatorname {E} \left(X^{2}\right)\operatorname {E} \left(Y^{2}\right)-[\operatorname {E} (X)]^{2}[\operatorname {E} (Y)]^{2}.$

統計的従属変数の積

一般に、2 つの変数が統計的に依存している場合、それらの積の分散は次のように表されます。 ${\begin{aligned}\operatorname {Var} (XY)={}&\operatorname {E} \left[X^{2}Y^{2}\right]-[\operatorname {E} (XY)]^{2}\\[5pt]={}&\operatorname {Cov} \left(X^{2},Y^{2}\right)+\operatorname {E} (X^{2})\operatorname {E} \left(Y^{2}\right)-[\operatorname {E} (XY)]^{2}\\[5pt]={}&\operatorname {Cov} \left(X^{2},Y^{2}\right)+\left(\operatorname {Var} (X)+[\operatorname {E} (X)]^{2}\right)\left(\operatorname {Var} (Y)+[\operatorname {E} (Y)]^{2}\right)\\[5pt]&-[\operatorname {Cov} (X,Y)+\operatorname {E} (X)\operatorname {E} (Y)]^{2}\end{aligned}}$

任意の関数

デルタ法は、2次のテイラー展開を用いて、1つ以上の確率変数の関数の分散を近似する。確率変数の関数のモーメントについてはテイラー展開を参照のこと。例えば、1変数の関数の近似分散は次のように表される。

$\operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]$

ただし、fは 2 回微分可能であり、 Xの平均と分散は有限であるものとします。

母分散と標本分散

昨日の一日を通しての降雨量のような現実世界の観測は、通常、起こり得るすべての観測値を網羅した完全な集合とはなり得ません。そのため、有限集合から計算された分散は、起こり得る観測値の全母集団から計算された分散とは一般的に一致しません。これは、推定式を用いて、限られた観測値集合から平均と分散を推定することを意味します。推定値は、潜在的な観測値の全母集団から観測バイアスなく抽出されたn個の観測値の標本関数です。この例では、標本は、対象地域内にある利用可能な雨量計から得られた昨日の降雨量の実際の測定値の集合となります。

母平均と母分散の最も単純な推定量は、単に標本の平均と分散、標本平均と（補正されていない）標本分散です。これらは一貫性のある推定量（標本数が増えるにつれて母集団全体の値に収束する）ですが、改善することができます。最も単純な方法では、標本分散は（標本）平均の偏差の二乗和を標本数nで割って計算されます。ただし、 n以外の値を使用すると、さまざまな方法で推定量を改善できます。分母の一般的な4つの値はn、 n - 1、n + 1、およびn - 1.5です。nは最も単純（標本の分散）であり、n - 1はバイアスを排除し、^[10] n + 1は正規分布の平均二乗誤差を最小化し、 ^[11] n - 1.5は正規分布の標準偏差の不偏推定におけるバイアスをほぼ排除します。 [ 12 ^]

まず、真の母平均が不明な場合、標本分散（真の平均の代わりに標本平均を使用）は偏りのある推定値になります。つまり、分散を係数 ( n − 1) / nで過小評価します。この係数を修正して、標本平均の偏差の二乗和をnではなくn -1 で割ったものをベッセル補正と呼びます。^{[10]結果として得られる推定値は偏りがなく、}（修正）標本分散または偏りのない標本分散と呼ばれます。分散の推定に使用されたのと同じ標本以外の方法で平均が決定される場合、この偏りは発生せず、分散は（独立に既知の）平均の周りの標本の分散として安全に推定できます。

第二に、標本分散は一般に、標本分散と母集団分散の平均二乗誤差を最小化するものではありません。偏りを補正すると、状況は悪化することがよくあります。補正された標本分散よりも優れたパフォーマンスを発揮するスケール係数を選択することは常に可能ですが、最適なスケール係数は母集団の過剰尖度（平均二乗誤差：分散を参照）に依存し、偏りが生じます。これは常に、不偏推定値を縮小すること（ n − 1よりも大きな数で割ること）から成り、収縮推定値の簡単な例です。つまり、不偏推定値をゼロに向かって「収縮」させるのです。正規分布の場合、n − 1またはn ではなくn + 1で割ると、平均二乗誤差が最小化されます。^{[11]ただし、結果として得られる推定値には偏りがあり、}偏りのある標本分散として知られています。

母集団分散

一般に、 $N$ 個の有限母集団の母分散は、値 $x$ $i$ によって次のように表される。 ${\begin{aligned}\sigma ^{2}&={\frac {1}{N}}\sum _{i=1}^{N}{\left(x_{i}-\mu \right)}^{2}={\frac {1}{N}}\sum _{i=1}^{N}\left(x_{i}^{2}-2\mu x_{i}+\mu ^{2}\right)\\[5pt]&=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-2\mu \left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)+\mu ^{2}\\[5pt]&=\operatorname {E} [x_{i}^{2}]-\mu ^{2}\end{aligned}}$

ここで、母平均は、は期待値演算子です。 ${\textstyle \mu =\operatorname {E} [x_{i}]={\frac {1}{N}}\sum _{i=1}^{N}x_{i}}$ ${\textstyle \operatorname {E} [x_{i}^{2}]=\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)}$ ${\textstyle \operatorname {E} }$

母分散は^{[13]を使って計算することもできる。}

$\sigma ^{2}={\frac {1}{N^{2}}}\sum _{i<j}\left(x_{i}-x_{j}\right)^{2}={\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}\left(x_{i}-x_{j}\right)^{2}.$

（右辺は合計に重複した項がありますが、中央の辺は合計する項が一意の項のみです。）これは、 ${\begin{aligned}&{\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}{\left(x_{i}-x_{j}\right)}^{2}\\[5pt]={}&{\frac {1}{2N^{2}}}\sum _{i,j=1}^{N}\left(x_{i}^{2}-2x_{i}x_{j}+x_{j}^{2}\right)\\[5pt]={}&{\frac {1}{2N}}\sum _{j=1}^{N}\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}^{2}\right)-\left({\frac {1}{N}}\sum _{i=1}^{N}x_{i}\right)\left({\frac {1}{N}}\sum _{j=1}^{N}x_{j}\right)+{\frac {1}{2N}}\sum _{i=1}^{N}\left({\frac {1}{N}}\sum _{j=1}^{N}x_{j}^{2}\right)\\[5pt]={}&{\frac {1}{2}}\left(\sigma ^{2}+\mu ^{2}\right)-\mu ^{2}+{\frac {1}{2}}\left(\sigma ^{2}+\mu ^{2}\right)\\[5pt]={}&\sigma ^{2}.\end{aligned}}$

母集団の分散は、生成確率分布の分散と一致します。この意味で、母集団の概念は、無限母集団を持つ連続確率変数に拡張することができます。

標本分散

偏った標本分散

多くの実用的状況において、母集団の真の分散は事前に分かっておらず、何らかの方法で計算する必要があります。非常に大規模な母集団を扱う場合、母集団内のすべてのオブジェクトを数えることは不可能であるため、計算は母集団の標本に対して行う必要があります。 ^{[14]これは一般に}標本分散または経験分散と呼ばれます。標本分散は、連続分布の分散をその分布の標本から推定する際にも適用できます。

$N$ 個の母集団から $n$ 個の値 $Y1$ $,$ $...,$ $Yn$ $を$ 置換した標本（ $n$ $<$ $N）$ を抽出し、この標本に基づいて分散を推定する。^{[15]標本データの分散を直接取ると、}偏差の二乗の平均が得られる。^[16]

${\tilde {S}}_{Y}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}Y_{i}^{2}\right)-{\overline {Y}}^{2}={\frac {1}{n^{2}}}\sum _{i,j\,:\,i<j}\left(Y_{i}-Y_{j}\right)^{2}.$

（この式の導出については、「母分散」のセクションを参照してください。）ここで、は標本平均を表します。 ${\overline {Y}}$ ${\overline {Y}}={\frac {1}{n}}\sum _{i=1}^{n}Y_{i}.$

$Y i は$ ランダムに選択されるため、とはどちらも確率変数です。これらの期待値は、母集団から得られるサイズ $nのすべての可能な標本$ ${$ $Y$ $i$ $}$ の集合を平均することで評価できます。これは以下の式を与えます。 ${\overline {Y}}$ ${\tilde {S}}_{Y}^{2}$ ${\tilde {S}}_{Y}^{2}$ ${\begin{aligned}\operatorname {E} [{\tilde {S}}_{Y}^{2}]&=\operatorname {E} \left[{\frac {1}{n}}\sum _{i=1}^{n}{\left(Y_{i}-{\frac {1}{n}}\sum _{j=1}^{n}Y_{j}\right)}^{2}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\operatorname {E} \left[Y_{i}^{2}-{\frac {2}{n}}Y_{i}\sum _{j=1}^{n}Y_{j}+{\frac {1}{n^{2}}}\sum _{j=1}^{n}Y_{j}\sum _{k=1}^{n}Y_{k}\right]\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left(\operatorname {E} \left[Y_{i}^{2}\right]-{\frac {2}{n}}\left(\sum _{j\neq i}\operatorname {E} \left[Y_{i}Y_{j}\right]+\operatorname {E} \left[Y_{i}^{2}\right]\right)+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k\neq j}^{n}\operatorname {E} \left[Y_{j}Y_{k}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\operatorname {E} \left[Y_{j}^{2}\right]\right)\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left({\frac {n-2}{n}}\operatorname {E} \left[Y_{i}^{2}\right]-{\frac {2}{n}}\sum _{j\neq i}\operatorname {E} \left[Y_{i}Y_{j}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k\neq j}^{n}\operatorname {E} \left[Y_{j}Y_{k}\right]+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\operatorname {E} \left[Y_{j}^{2}\right]\right)\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}\left[{\frac {n-2}{n}}\left(\sigma ^{2}+\mu ^{2}\right)-{\frac {2}{n}}(n-1)\mu ^{2}+{\frac {1}{n^{2}}}n(n-1)\mu ^{2}+{\frac {1}{n}}\left(\sigma ^{2}+\mu ^{2}\right)\right]\\[5pt]&={\frac {n-1}{n}}\sigma ^{2}.\end{aligned}}$

ここで、セクションで導出されるは、およびの独立性による母分散およびです。 ${\textstyle \sigma ^{2}=\operatorname {E} [Y_{i}^{2}]-\mu ^{2}}$ ${\textstyle \operatorname {E} [Y_{i}Y_{j}]=\operatorname {E} [Y_{i}]\operatorname {E} [Y_{j}]=\mu ^{2}}$ ${\textstyle Y_{i}}$ ${\textstyle Y_{j}}$

したがって、は母集団分散の推定値を与えますが、の期待値は母集団分散（真の分散）よりもその係数分だけ小さくなるため、係数だけ偏りがあります。このため、は偏りのある標本分散と呼ばれます。 ${\textstyle {\tilde {S}}_{Y}^{2}}$ ${\textstyle \sigma ^{2}}$ ${\textstyle {\frac {n-1}{n}}}$ ${\textstyle {\tilde {S}}_{Y}^{2}}$ ${\textstyle {\tilde {S}}_{Y}^{2}}$

不偏標本分散

この偏りを補正すると、次のように表される不偏標本分散が得られます。 $S^{2}$

$S^{2}={\frac {n}{n-1}}{\tilde {S}}_{Y}^{2}={\frac {n}{n-1}}\left[{\frac {1}{n}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}\right]={\frac {1}{n-1}}\sum _{i=1}^{n}\left(Y_{i}-{\overline {Y}}\right)^{2}$

どちらの推定値も、文脈によってバージョンが決定できる場合は、単に標本分散と呼ばれることがあります。同じ証明は、連続確率分布から抽出された標本にも適用できます。

$n - 1$ という項の使用はベッセル補正と呼ばれ、標本共分散や標本標準偏差（分散の平方根）にも用いられます。平方根は凹関数であるため、分布に依存する負のバイアス（ジェンセンの不等式による）が生じ、その結果、ベッセル補正を用いた補正標本標準偏差はバイアスを持ちます。標準偏差の不偏推定は技術的に複雑な問題ですが、正規分布の場合、 $n - 1.5$ という項を用いるとほぼ不偏推定値が得られます。

不偏標本分散は関数 $f$ $($ $y$ $1$ $,$ $y$ $2$ $) = ($ $y$ $1$ $-$ $y$ $2$ $)$ $2$ $/2の$ U統計量であり、これは母集団の2要素サブセットにわたって2標本統計量を平均することによって得られることを意味します。

例

数値の集合{10、15、30、45、57、52、63、72、81、93、102、105}について、この集合が何らかの測定におけるデータ母集団全体である場合、分散は、この集合の平均からの偏差の二乗和を集合の要素数である12で割った値である母分散932.743となります。集合が母集団全体からの標本である場合、不偏標本分散は、標本の平均からの偏差の二乗和を12ではなく11で割った値である1017.538として計算できます。Microsoft Excelの関数VAR.Sは不偏標本分散を算出し、関数VAR.Pは母分散を表します。

標本分散の分布

標本分散は確率変数の関数であるため、それ自体が確率変数であり、その分布を調べるのは自然なことです。Y _{i が}正規分布からの独立した観測値である場合、コクランの定理によれば、不偏標本分散S ²は尺度カイ二乗分布に従うことが示されます（漸近的性質と初等的証明も参照）。^[17] $(n-1){\frac {S^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}$

ここで $σ 2$ は母分散である。この直接的な帰結として、 $\operatorname {E} \left(S^{2}\right)=\operatorname {E} \left({\frac {\sigma ^{2}}{n-1}}\chi _{n-1}^{2}\right)=\sigma ^{2},$

そして^[18]

$\operatorname {Var} \left[S^{2}\right]=\operatorname {Var} \left({\frac {\sigma ^{2}}{n-1}}\chi _{n-1}^{2}\right)={\frac {\sigma ^{4}}{{\left(n-1\right)}^{2}}}\operatorname {Var} \left(\chi _{n-1}^{2}\right)={\frac {2\sigma ^{4}}{n-1}}.$

Y _iが独立かつ同一に分布するが、必ずしも正規分布するとは限らない場合、 ^[19]

$\operatorname {E} \left[S^{2}\right]=\sigma ^{2},\quad \operatorname {Var} \left[S^{2}\right]={\frac {\sigma ^{4}}{n}}\left(\kappa -1+{\frac {2}{n-1}}\right)={\frac {1}{n}}\left(\mu _{4}-{\frac {n-3}{n-1}}\sigma ^{4}\right),$

ここで、κは分布の尖度、 μ ₄は4次中心モーメントです。

大数の法則の条件が観測値の2乗に対して成り立つ場合、S ^2はσ ²の整合的な推定値となる。この推定値の分散は漸近的にゼロに近づくことがわかる。漸近的に等価な式は、Kenney and Keeping (1951:164)、Rose and Smith (2002:264)、およびWeisstein (nd) に示されている。^[20]^[21]^[22]

サミュエルソンの不等式

サミュエルソンの不等式は、標本平均と（偏りのある）分散が計算されていると仮定して、標本内の個々の観測値が取り得る値の境界を示す結果である。^[23]値は限界内に収まらなければならない。 ${\bar {y}}\pm \sigma _{Y}(n-1)^{1/2}.$

調和平均と算術平均との関係

^[24]によれば、正の実数のサンプル{ y _{i }に対して、}

$\sigma _{y}^{2}\leq 2y_{\max }(A-H),$

ここで、 $y max$ はサンプルの最大値、 $A$ は算術平均、 $H$ はサンプルの調和平均、はサンプルの (偏りのある) 分散です。 $\sigma _{y}^{2}$

この境界は改善され、分散は

${\begin{aligned}\sigma _{y}^{2}&\leq {\frac {y_{\max }(A-H)(y_{\max }-A)}{y_{\max }-H}},\\[1ex]\sigma _{y}^{2}&\geq {\frac {y_{\min }(A-H)(A-y_{\min })}{H-y_{\min }}},\end{aligned}}$

ここで $ymin は$ サンプルの最小値である。^[25]

分散の等価性の検定

標本が正規分布している場合、分散の等価性に関するF検定とカイ二乗検定は適切です。非正規分布の場合、2つ以上の分散の等価性に関する検定はより困難になります。

いくつかのノンパラメトリック検定が提案されており、Barton–David–Ansari–Freund–Siegel–Tukey検定、Capon検定、Mood検定、Klotz検定、Sukhatme検定などが挙げられます。Sukhatme検定は2つの分散に適用され、両方の中央値が既知でゼロであることが必要です。Mood検定、Klotz検定、Capon検定、Barton–David–Ansari–Freund–Siegel–Tukey検定も2つの分散に適用されます。これらの検定では中央値が未知であっても構いませんが、2つの中央値が等しいことが必要です。

レーマン検定は、2つの分散のパラメトリック検定です。この検定にはいくつかのバリエーションが知られています。分散の等価性に関する他の検定としては、ボックス検定、ボックス・アンダーソン検定、モーゼス検定などがあります。

ブートストラップ法やジャックナイフ法などの再サンプリング法は、分散の等価性を検定するために使用できます。

慣性モーメント

確率分布の分散は、古典力学における、直線に沿った対応する質量分布の、その質量中心の周りの回転に関する慣性モーメントに類似している。 ^[26] この類似性から、分散のようなものは確率分布のモーメントと呼ばれる。^{[26]共分散行列は、多変量分布の}慣性モーメントテンソルと関連している。共分散行列がn個の点からなる雲の慣性モーメントは、次のように与えられる^[^要出典^]。 $\Sigma$ $I=n\left(\mathbf {1} _{3\times 3}\operatorname {tr} (\Sigma )-\Sigma \right).$

物理学と統計学における慣性モーメントの違いは、直線上に集まった点については明らかです。多くの点がx軸に近く、x軸に沿って分布していると仮定します。共分散行列は次のようになります。 $\Sigma ={\begin{bmatrix}10&0&0\\0&0.1&0\\0&0&0.1\end{bmatrix}}.$

つまり、 x方向の分散が最も大きい。物理学者はこれをx軸周りのモーメントが低いとみなすので、慣性モーメントテンソルは $I=n{\begin{bmatrix}0.2&0&0\\0&10.1&0\\0&0&10.1\end{bmatrix}}.$

半分散

半分散は分散と同じ方法で計算されますが、平均値を下回る観測値のみが計算に含まれます。これは、様々な応用分野で特定の指標として説明されることもあります。歪んだ分布の場合、半分散は分散では得られない追加情報を提供します。^[27] ${\text{Semivariance}}={\frac {1}{n}}\sum _{i:x_{i}<\mu }{\left(x_{i}-\mu \right)}^{2}$

半分散に関連する不等式については、チェビシェフの不等式 § 半分散を参照してください。

語源

分散という用語は、ロナルド・フィッシャーが1918年に発表した論文「メンデル遺伝の仮定に基づく親族間の相関」で初めて導入された。^[28]

利用可能な統計の大部分は、人間の測定値が平均値からどのようにずれるかが正規誤差の法則に非常に近いことを示している。したがって、変動性は平均二乗誤差の平方根に対応する標準偏差によって一様に測定できる。2つの独立した変動原因があり、それらが均一な母集団において標準偏差およびを持つ分布を生み出す可能性がある場合、両方の原因が同時に作用すると、分布の標準偏差はになることがわかる。したがって、変動原因を分析する際には、変動性の尺度として標準偏差の二乗を扱うことが望ましい。この量を分散と呼ぶことにする。 $\sigma _{1}$ $\sigma _{2}$ ${\sqrt {\sigma _{1}^{2}+\sigma _{2}^{2}}}$

一般化

複素変数の場合

がスカラー複素数値のランダム変数で、値がの場合、その分散はです。ここではの複素共役です。この分散は実スカラーです。 $x$ $\mathbb {C} ,$ $\operatorname {E} \left[(x-\mu )(x-\mu )^{*}\right],$ $x^{*}$ $x.$

ベクトル値確率変数の場合

マトリックスとして

がベクトル値の確率変数で、値がとにある場合、列ベクトルとして考えれば、分散の自然な一般化はとなります。ここで、とは $X$ の転置であり、行ベクトルも同様です。結果は半正定値正方行列で、一般に分散共分散行列（または単に共分散行列）と呼ばれます。 $X$ $\mathbb {R} ^{n},$ $\operatorname {E} \left[(X-\mu ){(X-\mu )}^{\mathsf {T}}\right],$ $\mu =\operatorname {E} (X)$ $X^{\mathsf {T}}$

がベクトルで複素数値のランダム変数で、値がの場合、共分散行列は次のようになります。ここで、は^[^{引用が必要}^]の共役転置です。この行列は半正定値で正方行列でもあります。 $X$ $\mathbb {C} ^{n},$ $\operatorname {E} \left[(X-\mu ){(X-\mu )}^{\dagger }\right],$ $X^{\dagger }$ $X.$

スカラーとして

ベクトル値確率変数の分散のもう一つの一般化は、行列ではなくスカラー値となる一般化分散であり、共分散行列の行列式である。一般化分散は、点の平均を中心とした多次元の散布度と関連していることが示される。^[29] $X$ $\det(C)$

スカラー分散の式を考察し、これを確率変数とその平均との間のユークリッド距離の2乗、あるいは単にベクトルとそれ自身のスカラー積として解釈することで、異なる一般化が得られる。この結果、となり、これは共分散行列のトレースとなる。 $\operatorname {Var} (X)=\operatorname {E} \left[(X-\mu )^{2}\right]$ $(X-\mu )^{2}$ $X-\mu$ $\operatorname {E} \left[(X-\mu )^{\mathsf {T}}(X-\mu )\right]=\operatorname {tr} (C),$

参照

バティア・デイビス不等式
変動係数
等分散性
スペクトル振幅を分散の％またはdBで表した周波数スペクトルを計算するための最小二乗スペクトル解析
現代ポートフォリオ理論
ポポビチウの分散不等式
統計的分散の尺度
分散安定化変換

差異の種類

参考文献

^ ワッサーマン、ラリー (2005). 『統計のすべて：統計的推論の簡潔なコース』シュプリンガー統計テキスト集. p. 51. ISBN 978-1-4419-2322-6。
^ Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.
^ Kagan, A.; Shepp, LA (1998). 「なぜ分散があるのか？」.統計と確率の手紙. 38 (4): 329– 333. doi :10.1016/S0167-7152(98)00041-8.
^ ジョンソン、リチャード、ウィチャーン、ディーン (2001).応用多変量統計分析. プレンティス・ホール. p. 76. ISBN 0-13-187715-1。
^ Loève, M. (1977)「確率論」、 Graduate Texts in Mathematics、第45巻、第4版、Springer-Verlag、p. 12。
^ ビエネイメ、I.-J. (1853) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la methode des moindres carrés"、Comptes rendus de l'Académie des Sciences Paris、37、p. 309–317;デジタルコピーが利用可能 [1] 2018-06-23ウェイバックマシンにアーカイブ
^ ビエネイメ、I.-J. (1867) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la methode des moindres carrés"、Journal de Mathématiques Pures et Appliquées、Série 2、Tome 12、p. 158–167;デジタルコピーが利用可能 [2][3]
^ Cornell, JR、Benjamin, CA、「土木技術者のための確率、統計、意思決定」、 McGraw-Hill、NY、1970年、178-9ページ。
^ Goodman, Leo A. (1960年12月). 「製品の正確な分散について」.アメリカ統計学会誌. 55 (292): 708– 713. doi :10.2307/2281592. JSTOR 2281592.
^ ab Reichmann, WJ (1961). 「付録8」.統計の利用と濫用（1964～1970年にペリカン版により再版）. ロンドン: メシューエン.
^ ab Kourouklis, Stavros (2012). 「平均二乗誤差の最小化に基づく分散の新しい推定量」 . The American Statistician . 66 (4): 234– 236. doi :10.1080/00031305.2012.735209. ISSN 0003-1305. JSTOR 23339501.
^ Brugger, RM (1969). 「標準偏差の偏りのない推定に関するノート」.アメリカ統計学者. 23 (4): 32. doi :10.1080/00031305.1969.10481865.
^ Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.
^ ナヴィディ、ウィリアム（2006年）『エンジニアと科学者のための統計学』マグロウヒル、14ページ。
^ Montgomery, DC および Runger, GC (1994)エンジニアのための応用統計と確率、201 ページ。John Wiley & Sons ニューヨーク
^ Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.
^ Knight, K. (2000).数理統計学. ニューヨーク: Chapman and Hall. 命題2.11.
^ Casella, George; Berger, Roger L. (2002).統計的推論（第2版）. 例7.3.3, p. 331. ISBN 0-534-24312-6。
^ Mood, AM, Graybill, FA, Boes, DC (1974)『統計理論入門』第3版、McGraw-Hill、ニューヨーク、p. 229
^ Kenney, John F.; Keeping, ES (1951). Mathematics of Statistics. Part Two (PDF) (第2版). Princeton, New Jersey: D. Van Nostrand Company, Inc. 2018年11月17日時点のオリジナル(PDF)からのアーカイブ– KrishiKosh経由。
^ ローズ、コリン、スミス、マレー・D. (2002). 「Mathematicaによる数理統計」. シュプリンガー・フェアラーク、ニューヨーク.
^ Weisstein, Eric W. 「標本分散分布」. MathWorld Wolfram.
^ サミュエルソン、ポール (1968). 「あなたはどれだけ逸脱できるか？」アメリカ統計学会誌. 63 (324): 1522– 1525. doi :10.1080/01621459.1968.10480944. JSTOR 2285901.
^ Mercer, A. McD. (2000). 「A–G, A–H, G–H, およびKy Fan型不等式の族に対する一般法による境界値」. J. Math. Anal. Appl . 243 (1): 163– 173. doi : 10.1006/jmaa.1999.6688 .
^ Sharma, R. (2008). 「算術平均、調和平均、分散に関するその他の不等式」. Journal of Mathematical Inequalities . 2 (1): 109– 114. CiteSeerX 10.1.1.551.9397 . doi :10.7153/jmi-02-11.
^ ab マグネロ、M. アイリーン. 「カール・ピアソンと現代統計学の起源：弾性主義者が統計学者になる」ラザフォード・ジャーナル.
^ Fama, Eugene F.; French, Kenneth R. (2010-04-21). 「Q&A: セミバリアンス：より優れたリスク指標か？」Fama/French Forum .
^ ロナルド・フィッシャー(1918) メンデル遺伝の仮定に基づく親族間の相関
^ Kocherlakota, S.; Kocherlakota, K. (2004). 「一般化分散」.統計科学百科事典. Wileyオンラインライブラリ. doi :10.1002/0471667196.ess0869. ISBN 0-471-66719-6。

[1] ワッサーマン、ラリー (2005). 『統計のすべて：統計的推論の簡潔なコース』シュプリンガー統計テキスト集. p. 51. ISBN 978-1-4419-2322-6。

[2] Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.

[3] Kagan, A.; Shepp, LA (1998). 「なぜ分散があるのか？」.統計と確率の手紙. 38 (4): 329– 333. doi :10.1016/S0167-7152(98)00041-8.

[4] ジョンソン、リチャード、ウィチャーン、ディーン (2001).応用多変量統計分析. プレンティス・ホール. p. 76. ISBN 0-13-187715-1。

[5] Loève, M. (1977)「確率論」、 Graduate Texts in Mathematics、第45巻、第4版、Springer-Verlag、p. 12。

[6] ビエネイメ、I.-J. (1853) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la methode des moindres carrés"、Comptes rendus de l'Académie des Sciences Paris、37、p. 309–317;デジタルコピーが利用可能 [1] 2018-06-23ウェイバックマシンにアーカイブ

[7] ビエネイメ、I.-J. (1867) "Considérations à l'appui de la découverte de Laplace sur la loi de probabilité dans la methode des moindres carrés"、Journal de Mathématiques Pures et Appliquées、Série 2、Tome 12、p. 158–167;デジタルコピーが利用可能 [2][3]

[8] Cornell, JR、Benjamin, CA、「土木技術者のための確率、統計、意思決定」、 McGraw-Hill、NY、1970年、178-9ページ。

[9] Goodman, Leo A. (1960年12月). 「製品の正確な分散について」.アメリカ統計学会誌. 55 (292): 708– 713. doi :10.2307/2281592. JSTOR 2281592.

[bessel-10] Reichmann, WJ (1961). 「付録8」.統計の利用と濫用（1964～1970年にペリカン版により再版）. ロンドン: メシューエン.

[Kourouklis-11] Kourouklis, Stavros (2012). 「平均二乗誤差の最小化に基づく分散の新しい推定量」 . The American Statistician . 66 (4): 234– 236. doi :10.1080/00031305.2012.735209. ISSN 0003-1305. JSTOR 23339501.

[12] Brugger, RM (1969). 「標準偏差の偏りのない推定に関するノート」.アメリカ統計学者. 23 (4): 32. doi :10.1080/00031305.1969.10481865.

[13] Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.

[14] ナヴィディ、ウィリアム（2006年）『エンジニアと科学者のための統計学』マグロウヒル、14ページ。

[15] Montgomery, DC および Runger, GC (1994)エンジニアのための応用統計と確率、201 ページ。John Wiley & Sons ニューヨーク

[16] Yuli Zhang; Huaiyu Wu; Lei Cheng (2012年6月).分散と共分散に関するいくつかの新しい変形式. 第4回国際モデリング・同定・制御会議(ICMIC2012)の議事録. pp. 987– 992.

[17] Knight, K. (2000).数理統計学. ニューヨーク: Chapman and Hall. 命題2.11.

[18] Casella, George; Berger, Roger L. (2002).統計的推論（第2版）. 例7.3.3, p. 331. ISBN 0-534-24312-6。

[19] Mood, AM, Graybill, FA, Boes, DC (1974)『統計理論入門』第3版、McGraw-Hill、ニューヨーク、p. 229

[20] Kenney, John F.; Keeping, ES (1951). Mathematics of Statistics. Part Two (PDF) (第2版). Princeton, New Jersey: D. Van Nostrand Company, Inc. 2018年11月17日時点のオリジナル(PDF)からのアーカイブ– KrishiKosh経由。

[21] ローズ、コリン、スミス、マレー・D. (2002). 「Mathematicaによる数理統計」. シュプリンガー・フェアラーク、ニューヨーク.

[22] Weisstein, Eric W. 「標本分散分布」. MathWorld Wolfram.

[23] サミュエルソン、ポール (1968). 「あなたはどれだけ逸脱できるか？」アメリカ統計学会誌. 63 (324): 1522– 1525. doi :10.1080/01621459.1968.10480944. JSTOR 2285901.

[24] Mercer, A. McD. (2000). 「A–G, A–H, G–H, およびKy Fan型不等式の族に対する一般法による境界値」. J. Math. Anal. Appl . 243 (1): 163– 173. doi : 10.1006/jmaa.1999.6688 .

[Sharma2008-25] Sharma, R. (2008). 「算術平均、調和平均、分散に関するその他の不等式」. Journal of Mathematical Inequalities . 2 (1): 109– 114. CiteSeerX 10.1.1.551.9397 . doi :10.7153/jmi-02-11.

[pearson-26] マグネロ、M. アイリーン. 「カール・ピアソンと現代統計学の起源：弾性主義者が統計学者になる」ラザフォード・ジャーナル.

[27] Fama, Eugene F.; French, Kenneth R. (2010-04-21). 「Q&A: セミバリアンス：より優れたリスク指標か？」Fama/French Forum .

[28] ロナルド・フィッシャー(1918) メンデル遺伝の仮定に基づく親族間の相関

[29] Kocherlakota, S.; Kocherlakota, K. (2004). 「一般化分散」.統計科学百科事典. Wileyオンラインライブラリ. doi :10.1002/0471667196.ess0869. ISBN 0-471-66719-6。

v t e 確率分布の理論
確率質量関数（pmf）確率密度関数（pdf）累積分布関数（CDF）分位関数
生々しい瞬間中心モーメント平均分散標準偏差歪度尖度 Lモーメント
モーメント生成関数（mgf）特性関数確率生成関数（pgf）キュムラント組み合わせ

権限管理データベース
国際的	GND
全国	日本