幾何分布

幾何学的
幾何学的
	確率質量関数
	累積分布関数
パラメータ	成功確率（実数）
サポート	k回の試行で
PMF
CDF	のために、のために;
平均
中央値	; （整数の場合は一意ではありません）
モード
分散
歪度
過剰尖度
エントロピ
MGF	; のために
CF
PGF
フィッシャー情報

確率論と統計学において、幾何分布は次の 2 つの離散確率分布のいずれかです。

1 回の成功を得るために必要なベルヌーイ試行回数の確率分布。 $X$ $\mathbb {N} =\{1,2,3,\ldots \}$
最初の成功までの失敗回数の確率分布。 $Y=X-1$ $\mathbb {N} _{0}=\{0,1,2,\ldots \}$

これら2つの異なる幾何分布を混同してはいけません。前者（の分布）はしばしば「シフト幾何分布」と呼ばれますが、曖昧さを避けるため、支持点を明示的に示すことで、どちらを意図しているかを示すことが賢明です。 $X$

幾何分布は、最初の成功発生にはそれぞれ成功確率の独立試行が必要となる確率を与える。各試行における成功確率がの場合、最初の成功が回目の試行である確率はとなる。 $k$ $p$ $p$ $k$

$\Pr(X=k)=(1-p)^{k-1}p$

のために $k=1,2,3,4,\dots$

上記の幾何分布は、最初の成功までの試行回数をモデル化するために使用されます。一方、次の幾何分布は、最初の成功までの失敗回数をモデル化するために使用されます。

$\Pr(Y=k)=\Pr(X=k+1)=(1-p)^{k}p$

のために $k=0,1,2,3,\dots$

幾何分布は、その確率が幾何級数に従うことからその名が付けられました。ウェンデル・H・ファーリーにちなんで、ファーリー分布と呼ばれることもあります。^[1]^{: 210}

意味

幾何分布は、独立かつ同一分布に従うベルヌーイ試行の無限系列において、最初の成功がいつ発生するかを記述する離散確率分布である。その確率質量関数は、そのパラメータ化と支持度に依存する。支持度がである場合、確率質量関数はとなる。ここで、は試行回数、は各試行における成功確率である。^[2]^{: 260–261} $\mathbb {N}$ $P(X=k)=(1-p)^{k-1}p$ $k=1,2,3,\dotsc$ $p$

サポートはと定義されることもある。これにより確率質量関数はとなる。ここでは最初の成功までの失敗回数である。^[3]^{: 66} $\mathbb {N} _{0}$ $Y=X-1$ $P(Y=k)=(1-p)^{k}p$ $k=0,1,2,\dotsc$

分布の別のパラメータ化は確率質量関数を与える。ここで、および。^[1]^：208–209 $P(Y=k)=\left({\frac {P}{Q}}\right)^{k}\left(1-{\frac {P}{Q}}\right)$ $P={\frac {1-p}{p}}$ $Q={\frac {1}{p}}$

幾何分布の例としては、6面サイコロを「1」が出るまで振るというものがあります。各振る動作は独立しており、成功する確率はそれぞれ異なります。必要な振る回数は、という幾何分布に従います。 $1/6$ $p=1/6$

プロパティ

記憶喪失

幾何分布は、唯一の記憶のない離散確率分布です。^{[4]これは、}指数分布に見られるのと同じ特性の離散バージョンです。^[1]^{: 228}この特性は、以前に失敗した試行の回数が、成功に必要な将来の試行回数に影響を与えないと主張しています。

幾何分布には2つの定義があるため、離散確率変数の記憶のなさにも2つの定義がある。^[5]条件付き確率で表現すると、2つの定義は次のようになる。 $\Pr(X>m+n\mid X>n)=\Pr(X>m),$ $\Pr(Y>m+n\mid Y\geq n)=\Pr(Y>m),$

ここで、とは自然数、は上で定義される幾何分布の確率変数、は上で定義される幾何分布の確率変数です。これらの定義は離散確率変数に対しては等しくないことに注意する必要があります。は最初の式を満たさず、2番目の式も満たしません。 $m$ $n$ $X$ $\mathbb {N}$ $Y$ $\mathbb {N} _{0}$ $Y$ $X$

モーメントとキュムラント

上で定義される幾何分布の確率変数の期待値と分散は^[2]^:261である。上で定義される幾何分布の確率変数では、期待値はに変化するが、分散は変わらない。^[6]^:114–115 $X$ $\mathbb {N}$ $\operatorname {E} (X)={\frac {1}{p}},\qquad \operatorname {var} (X)={\frac {1-p}{p^{2}}}.$ $Y$ $\mathbb {N} _{0}$ $\operatorname {E} (Y)={\frac {1-p}{p}},$

たとえば、6面サイコロを振って「1」が出るまで、必要なサイコロの平均回数はで、失敗する平均回数はです。 ${\frac {1}{1/6}}=6$ ${\frac {1-1/6}{1/6}}=5$

およびでそれぞれ定義された幾何分布のモーメント生成関数は^[7]^[6]^{: 114}である。最初の成功までの失敗回数のモーメントは次のように与えられる。 $\mathbb {N}$ $\mathbb {N} _{0}$ ${\begin{aligned}M_{X}(t)&={\frac {pe^{t}}{1-(1-p)e^{t}}}\\M_{Y}(t)&={\frac {p}{1-(1-p)e^{t}}},t<-\ln(1-p)\end{aligned}}$ ${\begin{aligned}\mathrm {E} (Y^{n})&{}=\sum _{k=0}^{\infty }(1-p)^{k}p\cdot k^{n}\\&{}=p\operatorname {Li} _{-n}(1-p)&({\text{for }}n\neq 0)\end{aligned}}$

ここでは多重対数関数である。^[8] $\operatorname {Li} _{-n}(1-p)$

上で定義される幾何分布のキュムラント生成関数は^[1]^:216である。キュムラントは、上で定義されているとき、再帰性を満たす。^[1]^:216 $\mathbb {N} _{0}$ $K(t)=\ln p-\ln(1-(1-p)e^{t})$ $\kappa _{r}$ $\kappa _{r+1}=q{\frac {\delta \kappa _{r}}{\delta q}},r=1,2,\dotsc$ $q=1-p$ $\mathbb {N} _{0}$

期待値の証明

上記のXの期待値、つまり成功までの平均試行回数を考えてみましょう。最初の試行は確率で成功するか、確率で失敗します。最初の試行が失敗した場合、成功までの残りの平均試行回数は最初の平均と一致します。これは、すべての試行が独立しているという事実から導き出されます。 $\mathrm {E} (X)$ $p$ $1-p$

これから次の式が得られます。

$\operatorname {\mathrm {E} } (X)=p+(1-p)(1+\mathrm {E} [X]),$

これをについて解くと次のようになります。 $\mathrm {E} (X)$

$\operatorname {E} (X)={\frac {1}{p}}.$

期待される故障 数は、期待値の線形性から求めることができます。また、次のように表すこともできます。 $Y$ $\mathrm {E} (Y)=\mathrm {E} (X-1)=\mathrm {E} (X)-1={\frac {1}{p}}-1={\frac {1-p}{p}}$

${\begin{aligned}\operatorname {E} (Y)&=p\sum _{k=0}^{\infty }(1-p)^{k}k\\&=p(1-p)\sum _{k=0}^{\infty }(1-p)^{k-1}k\\&=p(1-p)\left(-\sum _{k=0}^{\infty }{\frac {d}{dp}}\left[(1-p)^{k}\right]\right)\\&=p(1-p)\left[{\frac {d}{dp}}\left(-\sum _{k=0}^{\infty }(1-p)^{k}\right)\right]\\&=p(1-p){\frac {d}{dp}}\left(-{\frac {1}{p}}\right)\\&={\frac {1-p}{p}}.\end{aligned}}$

和と微分の交換は、収束するべき級数が、収束する点の集合のコンパクトな部分集合上で均一に収束するという事実によって正当化されます。

要約統計

幾何分布の平均はその期待値であり、§ モーメントとキュムラントで前述したように、またはまたはでそれぞれ定義されている場合です。 ${\frac {1}{p}}$ ${\frac {1-p}{p}}$ $\mathbb {N}$ $\mathbb {N} _{0}$

幾何分布の中央値は、 ^[9]で定義されるとき、また^[3]で定義されるとき^{、69である}。 $\left\lceil -{\frac {\log 2}{\log(1-p)}}\right\rceil$ $\mathbb {N}$ $\left\lfloor -{\frac {\log 2}{\log(1-p)}}\right\rfloor$ $\mathbb {N} _{0}$

幾何分布の最頻値は、サポートセットの最初の値です。これは、で定義されている場合は1 、で定義されている場合は0です。^[3]^{: 69} $\mathbb {N}$ $\mathbb {N} _{0}$

幾何分布の歪度は^[6]^：115である。 ${\frac {2-p}{\sqrt {1-p}}}$

幾何分布の尖度はです。[ 6 ^]^{: 115}分布の過剰尖度は、分布の尖度と正規分布の尖度との差です。[ 10 ] : ²¹⁷^{したがって}、幾何分布の過剰尖度はです。であるため、過剰尖度は常に正であり、分布は急尖です。^[3]^{: 69}言い換えると、幾何分布の裾はガウス分布よりも速く減少します。^[10]^{: 217} $9+{\frac {p^{2}}{1-p}}$ $3$ $6+{\frac {p^{2}}{1-p}}$ ${\frac {p^{2}}{1-p}}\geq 0$

エントロピーとフィッシャー情報量

エントロピー（幾何分布、成功の前の失敗）

エントロピーは確率分布における不確実性の尺度です。最初の成功までの失敗回数をモデル化する幾何分布の場合、確率質量関数は次のようになります。

$P(X=k)=(1-p)^{k}p,\quad k=0,1,2,\dots$

この分布のエントロピーは次のように定義されます。 $H(X)$

${\begin{aligned}H(X)&=-\sum _{k=0}^{\infty }P(X=k)\ln P(X=k)\\&=-\sum _{k=0}^{\infty }(1-p)^{k}p\ln \left((1-p)^{k}p\right)\\&=-\sum _{k=0}^{\infty }(1-p)^{k}p\left[k\ln(1-p)+\ln p\right]\\&=-\log p-{\frac {1-p}{p}}\log(1-p)\end{aligned}}$

確率が低下するにつれてエントロピーが増加し、成功が稀になるにつれて不確実性が増すことを反映します。 $p$

フィッシャーの情報量（幾何分布、成功前の失敗）

フィッシャー情報量は、観測可能な確率変数が未知のパラメータについて持つ情報量を測定するものです。幾何分布（最初の成功の前に失敗がある分布）の場合、フィッシャー情報量は次のように与えられます。 $X$ $p$ $p$

$I(p)={\frac {1}{p^{2}(1-p)}}$

証拠：

幾何確率変数の尤度関数は次のようになります。 $X$ $L(p;X)=(1-p)^{X}p$
対数尤度関数は次のようになります。 $\ln L(p;X)=X\ln(1-p)+\ln p$
スコア関数（に対する対数尤度の一次導関数）は次のようになります。 $p$ ${\frac {\partial }{\partial p}}\ln L(p;X)={\frac {1}{p}}-{\frac {X}{1-p}}$
対数尤度関数の2次導関数は次のようになります。 ${\frac {\partial ^{2}}{\partial p^{2}}}\ln L(p;X)=-{\frac {1}{p^{2}}}-{\frac {X}{(1-p)^{2}}}$
フィッシャー情報量は、2次導関数の負の期待値として計算されます。 ${\begin{aligned}I(p)&=-E\left[{\frac {\partial ^{2}}{\partial p^{2}}}\ln L(p;X)\right]\\&=-\left(-{\frac {1}{p^{2}}}-{\frac {1-p}{p(1-p)^{2}}}\right)\\&={\frac {1}{p^{2}(1-p)}}\end{aligned}}$

フィッシャー情報量はが減少するにつれて増加し、より稀な成功がパラメータに関するより多くの情報を提供することを示しています。 $p$ $p$

エントロピー（幾何分布、成功までの試行）

最初の成功までの試行回数をモデル化する幾何分布の場合、確率質量関数は次のようになります。

$P(X=k)=(1-p)^{k-1}p,\quad k=1,2,3,\dots$

この分布のエントロピーは、失敗するまでのバージョンモデリング試行のエントロピーと同じです。 $H(X)$

${\begin{aligned}H(X)&=-\log p-{\frac {1-p}{p}}\log(1-p)\end{aligned}}$

フィッシャーの情報量（幾何分布、成功までの試行回数）

最初の成功までの試行回数をモデル化する幾何分布のフィッシャー情報は次のように与えられます。

$I(p)={\frac {1}{p^{2}(1-p)}}$

証拠：

幾何確率変数の尤度関数は次のようになります。 $X$

L(p;X)=(1-p)^{X-1}p

対数尤度関数は次のようになります。

\ln L(p;X)=(X-1)\ln(1-p)+\ln p

スコア関数（に対する対数尤度の一次導関数）は次のようになります。 $p$

{\frac {\partial }{\partial p}}\ln L(p;X)={\frac {1}{p}}-{\frac {X-1}{1-p}}

対数尤度関数の2次導関数は次のようになります。

{\frac {\partial ^{2}}{\partial p^{2}}}\ln L(p;X)=-{\frac {1}{p^{2}}}-{\frac {X-1}{(1-p)^{2}}}

フィッシャー情報量は、2次導関数の負の期待値として計算されます。

${\begin{aligned}I(p)&=-E\left[{\frac {\partial ^{2}}{\partial p^{2}}}\ln L(p;X)\right]\\&=-\left(-{\frac {1}{p^{2}}}-{\frac {1-p}{p(1-p)^{2}}}\right)\\&={\frac {1}{p^{2}(1-p)}}\end{aligned}}$

一般的な特性

および上で定義される幾何確率変数の確率生成関数はそれぞれ、^[6]^{: 114–115} $X$ $Y$ $\mathbb {N}$ $\mathbb {N} _{0}$ ${\begin{aligned}G_{X}(s)&={\frac {s\,p}{1-s\,(1-p)}},\\[10pt]G_{Y}(s)&={\frac {p}{1-s\,(1-p)}},\quad |s|<(1-p)^{-1}.\end{aligned}}$
特性関数はに等しいので、とをそれぞれ定義すると、幾何分布の特性関数は^[11]^{: 1630}となる。 $\varphi (t)$ $G(e^{it})$ $\mathbb {N}$ $\mathbb {N} _{0}$ ${\begin{aligned}\varphi _{X}(t)&={\frac {pe^{it}}{1-(1-p)e^{it}}},\\[10pt]\varphi _{Y}(t)&={\frac {p}{1-(1-p)e^{it}}}.\end{aligned}}$
パラメータを持つ幾何分布のエントロピーは^[12]である。 $p$ $-{\frac {p\log _{2}p+(1-p)\log _{2}(1-p)}{p}}$
平均が与えられたとき、幾何分布はすべての離散確率分布の中で最大エントロピー確率分布となる。対応する連続分布は指数分布である。^[13]
で定義される幾何分布は無限に割り切れる。つまり、任意の正の整数に対して、和が幾何分布に従う独立かつ同一分布の確率変数が存在する。これは、負の二項分布が対数確率変数のポアソン分布和から導出できるためである。^[11]^{: 606–607} $\mathbb {N} _{0}$ $n$ $n$
幾何分布するランダム変数Yの小数桁は、独立した（同一に分布していない）ランダム変数の列です。 ^{[引用が必要]} たとえば、百の位の数字Dには、この確率分布があります。ここで $q$ $= 1 -$ $p$ であり、他の桁についても同様であり、より一般的には、 10 以外の基数を持つ記数法についても同様です。基数が 2 の場合、幾何分布するランダム変数は、確率分布が分解できない独立したランダム変数の合計として表すことができることがわかります。 $\Pr(D=d)={q^{100d} \over 1+q^{100}+q^{200}+\cdots +q^{900}},$
ゴロム符号化は、幾何学的離散分布に最適なプレフィックス符号である^{[説明が必要] 。}^[12]

統計的推論

未知の幾何分布の真のパラメータは、推定値と共役分布を通じて推測できます。 $p$

モーメント法

確率分布の第一モーメントは、存在する場合、次の式を用いて標本から推定できる。ここで、は番目の標本モーメント、である。 ^[16]^{: 349–350}で推定すると、標本平均が得られ、と表記される。この推定値を幾何分布の期待値の式に代入し、を解くと、それぞれおよびでサポートされている場合の推定値およびが得られる。これらの推定値は、Jensenの不等式の結果として、であるため、偏りがある。^[17]^{: 53–54} $l$ $x_{1},\dotsc ,x_{n}$ $m_{i}={\frac {1}{n}}\sum _{j=1}^{n}x_{j}^{i}$ $m_{i}$ $i$ $1\leq i\leq l$ $\mathrm {E} (X)$ $m_{1}$ ${\bar {x}}$ $p$ ${\hat {p}}={\frac {1}{\bar {x}}}$ ${\hat {p}}={\frac {1}{{\bar {x}}+1}}$ $\mathbb {N}$ $\mathbb {N} _{0}$ $\mathrm {E} \left({\frac {1}{\bar {x}}}\right)>{\frac {1}{\mathrm {E} ({\bar {x}})}}=p$

最大尤度推定

の最大尤度推定量は、標本が与えられた場合に尤度関数を最大化する値である。 ^[16]^{: 308}分布が上で定義されているときに対数尤度関数の導関数の零点を求めることにより、最大尤度推定量はであることが分かる。ここでは標本平均である。^[18]定義域がの場合、推定量はにシフトする。§ モーメント法で前述したように、これらの推定量には偏りがある。 $p$ $\mathbb {N}$ ${\hat {p}}={\frac {1}{\bar {x}}}$ ${\bar {x}}$ $\mathbb {N} _{0}$ ${\hat {p}}={\frac {1}{{\bar {x}}+1}}$

ドメインに関係なく、バイアスは次のようになります。

$b\equiv \operatorname {E} {\bigg [}\;({\hat {p}}_{\mathrm {mle} }-p)\;{\bigg ]}={\frac {p\,(1-p)}{n}}$

これにより、バイアス補正された最大尤度推定値が得られる。^[要出典]

${\hat {p\,}}_{\text{mle}}^{*}={\hat {p\,}}_{\text{mle}}-{\hat {b\,}}$

ベイズ推論

ベイズ推論において、パラメータは、サンプルを観測した後にベイズの定理を用いて計算された事後分布を伴う事前分布からのランダム変数である。 ^[17]^{: 167}事前分布としてベータ分布を選択した場合、事後もベータ分布となり、共役分布と呼ばれる。特に、事前を選択した場合、サンプルを観測した後の事後分布は、^[19]である。あるいは、サンプルがである場合、事後分布は^[20]である。分布の期待値はであるため、^[11]^{: 145}とがゼロに近づくにつれて、事後平均は最大尤度推定に近づく。 $p$ $\mathrm {Beta} (\alpha ,\beta )$ $k_{1},\dotsc ,k_{n}\in \mathbb {N}$ $p\sim \mathrm {Beta} \left(\alpha +n,\ \beta +\sum _{i=1}^{n}(k_{i}-1)\right).\!$ $\mathbb {N} _{0}$ $p\sim \mathrm {Beta} \left(\alpha +n,\beta +\sum _{i=1}^{n}k_{i}\right).$ $\mathrm {Beta} (\alpha ,\beta )$ ${\frac {\alpha }{\alpha +\beta }}$ $\alpha$ $\beta$

ランダム変数生成

幾何分布は、IID 標準一様確率変数から、より小さいか等しい最初の確率変数を見つけることによって実験的に生成することができる。しかし、必要な確率変数の数も幾何分布に従うため、が減少するにつれてアルゴリズムは遅くなる。^[21]^{: 498} $p$ $p$

乱数生成は、指数乱数を切り捨てることで定数時間で行うことができます。指数乱数変数は、パラメータを通して幾何分布に従うことができます。また、式をに変更することで、標準的な一様乱数変数からを生成することができます。^[21]^{: 499–500}^[22] $E$ $p$ $\lceil -E/\log(1-p)\rceil$ $E$ $U$ $\lceil \log(U)/\log(1-p)\rceil$

アプリケーション

幾何分布は多くの分野で用いられている。待ち行列理論では、M/M/1待ち行列は幾何分布に従う定常状態をとる。^[23]確率過程においては、ユール・ファーリー過程は幾何分布に従う。^[24]この分布は、離散的な文脈におけるデバイスの寿命をモデル化する際にも現れる。^{[25]また、}COVID-19を拡散させる患者のモデル化を含むデータのフィッティングにも用いられている。^[26]

参照

参考文献

^ abcdef ジョンソン, ノーマン L. ;ケンプ, アドリエンヌ W. ;コッツ, サミュエル(2005-08-19). 単変量離散分布. Wileyシリーズ確率統計 (第1版). Wiley. doi :10.1002/0471715816. ISBN 978-0-471-27246-5。
^ ab Nagel, Werner; Steyer, Rolf (2017-04-04). 確率と条件付き期待値：経験科学の基礎. Wileyシリーズ確率・統計（第1版）. Wiley. doi :10.1002/9781119243496. ISBN 978-1-119-24352-6。
^ abcde Chattamvelli, Rajan; Shanmugam , Ramalingam (2020). 工学と応用科学における離散分布．数学と統計に関する統合講義．Cham: Springer International Publishing．doi : 10.1007 /978-3-031-02425-2．ISBN 978-3-031-01297-6。
^ デッキング、フレデリック・ミシェル;クライカンプ、コーネリス。ロプハー、ヘンドリック・ポール。メースター、ルドルフ・アーウィン (2005)。確率と統計の現代的な入門。統計学におけるシュプリンガーのテキスト。ロンドン：スプリンガーロンドン。 p. 50.土井：10.1007/1-84628-168-7。ISBN 978-1-85233-896-1。
^ Weisstein, Eric W. 「Memoryless」. mathworld.wolfram.com . 2024年7月25日閲覧。
^ abcde フォーブス, キャサリン; エヴァンス, メラン; ヘイスティングス, ニコラス; ピーコック, ブライアン (2010-11-29). 統計分布（第1版）. Wiley. doi :10.1002/9780470627242. ISBN 978-0-470-39063-4。
^ Bertsekas, Dimitri P. ; Tsitsiklis, John N. (2008). 確率入門最適化と計算シリーズ（第2版）ベルモント: Athena Scientific . p. 235. ISBN 978-1-886529-23-6。
^ Weisstein, Eric W. 「幾何分布」. MathWorld . 2024年7月13日閲覧。
^ Aggarwal, Charu C. (2024). 機械学習のための確率と統計：教科書. 出版社: Springer Nature Switzerland. p. 138. doi :10.1007/978-3-031-53282-5. ISBN 978-3-031-53281-8。
^ ab Chan, Stanley (2021). データサイエンスのための確率入門（第1版）.ミシガン出版. ISBN 978-1-60785-747-1。
^ abcd Lovric, Miodrag編 (2011). 国際統計科学百科事典（第1版）. ベルリン、ハイデルベルク: Springer Berlin Heidelberg. doi :10.1007/978-3-642-04898-2. ISBN 978-3-642-04897-5。
^ ab Gallager, R.; van Voorhis, D. (1975年3月). 「幾何学的に分散された整数アルファベットの最適ソースコード（対応）」. IEEE Transactions on Information Theory . 21 (2): 228– 230. doi :10.1109/TIT.1975.1055357. ISSN 0018-9448.
^ Lisman, JHC; Zuylen, MCA van (1972年3月). 「最確度分布の生成に関する注記」 . Statistica Neerlandica . 26 (1): 19– 23. doi :10.1111/j.1467-9574.1972.tb00152.x. ISSN 0039-0402.
^ ピットマン、ジム (1993). 確率. ニューヨーク: シュプリンガー・ニューヨーク. p. 372. doi :10.1007/978-1-4612-4374-8. ISBN 978-0-387-94594-1。
^ Ciardo, Gianfranco; Leemis, Lawrence M.; Nicol, David (1995年6月1日). 「独立幾何分布確率変数の最小値について」 . Statistics & Probability Letters . 23 (4): 313– 326. doi :10.1016/0167-7152(94)00130-Z. hdl : 2060/19940028569 . S2CID 1505801.
^ ab エヴァンス、マイケル、ローゼンタール、ジェフリー (2023). 『確率と統計：不確実性の科学』（第2版）. マクミラン・ラーニング. ISBN 978-1429224628。
^ ab Held, Leonhard; Sabanés Bové, Daniel (2020). 尤度とベイズ推論：生物学と医学への応用. 生物学と健康のための統計学. ベルリン、ハイデルベルク: Springer Berlin Heidelberg. doi :10.1007/978-3-662-60792-3. ISBN 978-3-662-60791-6。
^ Siegrist, Kyle (2020年5月5日). 「7.3: 最大尤度」. Statistics LibreTexts . 2024年6月20日閲覧。
^ フィンク、ダニエル. 「共役事前分布の概要」. CiteSeerX 10.1.1.157.5540 .
^ 「3. 共役分布族」（PDF）。 2010年4月8日時点のオリジナルよりアーカイブ（PDF）。
^ ab Devroye, Luc (1986). 非一様乱数変量生成. ニューヨーク: Springer New York. doi :10.1007/978-1-4613-8643-8. ISBN 978-1-4613-8645-2。
^ ドナルド・アービン・クヌース(1997). 『コンピュータプログラミングの芸術』第2巻 (第3版). マサチューセッツ州レディング:アディソン・ウェスレー. p. 136. ISBN 978-0-201-89683-1。
^ ダスキン、マーク・S. (2021). 一口サイズのオペレーションズ・マネジメント. オペレーションズ・リサーチと応用に関する統合講義. シュプリンガー・インターナショナル・パブリッシング. p. 127. doi :10.1007/978-3-031-02493-1. ISBN 978-3-031-01365-2。
^ マディラ、シヴァプラサド;デシュムク、シャイラジャ（2023）。 R を使用した確率過程の紹介。シンガポール: Springer Nature Singapore。 p. 449.土井：10.1007/978-981-99-5601-2。ISBN 978-981-99-5600-5。
^ Gupta, Rakesh; Gupta, Shubham; Ali, Irfan (2023), Garg, Harish (ed.) 「信頼性を分析するためのいくつかの離散パラメトリックマルコフ連鎖システムモデル」、信頼性、故障、リスク分析の進歩、シンガポール：Springer Nature Singapore、pp. 305– 306、doi :10.1007/978-981-19-9909-3_14、ISBN 978-981-19-9908-6、 2024年7月13日取得
^ Polymenis, Athanase (2021-10-01). 「SARS-CoV-2感染リスクの地域別評価における幾何分布の応用」. Asian Journal of Medical Sciences . 12 (10): 8– 11. doi : 10.3126/ajms.v12i10.38783 . ISSN 2091-0576.

[:8-1] ジョンソン, ノーマン L. ;ケンプ, アドリエンヌ W. ;コッツ, サミュエル(2005-08-19). 単変量離散分布. Wileyシリーズ確率統計 (第1版). Wiley. doi :10.1002/0471715816. ISBN 978-0-471-27246-5。

[:1-2] Nagel, Werner; Steyer, Rolf (2017-04-04). 確率と条件付き期待値：経験科学の基礎. Wileyシリーズ確率・統計（第1版）. Wiley. doi :10.1002/9781119243496. ISBN 978-1-119-24352-6。

[:2-3] Chattamvelli, Rajan; Shanmugam , Ramalingam (2020). 工学と応用科学における離散分布．数学と統計に関する統合講義．Cham: Springer International Publishing．doi : 10.1007 /978-3-031-02425-2．ISBN 978-3-031-01297-6。

[4] デッキング、フレデリック・ミシェル;クライカンプ、コーネリス。ロプハー、ヘンドリック・ポール。メースター、ルドルフ・アーウィン (2005)。確率と統計の現代的な入門。統計学におけるシュプリンガーのテキスト。ロンドン：スプリンガーロンドン。 p. 50.土井：10.1007/1-84628-168-7。ISBN 978-1-85233-896-1。

[5] Weisstein, Eric W. 「Memoryless」. mathworld.wolfram.com . 2024年7月25日閲覧。

[:0-6] フォーブス, キャサリン; エヴァンス, メラン; ヘイスティングス, ニコラス; ピーコック, ブライアン (2010-11-29). 統計分布（第1版）. Wiley. doi :10.1002/9780470627242. ISBN 978-0-470-39063-4。

[7] Bertsekas, Dimitri P. ; Tsitsiklis, John N. (2008). 確率入門最適化と計算シリーズ（第2版）ベルモント: Athena Scientific . p. 235. ISBN 978-1-886529-23-6。

[8] Weisstein, Eric W. 「幾何分布」. MathWorld . 2024年7月13日閲覧。

[9] Aggarwal, Charu C. (2024). 機械学習のための確率と統計：教科書. 出版社: Springer Nature Switzerland. p. 138. doi :10.1007/978-3-031-53282-5. ISBN 978-3-031-53281-8。

[:4-10] Chan, Stanley (2021). データサイエンスのための確率入門（第1版）.ミシガン出版. ISBN 978-1-60785-747-1。

[:9-11] Lovric, Miodrag編 (2011). 国際統計科学百科事典（第1版）. ベルリン、ハイデルベルク: Springer Berlin Heidelberg. doi :10.1007/978-3-642-04898-2. ISBN 978-3-642-04897-5。

[:7-12] Gallager, R.; van Voorhis, D. (1975年3月). 「幾何学的に分散された整数アルファベットの最適ソースコード（対応）」. IEEE Transactions on Information Theory . 21 (2): 228– 230. doi :10.1109/TIT.1975.1055357. ISSN 0018-9448.

[13] Lisman, JHC; Zuylen, MCA van (1972年3月). 「最確度分布の生成に関する注記」 . Statistica Neerlandica . 26 (1): 19– 23. doi :10.1111/j.1467-9574.1972.tb00152.x. ISSN 0039-0402.

[14] ピットマン、ジム (1993). 確率. ニューヨーク: シュプリンガー・ニューヨーク. p. 372. doi :10.1007/978-1-4612-4374-8. ISBN 978-0-387-94594-1。

[15] Ciardo, Gianfranco; Leemis, Lawrence M.; Nicol, David (1995年6月1日). 「独立幾何分布確率変数の最小値について」 . Statistics & Probability Letters . 23 (4): 313– 326. doi :10.1016/0167-7152(94)00130-Z. hdl : 2060/19940028569 . S2CID 1505801.

[:5-16] エヴァンス、マイケル、ローゼンタール、ジェフリー (2023). 『確率と統計：不確実性の科学』（第2版）. マクミラン・ラーニング. ISBN 978-1429224628。

[:3-17] Held, Leonhard; Sabanés Bové, Daniel (2020). 尤度とベイズ推論：生物学と医学への応用. 生物学と健康のための統計学. ベルリン、ハイデルベルク: Springer Berlin Heidelberg. doi :10.1007/978-3-662-60792-3. ISBN 978-3-662-60791-6。

[18] Siegrist, Kyle (2020年5月5日). 「7.3: 最大尤度」. Statistics LibreTexts . 2024年6月20日閲覧。

[19] フィンク、ダニエル. 「共役事前分布の概要」. CiteSeerX 10.1.1.157.5540 .

[20] 「3. 共役分布族」（PDF）。 2010年4月8日時点のオリジナルよりアーカイブ（PDF）。

[:6-21] Devroye, Luc (1986). 非一様乱数変量生成. ニューヨーク: Springer New York. doi :10.1007/978-1-4613-8643-8. ISBN 978-1-4613-8645-2。

[22] ドナルド・アービン・クヌース(1997). 『コンピュータプログラミングの芸術』第2巻 (第3版). マサチューセッツ州レディング:アディソン・ウェスレー. p. 136. ISBN 978-0-201-89683-1。

[23] ダスキン、マーク・S. (2021). 一口サイズのオペレーションズ・マネジメント. オペレーションズ・リサーチと応用に関する統合講義. シュプリンガー・インターナショナル・パブリッシング. p. 127. doi :10.1007/978-3-031-02493-1. ISBN 978-3-031-01365-2。

[24] マディラ、シヴァプラサド;デシュムク、シャイラジャ（2023）。 R を使用した確率過程の紹介。シンガポール: Springer Nature Singapore。 p. 449.土井：10.1007/978-981-99-5601-2。ISBN 978-981-99-5600-5。

[25] Gupta, Rakesh; Gupta, Shubham; Ali, Irfan (2023), Garg, Harish (ed.) 「信頼性を分析するためのいくつかの離散パラメトリックマルコフ連鎖システムモデル」、信頼性、故障、リスク分析の進歩、シンガポール：Springer Nature Singapore、pp. 305– 306、doi :10.1007/978-981-19-9909-3_14、ISBN 978-981-19-9908-6、 2024年7月13日取得

[26] Polymenis, Athanase (2021-10-01). 「SARS-CoV-2感染リスクの地域別評価における幾何分布の応用」. Asian Journal of Medical Sciences . 12 (10): 8– 11. doi : 10.3126/ajms.v12i10.38783 . ISSN 2091-0576.