平均二乗予測誤差

統計学において、平均二乗予測誤差（MSPE）は、平滑化、曲線近似、または回帰手法の予測値の平均二乗誤差とも呼ばれ、予測関数によって暗示される近似値と（観測不可能な）真の値gの値との二乗差である二乗予測誤差（PE）の期待値である。これは、推定モデルの説明力の逆数であり、推定モデルのクロスバリデーションのプロセスで使用できる。MSPEを正確に計算するにはgの情報が必要となるため、実際にはMSPEは推定される。^[¹^] ${\ワイドハット {g}}$ ${\ワイドハット {g}},$

処方

スムージングまたはフィッティング手順に、観測値ベクトルを予測値ベクトルにマッピングする投影行列（ハット行列）Lがある場合、 PE と MSPE は次のように定式化されます。 $y$ ${\hat {y}}=Ly,$

\operatorname {PE_{i}} =g(x_{i})-{\widehat {g}}(x_{i}),

\operatorname {MSPE} =\operatorname {E} \left[\operatorname {PE} _{i}^{2}\right]=\sum _{i=1}^{n}\operatorname {PE} _{i}^{2}/n.

MSPE は、適合値の二乗バイアス(平均誤差) と適合値の分散という 2 つの項に分解できます。

\operatorname {MSPE} =\operatorname {ME} ^{2}+\operatorname {VAR} ,

\operatorname {ME} =\operatorname {E} \left[{\widehat {g}}(x_{i})-g(x_{i})\right]

\operatorname {VAR} =\operatorname {E} \left[\left({\widehat {g}}(x_{i})-\operatorname {E} \left[{g}(x_{i})\right]\right)^{2}\right].

$SSPE = n MSPE$ という量は、予測誤差の二乗和と呼ばれます。二乗平均平方根予測誤差はMSPEの平方根です： $RMSPE = \sqrt MSPE$ 。

サンプル外データに対するMSPEの計算

平均二乗予測誤差は、正確には 2 つの状況で計算できます。まず、長さnのデータサンプルを使用して、データアナリストはq個のデータポイント ( q < n )に対してのみ回帰を実行し、その他のn – qデータポイントは、サンプル外で推定されるモデルの MSPE を計算するために使用するという特定の目的で保持します (つまり、モデル推定プロセスで使用されたデータは使用しません)。回帰プロセスはq 個のインサンプルポイントに合わせて調整されるため、通常、インサンプル MSPE は、保持されたn – q個のポイントで計算されたアウトオブサンプル MSPE よりも小さくなります。サンプル内と比較したアウトオブサンプルの MSPE の増加が比較的わずかであれば、モデルは好意的に評価されます。また、2 つのモデルを比較する場合、モデルの相対的なインサンプルパフォーマンスに関係なく、 n – q個のアウトオブサンプルデータポイントでの MSPE が低いモデルの方が好意的に評価されます。このコンテキストでのサンプル外 MSPE は、計算されたサンプル外データポイントに対して正確ですが、データが抽出された、ほとんど観測されていない母集団に対するモデルの MSPE の推定値にすぎません。

2 番目に、時間が経つにつれて、データアナリストが利用できるデータが増える可能性があり、それらの新しいデータに基づいて MSPE を計算できるようになります。

人口全体にわたるMSPEの推定

モデルが、一切の差し控えなく利用可能なすべてのデータに対して推定された場合、ほとんど観測されていないデータの全母集団に対するモデルの MSPE は次のように推定できます。

のモデルでは、次のように書くことができる。 $y_{i}=g(x_{i})+\sigma \varepsilon _{i}$ $\varepsilon _{i}\sim {\mathcal {N}}(0,1)$

n\cdot \operatorname {MSPE} (L)=g^{\text{T}}(IL)^{\text{T}}(IL)g+\sigma ^{2}\operatorname {tr} \left[L^{\text{T}}L\right].

サンプル内データ値を使用すると、右辺の最初の項は次の式と等しくなります。

\sum _{i=1}^{n}\left(\operatorname {E} \left[g(x_{i})-{\widehat {g}}(x_{i})\right]\right)^{2}=\operatorname {E} \left[\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\right)^{2}\right]-\sigma ^{2}\operatorname {tr} \left[\left(IL\right)^{T}\left(IL\right)\right].

したがって、

n\cdot \operatorname {MSPE} (L)=\operatorname {E} \left[\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\right)^{2}\right]-\sigma ^{2}\left(n-\operatorname {tr} \left[L\right]\right).

が既知であるか、またはによって十分に推定されている場合、MSPEを次のように推定することが可能になる。 $\sigma ^{2}$ ${\ワイドハット {\シグマ }}^{2}$

n\cdot \operatorname {\widehat {MSPE}} (L)=\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\right)^{2}-{\widehat {\sigma }}^{2}\left(n-\operatorname {tr} \left[L\right]\right).

コリン・マローズは、推定された MSPE の正規化バージョンであるモデル選択統計量C _pの構築においてこの方法を提唱しました。

C_{p}={\frac {\sum _{i=1}^{n}\left(y_{i}-{\widehat {g}}(x_{i})\right)^{2}}{{\widehat {\sigma }}^{2}}}-n+2p.

ここでpは推定パラメータpの数であり、すべての可能な回帰変数を含むモデルのバージョンから計算されます。これで証明は終わりです。 ${\ワイドハット {\シグマ }}^{2}$

参照

参考文献

^ Pindyck, Robert S. ; Rubinfeld, Daniel L. (1991). 「時系列モデルによる予測」 .計量モデルと経済予測（第3版）. ニューヨーク: McGraw-Hill. pp. 516–535 . ISBN 0-07-050098-3。

[1] Pindyck, Robert S. ; Rubinfeld, Daniel L. (1991). 「時系列モデルによる予測」 .計量モデルと経済予測（第3版）. ニューヨーク: McGraw-Hill. pp. 516–535 . ISBN 0-07-050098-3。

[

v t e 機械学習の評価指標
回帰	MSE 前 sMAPE マップ間瀬 MSPE RMS RMSE/RMSD R2 MDA 狂った
分類	Fスコア P4 正確さ精度想起カッパ MCC AUC 中華民国感度と特異度対数損失
クラスタリング	シルエットカリンスキー・ハラバシュ指数デイヴィス・ボールディン指数ダン指数ホプキンス統計ジャカード指数ランド指数類似度測定 SMC DBCVインデックス
ランキング	MRR NDCG AP
コンピュータービジョン	PSNR SSIM 借用書
NLP	困惑ブルーモーブ
ディープラーニング	インセプションスコア FID
レコメンデーションシステム	カバレッジリスト内類似性
類似性	コサイン類似度ユークリッド距離ピアソン相関係数
混同行列