投影行列

統計学において、射影行列 ^[1]（影響行列^{[2] 、}ハット行列とも呼ばれる）は、応答値（従属変数値）のベクトルを適合値（または予測値）のベクトルにマッピングする。これは、各応答値が各適合値に与える影響を表す。 ^[3]^[4]射影行列の対角要素はてこ比であり、これは同じ観測値に対する各応答値が適合値に与える影響を表す。 $(\mathbf {P} )$ $(\mathbf {H} )$

意味

応答値のベクトルを、適合値のベクトルをと表すと、 $\mathbf {y}$ $\mathbf {\hat {y}}$

\mathbf {\hat {y}} =\mathbf {P} \mathbf {y} .

通常「Y ハット」と発音されるように、投影行列は「帽子をかぶる」ことからハット行列とも呼ばれます。 $\mathbf {\hat {y}}$ $\mathbf {P}$ $\mathbf {y}$

残余財産の申請

残差ベクトルの式は、射影行列を使って簡潔に表現することもできます。 $\mathbf {r}$

\mathbf {r} =\mathbf {y} -\mathbf {\hat {y}} =\mathbf {y} -\mathbf {P} \mathbf {y} =\left(\mathbf {I} -\mathbf {P} \right)\mathbf {y} .

ここでは単位行列です。この行列は残差マーカー行列または消滅行列と呼ばれることもあります。 $\mathbf {I}$ $\mathbf {M} :=\mathbf {I} -\mathbf {P}$

残差の共分散行列は、誤差伝播により、 $\mathbf {r}$

\mathbf {\Sigma } _{\mathbf {r} }=\left(\mathbf {I} -\mathbf {P} \right)^{\textsf {T}}\mathbf {\Sigma } \left(\mathbf {I} -\mathbf {P} \right)

、

ここで、は誤差ベクトル（および拡張により応答ベクトル）の共分散行列である。独立かつ同一分布に従う誤差を持つ線形モデルの場合、これは次のように簡約される。^[3] $\mathbf {\Sigma }$ $\mathbf {\Sigma } =\sigma ^{2}\mathbf {I}$

\mathbf {\Sigma } _{\mathbf {r} }=\left(\mathbf {I} -\mathbf {P} \right)\sigma ^{2}

。

直感

図から、ベクトルからの列空間への最も近い点はであり、の列空間に直交する線を引ける点であることがわかります。行列の列空間に直交するベクトルは、行列転置の零空間内にあるため、 $\mathbf {b}$ $\mathbf {A}$ $\mathbf {Ax}$ $\mathbf {A}$

\mathbf {A} ^{\textsf {T}}(\mathbf {b} -\mathbf {Ax} )=0

。

そこから並べ替えると

{\begin{aligned}&&\mathbf {A} ^{\textsf {T}}\mathbf {b} &-\mathbf {A} ^{\textsf {T}}\mathbf {Ax} =0\\\Rightarrow &&\mathbf {A} ^{\textsf {T}}\mathbf {b} &=\mathbf {A} ^{\textsf {T}}\mathbf {Ax} \\\Rightarrow &&\mathbf {x} &=\left(\mathbf {A} ^{\textsf {T}}\mathbf {A} \right)^{-1}\mathbf {A} ^{\textsf {T}}\mathbf {b} \end{aligned}}

。

したがって、はの列空間上にあるので、に写像する射影行列はです。 $\mathbf {Ax}$ $\mathbf {A}$ $\mathbf {b}$ $\mathbf {x}$ $\mathbf {A} \left(\mathbf {A} ^{\textsf {T}}\mathbf {A} \right)^{-1}\mathbf {A} ^{\textsf {T}}$

線形モデル

線形最小二乗法を用いて線形モデルを推定したいとします。モデルは次のように表すことができます。

\mathbf {y} =\mathbf {X} {\boldsymbol {\beta }}+{\boldsymbol {\varepsilon }},

ここで、は説明変数の行列（設計行列）、βは推定される未知のパラメータのベクトル、εは誤差ベクトルです。 $\mathbf {X}$

多くの種類のモデルや手法がこの定式化の対象となります。例としては、線形最小二乗法、平滑化スプライン、回帰スプライン、局所回帰、カーネル回帰、線形フィルタリングなどが挙げられます。

通常の最小二乗法

各観測値の重みが同一で、誤差が無相関の場合、推定パラメータは

{\hat {\boldsymbol {\beta }}}=\left(\mathbf {X} ^{\textsf {T}}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}\mathbf {y} ,

したがって適合値は

{\hat {\mathbf {y} }}=\mathbf {X} {\hat {\boldsymbol {\beta }}}=\mathbf {X} \left(\mathbf {X} ^{\textsf {T}}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}\mathbf {y} .

したがって、射影行列（およびハット行列）は次のように与えられる。

\mathbf {P} :=\mathbf {X} \left(\mathbf {X} ^{\textsf {T}}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}.

加重最小二乗法と一般化最小二乗法

上記は、重みが同一でない場合や誤差が相関している場合にも一般化できる。誤差の共分散行列をΣとすると、

{\hat {\mathbf {\beta } }}_{\text{GLS}}=\left(\mathbf {X} ^{\textsf {T}}\mathbf {\Sigma } ^{-1}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}\mathbf {\Sigma } ^{-1}\mathbf {y}

。

帽子行列はこうして

\mathbf {H} =\mathbf {X} \left(\mathbf {X} ^{\textsf {T}}\mathbf {\Sigma } ^{-1}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}\mathbf {\Sigma } ^{-1}

また、であることが分かりますが、今度は対称ではなくなりました。 $H^{2}=H\cdot H=H$

プロパティ

射影行列には、いくつかの有用な代数的性質があります。^[5]^[6]線形代数の言語では、射影行列は計画行列の列空間への直交射影です。^{[4] （は}Xの擬似逆行列であることに注意。）この設定における射影行列のいくつかの事実は、次のようにまとめられます。^[4] $\mathbf {X}$ $\left(\mathbf {X} ^{\textsf {T}}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}$

$\mathbf {u} =(\mathbf {I} -\mathbf {P} )\mathbf {y} ,$ そして $\mathbf {u} =\mathbf {y} -\mathbf {P} \mathbf {y} \perp \mathbf {X} .$
$\mathbf {P}$ は対称であり、も同様です。 $\mathbf {M} :=\mathbf {I} -\mathbf {P}$
$\mathbf {P}$ はべき等です: 、も同様です。 $\mathbf {P} ^{2}=\mathbf {P}$ $\mathbf {M}$
がn × r行列で、が成り立つ場合、 $\mathbf {X}$ $\operatorname {rank} (\mathbf {X} )=r$ $\operatorname {rank} (\mathbf {P} )=r$
の固有値はr個の1とn − r個の0から構成され、の固有値はn − r個の1とr個の0から構成されます。^[7] $\mathbf {P}$ $\mathbf {M}$
$\mathbf {X}$ はに関して不変です。したがってです。 $\mathbf {P}$ $\mathbf {PX} =\mathbf {X} ,$ $\left(\mathbf {I} -\mathbf {P} \right)\mathbf {X} =\mathbf {0}$
$\left(\mathbf {I} -\mathbf {P} \right)\mathbf {P} =\mathbf {P} \left(\mathbf {I} -\mathbf {P} \right)=\mathbf {0} .$
$\mathbf {P}$ 特定のサブスペースに対して一意です。

線形モデルに対応する投影行列は対称かつべき等性、つまりである。しかし、これは常に当てはまるわけではない。例えば、局所重み付け散布図平滑化法（LOESS）では、ハット行列は一般に対称でもべき等でもない。 $\mathbf {P} ^{2}=\mathbf {P}$

線形モデルの場合、射影行列のトレースはの階数に等しく、これは線形モデルの独立パラメータの数です。^[8]観測において依然として線形であるLOESSなどの他のモデルの場合、射影行列を使用してモデルの有効自由度を定義できます。 $\mathbf {X}$ $\mathbf {y}$

回帰分析における投影行列の実際的な応用としては、影響力のある観測値、つまり回帰の結果に大きな影響を与える観測値を特定することに関係するてこ比やクックの距離などがあります。

ブロックワイズ式

計画行列を列ごとにと分解できると仮定する。ハット演算子または射影演算子をと定義する。同様に、残差演算子をと定義する。すると、射影行列は次のように分解できる。^[9] $\mathbf {X}$ $\mathbf {X} ={\begin{bmatrix}\mathbf {A} &\mathbf {B} \end{bmatrix}}$ $\mathbf {P} [\mathbf {X} ]:=\mathbf {X} \left(\mathbf {X} ^{\textsf {T}}\mathbf {X} \right)^{-1}\mathbf {X} ^{\textsf {T}}$ $\mathbf {M} [\mathbf {X} ]:=\mathbf {I} -\mathbf {P} [\mathbf {X} ]$

\mathbf {P} [\mathbf {X} ]=\mathbf {P} [\mathbf {A} ]+\mathbf {P} {\big [}\mathbf {M} [\mathbf {A} ]\mathbf {B} {\big ]},

ここで、例えば、およびである。このような分解には多くの応用がある。古典的な応用では、はすべて1の列であり、回帰分析に切片項を追加した場合の効果を分析することができる。別の用途としては、固定効果モデルが挙げられる。ここで、は固定効果項のダミー変数からなる大きな疎行列である。この分割を用いることで、のハット行列を、を明示的に作成することなく計算することができる。行列は大きすぎてコンピュータのメモリに収まらない可能性がある。 $\mathbf {P} [\mathbf {A} ]=\mathbf {A} \left(\mathbf {A} ^{\textsf {T}}\mathbf {A} \right)^{-1}\mathbf {A} ^{\textsf {T}}$ $\mathbf {M} [\mathbf {A} ]=\mathbf {I} -\mathbf {P} [\mathbf {A} ]$ $\mathbf {A}$ $\mathbf {A}$ $\mathbf {X}$ $\mathbf {X}$

歴史

ハット行列は 1972 年に John Wilder によって導入されました。Hoaglin, DC と Welsch, RE (1978) による論文では、この行列の特性と、その応用例が数多く紹介されています。

参照

参考文献

^ バシレフスキー、アレクサンダー (2005). 統計科学における応用行列代数. ドーバー. pp. 160– 176. ISBN 0-486-44538-0。
^ 「データ同化：データ同化システムの観測影響診断」（PDF）。2014年9月3日時点のオリジナル（PDF）からアーカイブ。
^ ab Hoaglin, David C.; Welsch, Roy E. (1978年2月). 「回帰分析と分散分析におけるハット行列」(PDF) . The American Statistician . 32 (1): 17– 22. doi :10.2307/2683469. hdl : 1721.1/1920 . JSTOR 2683469.
^ abc David A. Freedman (2009).統計モデル：理論と実践.ケンブリッジ大学出版局.
^ Gans, P. (1992).化学科学におけるデータフィッティング. Wiley. ISBN 0-471-93412-7。
^ Draper, NR; Smith, H. (1998).応用回帰分析. Wiley. ISBN 0-471-17082-8。
^ 雨宮毅 (1985). 『上級計量経済学』ケンブリッジ: ハーバード大学出版局. pp. 460–461. ISBN 0-674-00560-0。
^ 「線形回帰における「ハット」行列のトレースがXのランクであることの証明」。Stack Exchange。2017年4月13日。
^ ラオ、C. ラダクリシュナ;トウテンブルク、ヘルゲ。シャラブ。ヒューマン、クリスチャン (2008)。線形モデルと一般化(第 3 版)。ベルリン：シュプリンガー。 p. 323.ISBN 978-3-540-74226-5。

[1] バシレフスキー、アレクサンダー (2005). 統計科学における応用行列代数. ドーバー. pp. 160– 176. ISBN 0-486-44538-0。

[2] 「データ同化：データ同化システムの観測影響診断」（PDF）。2014年9月3日時点のオリジナル（PDF）からアーカイブ。

[Hoaglin1977-3] Hoaglin, David C.; Welsch, Roy E. (1978年2月). 「回帰分析と分散分析におけるハット行列」(PDF) . The American Statistician . 32 (1): 17– 22. doi :10.2307/2683469. hdl : 1721.1/1920 . JSTOR 2683469.

[Freedman09-4] David A. Freedman (2009).統計モデル：理論と実践.ケンブリッジ大学出版局.

[5] Gans, P. (1992).化学科学におけるデータフィッティング. Wiley. ISBN 0-471-93412-7。

[6] Draper, NR; Smith, H. (1998).応用回帰分析. Wiley. ISBN 0-471-17082-8。

[7] 雨宮毅 (1985). 『上級計量経済学』ケンブリッジ: ハーバード大学出版局. pp. 460–461. ISBN 0-674-00560-0。

[8] 「線形回帰における「ハット」行列のトレースがXのランクであることの証明」。Stack Exchange。2017年4月13日。

[9] ラオ、C. ラダクリシュナ;トウテンブルク、ヘルゲ。シャラブ。ヒューマン、クリスチャン (2008)。線形モデルと一般化(第 3 版)。ベルリン：シュプリンガー。 p. 323.ISBN 978-3-540-74226-5。

v t e 行列クラス
明示的に制約されたエントリ	交代反対角線反エルミート反対称矢じりバンド双対角線左右対称ブロック対角線ブロックブロック三角対角線ブール値コーシー中心対称会議複素アダマール共陽性対角線優位対角線離散フーリエ変換小学校同等フロベニウス一般化順列アダマールハンケルエルミートヘッセンベルク中空整数論理的マトリックスユニットメッツラームーア非負五角形順列非対称多項式四元数サイン歪エルミート歪対称スカイラインまばらシルベスター対称的トゥープリッツ三角三角線ヴァンダーモンドウォルシュ Z
絶え間ない	交換ヒルベルト身元レーマー 1のパスカルパウリレッドヘファーシフトゼロ
固有値または固有ベクトルの条件	仲間収束欠陥品明確対角化可能ハーウィッツ安定正定値スティルチェス
積または逆行列の条件を満たす	合同な冪等性または射影反転可能内向的零位普通直交ユニモジュラー単能性ユニタリー完全にユニモジュラー計量
特定のアプリケーションで	アジュゲート交互記号拡張ベズージャボチンスキーカルタン巡回員補因子減刑混乱コクセター距離重複と削除ユークリッド距離基礎方程式（線形微分方程式）ジェネレータグラムヘッセン世帯主ヤコビアン一瞬精算選ぶランダム回転ラウス・ハーウィッツザイフェルト剪断類似性シンプレクティック完全にポジティブ変換
統計で使用される	センタリング相関共分散デザイン二重確率論フィッシャー情報帽子精度確率論的遷移
グラフ理論で使用される	隣接性隣接性程度エドモンズ入射ラプラシアンザイデル隣接性トゥッテ
科学技術で使用される	カビボ・小林・益川密度基礎（コンピュータービジョン）あいまい連想ガンマゲルマンハミルトニアン不規則な重複 S 状態遷移代替 Z（化学）
関連用語	ジョルダン正規形線形独立性行列指数円錐曲線の行列表現完璧なマトリックス擬似逆行列列階段形式ヴロンスキアン
数学ポータル行列のリストカテゴリ:行列（数学）