自己相関

上:正弦関数を隠蔽する100個の乱数列のプロット。下:自己相関によって生成された相関図に現れた正弦関数
畳み込み、相互相関自己相関の視覚的な比較。関数fに関する演算においてfの高さを1.0と仮定すると、5つの異なる点における結果の値は、各点の下の網掛け部分で示されます。また、fの対称性が理由でこの例では f と f は同一です。

自己相関(離散時間の場合はシリアル相関とも呼ばれる)は信号とその信号遅延コピーとの相関関係を測定します。本質的には、異なる時点におけるランダム変数の観測値間の類似性を定量化します。自己相関分析は、ノイズによって隠された信号内の繰り返しパターンや隠れた周期性を特定するための数学的ツールです。自己相関は、信号処理時間領域解析、時系列解析において、データの時間経過に伴う挙動を理解するために 広く用いられています。

自己相関の定義は研究分野によって異なり、必ずしもすべての定義が同等というわけではありません。一部の分野では、この用語は自己共分散と同義に使用されます。

さまざまな時系列モデルには、単位根過程、傾向定常過程自己回帰過程移動平均過程などの自己相関が組み込まれています。

確率過程の自己相関

統計学において、実数または複素数ランダム過程の自己相関とは、異なる時刻における過程の値間のピアソン相関であり、2つの時刻または時間差の関数として表される。をランダム過程とし、を任意の時点とする(は離散時間過程の場合は整数、連続時間過程の場合は実数。この場合、は時刻 における過程の所定の実行によって生成される値(または実現値)である。各 について、時刻 における過程の平均分散がであるとする。この場合、時刻と の間の自己相関関数の定義は[1] : 388  [2] : 165 である。

ここでは期待値演算子であり、バーは複素共役を表します。期待値は明確に定義されない場合があることに注意してください。

乗算の前に平均値を引くと、時刻と時刻間の自己共分散関数が得られる:[1] :392  [2] :168 

この式は、全時系列または全プロセスに対しては適切に定義されないことに注意してください。平均が存在しない場合や、分散がゼロ (定数プロセスの場合) または無限大 (特定の種類のべき乗法則など、分布に適切なモーメントがないプロセスの場合) になる場合があるためです。

広義定常確率過程の定義

が広義の定常過程である場合、平均と分散は時間に依存しない。さらに、自己共分散関数は と の間の時間差のみに依存する自己共分散は、2つの値の間の時間距離のみに依存し、時間における位置には依存しない。これはさらに、自己共分散と自己相関が時間差の関数として表すことができ、これは時間差の 偶関数となることを意味する。これは、自己相関関数のより一般的な形を与える[1] :395 

自己共分散関数

特に、

正規化

一部の分野(例えば統計学や時系列解析)では、自己共分散関数を正規化して時間依存のピアソン相関係数を得るのが一般的です。しかし、他の分野(例えば工学)では、正規化は通常省略され、「自己相関」と「自己共分散」という用語は同じ意味で使用されます。

確率過程の自己相関係数の定義は[2] :169 である。

関数が適切に定義されている場合、その値は の範囲内にある必要があり、1 は完全な相関を示し、-1 は完全な反相関を示します。

広義定常(WSS)プロセスの場合、定義は

正規化が重要なのは、自己相関を相関として解釈することで、統計的依存性の強さを尺度なしで測定できるためと、正規化が推定された自己相関の統計的特性に影響を与えるためです。

プロパティ

対称性

自己相関関数が偶関数であるという事実は、WSSプロセスについてはそれぞれ[2] :171 と述べることができる。[2] :173 

ゼロで最大

WSSプロセスの場合: [2] : 174 は常に実数である ことに注意してください

コーシー・シュワルツの不等式

コーシー・シュワルツの不等式、確率過程の不等式:[1] : 392 

白色ノイズの自己相関

連続時間ホワイトノイズ信号の自己相関は、 で強いピーク(ディラックのデルタ関数で表される)を持ち、他のすべての ではとまったく同じになります

ウィーナー・ヒンチンの定理

ウィーナー・ヒンチンの定理は、フーリエ変換を介して自己相関関数パワースペクトル密度を関連付けます。

実数値関数の場合、対称自己相関関数は実対称変換を持つため、ウィーナー・ヒンチンの定理は実余弦のみで再表現できます。

ランダムベクトルの自己相関

(潜在的に時間依存する)ランダムベクトルの(潜在的に時間依存する)自己相関行列(二次モーメントとも呼ばれる)は、ランダムベクトルのすべての要素のペアの自己相関を要素として含む行列です。自己相関行列は、様々なデジタル信号処理アルゴリズムで使用されます。

期待値分散が存在するランダム要素を含むランダムベクトル の場合自己相関行列は[3] :190  [1] :334 で定義されます。

ここで、 は次元 の転置行列を表します

コンポーネントごとに記述:

が複素乱数ベクトルである場合、自己相関行列は次のように定義される。

ここで はエルミート転置を表します

たとえば、がランダムベクトルの場合、 は番目の要素が である行列になります

自己相関行列の性質

  • 自己相関行列は、複素乱数ベクトルに対してはエルミート行列であり、実数乱数ベクトルに対しては対称行列である。 [3] : 190 
  • 自己相関行列は正の半正定値行列である[3] :190 すなわち実数ランダムベクトルの場合は 、複素数ランダムベクトルの場合はとなる。
  • 自己相関行列のすべての固有値は実数かつ非負です。
  • 自己共分散行列は自己相関行列と次のように関係している。それぞれ複素ランダムベクトルの場合:

決定論的信号の自己相関

信号処理においては、上記の定義は正規化、つまり平均を減算したり分散で割ったりせずに用いられることが多い。自己相関関数が平均と分散で正規化されている場合、自己相関係数[4]または自己共分散関数と呼ばれることもある。

連続時間信号の自己相関

信号 が与えられた場合、連続自己相関は、遅れ における と 自身の連続相互相関積分として定義されることが多い[1] : 411 

ここで、は の複素共役を表します。積分におけるパラメータ はダミー変数であり、積分を計算するためにのみ必要です。特別な意味はありません。

離散時間信号の自己相関

離散時間信号の遅れにおける離散自己相関

上記の定義は、平方積分可能、あるいは平方和可能、つまり有限エネルギーの信号に対して有効です。「永遠に続く」信号はランダム過程として扱われ、その場合には期待値に基づいて異なる定義が必要となります。広義定常ランダム過程の場合、自己相関は次のように定義されます 。

定常ではないプロセスの場合、これらは、 、または の関数でもあります

エルゴード過程の場合、期待値は時間平均の極限に置き換えることができる。エルゴード過程の自己相関は、次のように定義されるか、または次のように等しくされることがある[4]。

これらの定義には、周期関数が定常エルゴード過程の出力でない場合でも、周期関数に対して適切に定義された単一パラメータの結果が得られるという利点があります。

あるいは、永久に続く信号は、有限時間積分を用いた短時間自己相関関数解析によって処理することができます。(関連プロセスについては、短時間フーリエ変換を参照してください。)

周期信号の定義

が周期 の連続周期関数である場合、 からの積分は長さ の任意の区間での積分に置き換えられます

これは次の式と同等である。

プロパティ

以下では、1次元自己相関の特性についてのみ説明する。これは、1次元の場合の特性のほとんどが多次元の場合にも容易に適用できるためである。これらの特性は、広義の定常過程にも当てはまる。[5]

  • 自己相関の基本的な性質は対称性であり、これは定義から容易に証明できる。連続の場合、
    • 自己相関は実関数の場合には偶関数であり、
    • 複素関数のとき、自己相関はエルミート関数 になります。
  • 連続自己相関関数は原点でピークに達し、実数値、すなわち任意の遅延に対して となる[1] : 410 これは再配置不等式の結果である離散的なケースでも同じ結果が成り立つ。
  • 周期関数の自己相関は、それ自体が同じ周期で周期的です。
  • 完全に相関のない 2 つの関数の合計の自己相関 (相互相関はすべてに対してゼロ) は、各関数の自己相関を個別に合計したものです。
  • 自己相関は相互相関の特定のタイプであるため、相互相関のすべての特性を維持します。
  • シンボルを使用して畳み込みを表しが関数 を操作する関数であり、 が として定義されている場合、 の定義は次のように記述できます。

多次元自己相関

多次元自己相関も同様に定義される。例えば、3次元では、平方和可能な離散信号の自己相関は次のように表される

自己相関関数を計算する前に信号から平均値を減算すると、結果の関数は通常、自己共分散関数と呼ばれます。

効率的な計算

離散列として表現されたデータの場合、高い計算効率で自己相関を計算することがしばしば必要となる。信号サイズが小さい場合は、信号処理定義に基づくブルートフォース法を用いることができる。例えば、実信号列(すなわちiの他のすべての値について、および)の自己相関を手計算で計算するには、まず、上記の定義が「通常の」乗算と同じだが、右シフトを伴うことを認識する必要がある。この場合、各垂直加算は特定の遅延値に対する自己相関を与える。

したがって、必要な自己相関シーケンスはであり他の遅延値の自己相関は 0 です。この計算では、通常の乗算​​で通常行われる加算中の繰り上がり演算は実行しません。自己相関の固有の対称性を利用することで、必要な演算数を半分にできることに注目してください。信号が周期的である場合、つまり の場合、円自己相関(円畳み込みに類似)が得られ、前の自己相関シーケンスの左右の裾が重なり合って となり、信号シーケンスと同じ周期を持つ が得られます。この手順は、離散信号のZ 変換の畳み込み特性の応用と見なすことができます。

ブルートフォースアルゴリズムはn 2 のオーダーであるが、自己相関を n log( n )のオーダーで計算できる効率的なアルゴリズムもいくつか存在する。例えば、ウィーナー・ヒンチンの定理は、生データX ( t )から2回の高速フーリエ変換(FFT)を用いて自己相関を計算することを可能にする。 [6] [要ページ]

ここで、IFFTは逆高速フーリエ変換を表します。アスタリスクは複素共役を表します。

あるいは、低いτ値に対しては力ずく計算を行い、その後X ( t )データを対数密度で段階的にビン化しより高い値を計算することで、同じnlog(n)効率が得られメモリ要件低くなります。[7] [8]

推定

平均と分散が既知で、観測値が観測される離散プロセスの場合、自己相関係数の推定値は次のように得られる。

任意の正の整数 に対して。真の平均と分散が既知の場合、この推定値は不偏です。プロセスの真の平均と分散が不明な場合は、いくつかの可能性があります。

  • および標本平均と標本分散の標準公式に置き換えると、これは偏った推定値になります。
  • ピリオドグラムに基づく推定では、上記の式を で置き換えます。この推定値は常にバイアスを持ちますが、通常は平均二乗誤差が小さくなります。[9] [10]
  • 他の可能性としては、2つのデータ部分を別々に扱い、推定値の定義に使用するために個別のサンプル平均やサンプル分散を計算することが挙げられます[引用が必要]

最後のタイプの推定値の利点は、推定された自己相関の集合が の関数として、まさにその自己相関を持つ理論的過程を定義できるという意味で有効な自己相関関数を形成することです。他の推定値では、 の線形結合の分散を計算するために使用すると、計算された分散が負になる可能性があるという問題があります。[11]

回帰分析

時系列データを用いた回帰分析では、対象変数の自己相関は、通常、自己回帰モデル(AR)、移動平均モデル(MA)、それらの組み合わせである自己回帰移動平均モデル(ARMA)、あるいは後者の拡張である自己回帰和分移動平均モデル(ARIMA)のいずれかを用いてモデル化されます。複数の相互に関連するデータ系列の場合は、ベクトル自己回帰(VAR)またはその拡張が用いられます。

通常最小二乗法(OLS)では、回帰残差の自己相関の有無を確認することで、モデル仕様の妥当性をある程度検証できます。問題となる誤差の自己相関は、それ自体は観測されませんが、観測可能な残差に自己相関を生み出すため、通常は検出可能です。(誤差は計量経済学では「誤差項」とも呼ばれます。)誤差の自己相関は、誤差項が無相関であるという通常最小二乗法の仮定に反するため、ガウス・マルコフ定理は適用されず、OLS推定値は最良線形不偏推定値()ではなくなります。OLS係数推定値にバイアスは生じませんが、低ラグにおける誤差の自己相関が正の場合、標準誤差は過小評価され(tスコアは過大評価され)、tスコアは過大評価される傾向があります。

一次自己相関の存在を検定する従来の方法は、ダービン・ワトソン統計量、または説明変数に遅れのある従属変数が含まれる場合はダービンのh統計量である。しかしダービン・ワトソンは、値とその遅れとの間のピアソン相関に線形マッピングすることができる。[12] 高次の自己相関をカバーし、回帰変数に従属変数の遅れが含まれるかどうかに関係なく適用可能な、より柔軟な検定は、ブルーシュ・ゴッドフリー検定である。この検定には補助回帰が含まれ、対象モデルの推定から得られた残差が (a) 元の回帰変数と (b)残差のk遅れに回帰される。ここで、k は検定の次数である。この補助回帰からの検定統計量の最も単純なバージョンはTR 2であり、Tはサンプルサイズ、R 2は決定係数である。自己相関がないという帰無仮説の下では、この統計はkの自由度で漸近的に分布します。

非ゼロ自己相関への対応としては、一般化最小二乗法ニューイ・ウェストHAC推定量(異分散性と自己相関の一貫性)が挙げられる。[13]

移動平均モデル(MA)の推定において、自己相関関数は、含めるべき遅延誤差項の適切な数を決定するために使用されます。これは、qオーダーのMAプロセスにおいて、に対して、に対して、 であるという事実に基づいています

アプリケーション

自己相関はデータ内の繰り返しパターンを見つけることができるため、次のような多くの用途に利用できます。

連続依存

系列依存性は自己相関の概念と密接に関連していますが、異なる概念です(相関と依存性を参照)。特に、系列依存性はあっても(線形)相関がないという状況も考えられます。ただし、一部の分野では、この2つの用語は同義語として用いられます。

確率変数系列は、系列内のある時点の値が別の時点の値に統計的に従属している場合、系列従属と呼ばれます。系列が系列独立である場合、どのペアにも従属関係がありません。

時系列が定常である場合、ペア間の統計的依存性は、同じ遅延におけるすべての値のペア間に統計的依存性があることを意味します

参照

参考文献

  1. ^ abcdefg グブナー、ジョン・A. (2006).電気・コンピュータエンジニアのための確率とランダムプロセス. ケンブリッジ大学出版局. ISBN 978-0-521-86470-1
  2. ^ abcdef クン・イル・パーク『確率過程の基礎と通信への応用』Springer、2018年、ISBN 978-3-319-68074-3
  3. ^ abc パプーリス、アタナシウス、『確率、ランダム変数、確率過程』、マグロウヒル、1991年
  4. ^ ab Dunn, Patrick F. (2005). 『工学と科学のための測定とデータ分析』ニューヨーク: McGraw–Hill. ISBN 978-0-07-282538-1
  5. ^ プロアキス, ジョン (2001年8月31日).通信システム工学 (第2版) (第2版). ピアソン. p. 168. ISBN 978-0130617934
  6. ^ Box, GEP; Jenkins, GM; Reinsel, GC (1994).時系列分析:予測と制御(第3版). Upper Saddle River, NJ: Prentice–Hall. ISBN 978-0130607744
  7. ^ Frenkel, D.; Smit, B. (2002). 「第4.4.2章」『分子シミュレーションの理解』(第2版). ロンドン: Academic Press. ISBN 978-0122673511
  8. ^ Colberg, P.; Höfling, F. (2011). 「GPUを用いたガラス状ダイナミクスの高速シミュレーション:浮動小数点精度の制限に関する注意点」Comput. Phys. Commun. 182 (5): 1120– 1129. arXiv : 0912.3824 . Bibcode :2011CoPhC.182.1120C. doi :10.1016/j.cpc.2011.01.009. S2CID  7173093.
  9. ^ プリーストリー、MB(1982年)『スペクトル解析と時系列』ロンドン、ニューヨーク:アカデミック・プレス、ISBN 978-0125649018
  10. ^ パーシバル、ドナルド・B、アンドリュー・T・ウォルデン (1993). 『物理応用のためのスペクトル解析:マルチテーパー法と従来の一変量解析法』 ケンブリッジ大学出版局. pp. 190–195. ISBN 978-0-521-43541-3
  11. ^ パーシバル、ドナルド・B. (1993). 「平均値が未知の定常過程における標本分散と自己共分散の3つの奇妙な性質」.アメリカ統計学者. 47 (4): 274– 276. doi :10.1080/00031305.1993.10475997.
  12. ^ 「シリアル相関分析法」『統計アイデア』2014年5月26日。
  13. ^ バウム、クリストファー・F. (2006). Stataを用いた現代計量経済学入門. Stata Press. ISBN 978-1-59718-013-9
  14. ^ Elson, Elliot L. (2011年12月). 「蛍光相関分光法:過去、現在、そして未来」. Biophysical Journal . 101 (12): 2855– 2870. Bibcode :2011BpJ...101.2855E. doi :10.1016/j.bpj.2011.11.012. PMC 3244056. PMID 22208184  . 
  15. ^ Hołyst, Robert; Poniewierski, Andrzej; Zhang, Xuzhu (2017). 「蛍光相関分光法における自己相関関数の解析的形」. Soft Matter . 13 (6): 1267– 1275. Bibcode :2017SMat...13.1267H. doi : 10.1039/C6SM02643E . ISSN  1744-683X. PMID  28106203.
  16. ^ ヴァン・シックル、ヤン(2008年)『土地測量士のためのGPS(第3版)』CRCプレス、  pp.18-19ISBN 978-0-8493-9195-8
  17. ^ Kalvani, Payam Rajabi; Jahangiri, Ali Reza; Shapouri, Samaneh; Sari, Amirhossein; Jalili, Yousef Seyed (2019年8月). 「オプトエレクトロニクス用途における様々な基板温度下でスパッタリングされたアルミニウムドープ酸化亜鉛薄膜のマルチモードAFM分析」. Superlattices and Microstructures . 132 106173. doi :10.1016/j.spmi.2019.106173. S2CID  198468676.
  18. ^ Tyrangiel, Josh (2009年2月5日). 「オートチューン:ポップミュージックが完璧に聞こえる理由」Time誌. 2009年2月10日時点のオリジナルよりアーカイブ。
  19. ^ Kasztenny, Bogdan (2016年3月). 「保護用途向け高速周波数測定の新手法」(PDF) . シュバイツァー・エンジニアリング・ラボラトリーズ. 2022年10月9日時点のオリジナルよりアーカイブ(PDF) . 2022年5月28日閲覧.

さらに読む

  • クメンタ・ヤン(1986). 『計量経済学の要素』(第2版). ニューヨーク: マクミラン. pp. 298–334. ISBN 978-0-02-365070-3
  • マルノ・フェルベック(2017年8月10日)『現代計量経済学ガイド』Wiley. ISBN 978-1-119-40110-0
  • Soltanalian, Mojtaba; Stoica, Petre (2012). 「良好な相関特性を持つシーケンスの計算設計」. IEEE Transactions on Signal Processing . 60 (5): 2180. Bibcode :2012ITSP...60.2180S. doi :10.1109/TSP.2012.2186134.
  • Solomon W. Golomb、Guang Gong著『良好な相関のための信号設計:無線通信、暗号、レーダー用』ケンブリッジ大学出版局、2005年。
  • Klapetek, Petr (2018).走査型プローブ顕微鏡における定量データ処理:ナノ計測学へのSPM応用(第2版). Elsevier. pp. 108–112 ISBN 9780128133477
  • ワイスタイン、エリック・W.「自己相関」。MathWorld
Retrieved from "https://en.wikipedia.org/w/index.php?title=Autocorrelation&oldid=1314678276"