반응형
참고 자료 1
자기상관 함수(ACF)의 정의
ACF는 주어진 시계열 데이터 $X_t$에서 서로 다른 시차 $k$에 대해 데이터가 얼마나 상관관계를 가지는지를 측정합니다. $k$ 시차에서의 자기상관 계수 $ρ_k$는 다음과 같이 정의됩니다:
$ρ_k=\frac{\text{Cov}(X_t, X_{t+k})}{\sqrt{\text{Var}(X_t) \text{Var}(X_{t+k})}}$
여기서 $Cov(X_t,X_{t+k})$는 $X_t$와 $X_{t+k}$간의 공분산입니다.
ACF가 0으로 수렴해야 하는 이유
- 시간에 따른 독립성:
- 대부분의 자연적이고 경제적인 시계열 데이터는 시간이 지남에 따라 서로 독립적으로 변하는 경향이 있습니다. 즉, 멀리 떨어진 시간 간격에서는 데이터 값들 간에 상관관계가 거의 없어야 합니다.
- 예를 들어, 오늘의 주식 가격과 1년 전의 주식 가격이 높은 상관관계를 가지는 것은 드물며, 이는 데이터가 시간이 지남에 따라 독립성을 회복하기 때문입니다.
- 무작위 과정(Random Walk):
- 무작위 과정은 이전 값과 무관하게 현재 값이 변하는 과정을 의미합니다. 이러한 과정에서는 시차가 커질수록 데이터 간의 상관관계가 약해져야 합니다.
- 무작위 행보(random walk)와 같은 비정상(non-stationary) 시계열 데이터는 특히 시간이 지남에 따라 자기상관이 줄어드는 특성을 가집니다.
- 정상성(Stationarity):
- 정상 시계열 데이터는 시간에 따라 일정한 평균과 분산을 가지며, 시간 간격에 대한 공분산이 일정합니다. 정상 시계열 데이터에서는 대부분의 자기상관이 짧은 시차에서만 의미 있는 값을 가지며, 긴 시차에서는 상관관계가 줄어듭니다.
- 정상성은 시계열 데이터 분석에서 중요한 가정이며, ACF 값이 시차가 증가할수록 0으로 수렴하는 것은 정상성의 한 특성입니다.
ACF 값이 0으로 수렴하지 않는 경우
- ACF 값이 0으로 수렴하지 않는 경우, 데이터가 비정상적이거나 장기적인 패턴이나 트렌드가 존재할 수 있습니다. 예를 들어, 주기적인 계절성이나 트렌드를 가진 데이터는 ACF 값이 일정한 주기로 반복되거나 느리게 감소할 수 있습니다.
요약
ACF 값이 0으로 수렴하는 것은 시계열 데이터가 시간이 지남에 따라 독립성을 회복하고, 정상적인 통계적 특성을 가진다는 것을 의미합니다. 이는 정상 시계열 데이터의 중요한 특성 중 하나이며, 시계열 데이터가 시간이 지남에 따라 어떤 패턴이나 구조 없이 무작위성을 띄는지를 평가하는 데 중요한 역할을 합니다.
반응형
'Portpolio > KSEB AI project' 카테고리의 다른 글
KSEB 3기 08.01 (0) | 2024.08.04 |
---|---|
KSEB 3기 07.31 (0) | 2024.08.04 |
KSEB 3기 7.29 (0) | 2024.08.04 |
KSEB 3기 07.26 (0) | 2024.07.29 |
KSEB 3기 07.25 (0) | 2024.07.25 |
댓글