시계열 분석 패턴 - sigyeyeol bunseog paeteon

시계열도를 해석하려면 다음 단계를 수행하십시오.

이 항목의 내용

  • 1단계: 특이치와 급격한 이동 확인
  • 2단계: 추세 찾기
  • 3단계: 계절 패턴 또는 주기적인 움직임 검색
  • 4단계: 계절 변동이 가법적인지 승법적인지 평가

1단계: 특이치와 급격한 이동 확인

공정 지식을 사용하여 비정상적인 관측치 또는 이동이 오류를 나타내는지 아니면 공정의 실제 변화를 나타내는지 확인하십시오.

특이치

특이치라고도 하는 비정상적인 관측치가 있는지 찾아보십시오. 특이치는 시계열 모형에 불균형적인 영향을 미치고 잘못된 결과를 유발할 수 있습니다. 특이치의 원인을 확인하고 데이터 입력 오류 또는 측정 오류를 수정하십시오. 특수 원인이라고도 하는 비정상적인 일회성 사건과 연관된 데이터 값을 삭제해 보십시오.

다음 시계열도는 데이터 입력 오류로 인한 특이치를 표시합니다. 한 기술자가 실수로 워크시트에 40 대신 4를 값으로 입력했습니다.

시계열 분석 패턴 - sigyeyeol bunseog paeteon

급격한 이동

계열의 급격한 이동이나 추세의 급격한 변화를 찾아보십시오. 이런 변화의 원인을 확인해 보십시오.

예를 들어 다음 시계열도에는 15개월 후에 공정 비용이 급격히 바뀌는 것이 보입니다. 변동의 원인을 조사해야 합니다.

시계열 분석 패턴 - sigyeyeol bunseog paeteon

2단계: 추세 찾기

추세는 데이터 값의 장기적인 증가 또는 감소입니다. 추세는 선형이거나, 곡면성을 어느 정도 보일 수 있습니다. 데이터에 추세가 보이는 경우, 시계열 분석을 사용하여 데이터를 모형화하고 예측을 생성할 수 있습니다. 사용할 분석에 대한 자세한 내용을 확인하려면 어떤 시계열 분석을 사용해야 합니까?로 이동하십시오.

시계열 분석 패턴 - sigyeyeol bunseog paeteon

다음 시계열도에는 분명한 상향 추세가 보입니다. 시간이 갈수록 데이터 값이 더 빨리 증가하는 것으로 보이기 때문에 데이터에 곡면성도 약간 있을 수 있습니다. 곡면성이 있는 경우 2차 모형이 가장 적합합니다.

3단계: 계절 패턴 또는 주기적인 움직임 검색

계절 패턴이란 같은 기간 동안 정기적으로 반복되는 데이터 값의 상승 또는 하락입니다. 예를 들어 자동차 부품 매장의 주문량은 매주 월요일에 적고 주중에 증가하며 매주 금요일에 최고에 달합니다. 계절 패턴에는 항상 고정되고 알려진 기간이 있습니다. 반대로, 주기적 움직임은 정기적으로 반복되지 않는 데이터 값의 상승 및 하락 주기입니다. 일반적으로 주기적인 움직임은 계절 패턴보다 더 길고 변동이 더 큽니다.

시계열 분석을 사용하여 패널을 모형화하고 예측을 생성할 수 있습니다. 사용할 분석에 대한 자세한 내용을 확인하려면 어떤 시계열 분석을 사용해야 합니까?로 이동하십시오.

계절 패턴다음 데이터는 계절 패턴을 보입니다. 패턴은 12개월마다 반복됩니다.
시계열 분석 패턴 - sigyeyeol bunseog paeteon
주기적 움직임다음 데이터는 주기적 움직임을 보입니다. 주기는 정기적으로 반복되지 않고, 형상이 같지 않습니다.
시계열 분석 패턴 - sigyeyeol bunseog paeteon
랜덤 변동다음 데이터는 랜덤 변동을 보입니다. 패턴이나 주기가 없습니다.
시계열 분석 패턴 - sigyeyeol bunseog paeteon

4단계: 계절 변동이 가법적인지 승법적인지 평가

계절 변동의 크기가 일정하면 계절 변동이 가법적입니다. 계절 변동의 크기가 데이터 값이 클수록 커지면 계절 변동이 승법적입니다. 변동성이 더 크면 승법적 계절 변동을 정확하게 예측하기가 더 어려워집니다.

패턴이 명확하지 않거나 데이터를 모형화하기 위해 가법 절차와 승법 절차 중에서 선택하는 데 문제가 있는 경우, 두 절차를 모두 사용해보고 정확도 측도가 더 작은 방법을 선택할 수 있습니다. 자세한 내용을 확인하려면 어떤 시계열 분석을 사용해야 합니까?로 이동하십시오.

시계열 데이터란?

시간에 순차적으로 관측한 값들의 집합이며, 예측 모델에서 시간을 변수로 사용하는 특징이 있다.


시계열 데이터 분석이란?

과거 데이터의 패턴을 분석하여 미래의 값을 예측하는 방법으로, 과거의 패턴이 미래에도 지속된다는 데이터의 안정성이 기본적인 가정으로 필요하다. 


시계열 데이터를 추세/순환/계절/불규칙 요소로 분해하는 기법이다.

추세(Trend)란?

데이터가 장기적으로 증가하거나 감소하는 것이며, 추세가 꼭 선형적일 필요는 없다.

순환(Cycle)이란?

경기변동과 같이 정치, 경제, 사회적 요인에 의한 변화로, 일정 주기가 없으며 장기적인 변화 현상이다.

계절성(Seasoanl)이란?

주, 월, 분기, 반기 단위 등 특정 시간의 주기로 나타나는 패턴이다.

불규칙요소(Random, Residual)란?

설명될 수 없는 요인 또는 돌발적인 요인에 의하여 일어나는 변화로, 예측 불가능한 임이의 변동을 의미한다.

분해법에서는 원래 데이터에서 추세, 순환, 계절성은 뺀 나머지를 불규칙 요소라 한다.


즉, 시계열 데이터는 추세, 순환, 계절성, 불규칙요소로 이루어져 있으며 이를 식으로 나타내면 다음과 같다.

1. 덧셈 분해(additive decomposition) 

$$ y_t = S_t+T_t+R_t $$

여기서 \(y_t\) 는 데이터이고, \(t\)는 시점, \(S_t\)는 계절 성분, \(T_t\)는 추세 및 순환 성분, \(R_t\)는 불규칙 요소를 의미한다.

2. 곱셈 분해(multiplicative decomposition)

덧셈 대신 곱셈으로 분해하는 경우도 존재한다. 이 때, 식은 다음과 같다.

$$ y_t = S_t*T_t*R_t $$

단, multiplicative 모델을 활용하려면 데이터에 0이 존재해서는 안된다.

덧셈 분해와 곱셈 분해의 차이점은 

덧셈 분해는 Trend와 Seasonal이 별개이고, 곱셈 분해는 Trend에 따라 Seasonal이 변화한다고 보면 된다.

시계열 분석 패턴 - sigyeyeol bunseog paeteon
https://sigmundojr.medium.com/seasonality-in-python-additive-or-multiplicative-model-d4b9cf1f48a7

위 그림에 첫 번째 예시는 시간에 지남에 따라(Trend가 변화함에 따라) 변동폭이 일정하지만, 두 번째 그림은 Trend가 상승함에 따라 변동폭 역시 증가하고 있다. 즉, 첫 번째 예시는 Additive가 적절하고, 두 번째 예시는 Multiplicative가 적절하다. 

다음 글에서 설명하겠지만, ARIMA 모형은 정상성을 가정하고 있다.

시간에 따라 변동폭이 일정하지 않을 경우에는 정상성 가정을 만족하지 못해 로그 변환을 해 주는데,

즉, \(y_t = S_t*T_t*R_t\)의 곱셈 분해는 로그 변환으로 \(logy_t=logS+t+logT_t+logR_t\)과 같이 덧셈 분해와 같아진다.


이는 R 또는 Python에서 코드 한 줄로 구현할 수 있는데,

R에서는 stats 패키지의 decompose(), Python에서는 statsmodels.tsa.seasonal 패키지의 seasonal_decompose() 함수를 활용하면 된다.

decompose()는 type에 "additive" 또는 "multiplicative"로 덧셈 분해와 곱셈 분해를 구분하여 넣어주면 되고,

seasonal_decompose()는 model="additive" or "multiplicative"로 구분해서 넣어주면 된다.

예시는 다음과 같다.

시계열 분석 패턴 - sigyeyeol bunseog paeteon

가장 위의 raw 데이터를 Trend, Cycle, Seasonal, Random 요소로 분해한 결과이다. 

점진적으로 증가하는 추세를 보이며, 약간의 계절성도 가지고 있음을 알 수 있다.


Raw 데이터를 각각의 패턴으로 해석하는 예시는 다음과 같다.

시계열 분석 패턴 - sigyeyeol bunseog paeteon

미국 단독 주택 거래량 같은 경우, 전체 기간에 걸쳐 분명한 추세가 있지는 않지만, 매년 강한 계절성과 약 6~10년 주기의 패턴이 존재한다.

미국 재무부 단기 증권 계약의 경우, 점진적으로 하향하는 추세가 보인다.

호주 분기별 전력 생산의 경우, 강항 계절성과 증가 추세가 보인다.

구글 주식 종가 기준 일별 변동은 추세, 계절성 및 주기적인 패턴이 보이지 않는다.

이러한 패턴에 따라 분석 기법이 달라지기 때문에, 알고리즘에 fitting 하기에 앞 서, EDA과정을 거쳐 데이터의 특성을 파악해야 한다.


참고 및 출처

https://otexts.com/fppkr/index.html

Forecasting: Principles and Practice (2nd ed)

2nd edition

Otexts.com

시계열 분석 패턴 - sigyeyeol bunseog paeteon