1. 정보전략 및 관리/확률통계

시계열 분석(Time Series Analysis)

SWExpert 2022. 11. 3. 01:11

I. 미래예측 기법 시계열 분석 개요

-. 시간의 흐름에 따른 데이터의 변화추이 또는 패턴을 찾아 미래를 예측하는 분석기법

-. 시계열 자료들 간의 계열 상관을 이용하여 동태적인 관계를 분석하는 기법

-. 자료간의 인과관계나 시차분포형태에 대한 사전적인 제약이 최소화된 모형을 추정해서 데이터의 의미를 도출하는 방법

-. 시계열 분석 자료의 경우, 오랫동안의 변동을 통해 일정한 추세를 가지게 되면, 그것을 통해서 미래에 어떠한 현상이 발생될지를 예측하는 것이며, 과거를 통해서 미래의 지속성을 확인하는 과정

시계열 데이터의 인과관계에 근거한 모델 생성을 위한 탐색적 목적과 미래값 예측을 위한 예측적 목적으로 구분됨

일반적으로 예측을 위해 시계열 데이터 분석을 주로 사용

 

II. 시계열 분석 원리

가. 정상성

정상성은 시점에 관계없이 시계열의 특성이 일정하다는 의미

정상성은 아래 3개의 조건을 말하며 조건을 하나라도 만족하지 못하는 경우의 시계열 자료는 비정상 시계열임

1. 평균이 일정

2. 분산이 시점에 의존하지 않음

3. 공분산은 단지 시차에만 의존하고 시점 자체에는 의존하지 않음

 

나. 추세변동요인, 순환변동요인, 계절변동요인 및 불규칙 변동요인

변동요인 설명
추세변동요인 추세변동이란 시간에 따라 종속변수값이 달라진다는 것
계절변동요인  계절변동은 특정 주기별로 같은 패턴을 보이는 파돋의 형태
순환변동요인 추세변동+계절변동의 개념: 일정한 주기를 가지고 추세를 따라감
불규칙 변동요인 시간과 종속변수와의 관계로는 설명할 수 없는 변동, 예: 전재지변, 태풍, 홍수 등

대부분의 시계열 자료는 비정상 시계열이며 시간에 따라 전개되는 특성과 주기적으로 변동하는 특성을 볼때, 추세변동요인, 순환변동요인, 계절변동요인 및 불규칙 변동요인으로 구성됨

변동요인 설명
추세변동요인 인구변화, 기술변화, 생산성 증대 등 장기적인 변동으로 통상 10년 이상의 변동주기를 가지는 변동요인
순환변동요인 경기순환 등에 따라 반복되는 변동으로 2년~5년 주기로 변화하는 변동요인
계절변동요인 계절의 변화 및 각종 관습에 의해 생성되는 1년 주기로 반복되는 변동 요인
불규칙 변동요인 추세, 순환, 계절 변동요인이 아닌 돌발적이거나 원인불명의 요인에 의거하여 발생하는 변동요인

 

다. 안정 시계열과 불안정 시계열

안정시계열(stationary) 불안정시계열(nonstationary)
  • 시계열의 움직임이 구간이 달라지더라도 매 구간별 특성이 동일한 시계열
  • 시계열의 평균과 분산에 시간에 따른 규칙적인 변화가 없고 주기적인 변화도 없는 시계열
  • 시계열의 평균 및 분산이 시간에 따라 변화하는 시계열
  • 추세변동요인과 계절변동요인이 뚜렷한 경제시계열은 대체로 불안정시계열임

 

라. 차분 지수평활화, 변수변환

구분 설명
차분 현재 시점 자료에서 과거 인접 시점의 자료를 차감하는 기법
시계열의 차분으로 시계열이 전기에 비해 얼마나 증감했는지 파악
평활화 주기가 짧은 변동 요인 즉 교란요인을 제거하여 시계열의 기조적 흐름 파악
중심화 이동평균, 후방이동평균, 가중이동평균, 이중이동평균 등
변수변환 로그(log) 등 수학적 함수를 이용하여 큰 변동값은 작게, 작은 변동 값은 크게 만들어 주어 선형적 분석이 가능하게 하는 기법

 

III. 시계열 데이터 4가지 요소

시계열 요소 핵심요소 설명
수준(Level) 시계열의 평균값 - 시계열 데이터의 전체적 평균
추세(Trend) 전반적인 패턴 변화 - 어떤 현상이 일정한 방향으로 증가/하락하는 경향
- 선형, 2차 함수, 지수 성장, S-곡선 등의 유형 존재
계절변동(Seasonality) 짧은 기간 동안의
주기적인 패턴
- 특정 기간 동안 유사한 형태의 관측치가 반복되는 구간
잡음(Noise) 무작위적 변동 - 일반적으로 알 수 없는 이유로 발생하는 무작위적 관측치

 

  • 시계열 데이터의 전반적 경향을 정확히 보기 위해 시간 데이터 단위를 확대/감소시켜 패턴을 확인하거나 데이터의 스케일(로그스케일 등)을 변화시키면서 확인 필요

IV. 시계열 분석 기법

  • 시계열 분석 기법으로는 자기회귀모형, 자기이동평균모형, 자기회귀이동평균모형, 자기회귀누적이동평균모형이 있음

모형 설명
AR
  • Auto Regression(자기회귀모형)
  • 현 시점의 자료가 p 시점 전의 유한개의 과거 자료로 설명되는 모델
MA
  • 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합으로 이루어진 모형
ARMA
  • Auto Regression Moving Average(자기회귀이동평균모형)
  • AR, MA 모형을 동시에 포함하여 시계열모형의 모수를 줄여서 보다 효율적인 시계열 분석을 수행하는 모델 기법
ARIMA
  • Auto Regressive Integrated Moving Average(자기회귀누적이동평균모형)
  • 시계열을 차분해서 ARMA 모형이 되는 모형

'1. 정보전략 및 관리 > 확률통계' 카테고리의 다른 글

통계적 가설검정  (0) 2022.11.01