본문 바로가기
Data Science & AI Theories

시계열분석(2) - 최소제곱선형회귀, AR모델 적합성판단

by Oliver J 2023. 8. 16.
반응형
  • 최소제곱선형회귀(Least Linear Regression) Model 의 시계열 Data적용 필요조건
    • 시계열 행동에 대한 가정
      1. 시계열은 예측변수에 대한 선형적인 반응을 한다
      2. 입력변수는 시간에 따라 일정치 않거나 타입력변수와 상관관계가 없다.(이는 단순한 Data의 시간차원을 설명하기 위해 전통적 선형회귀 독립변수의 요구사항을 확장한것)
    • 오차에 대한 가정
      1. 각 시점의 Data에 대해 모든 시기의 모든 설명변수에 대해 예상 오차값은 0
      2. 특정 시기의 오차는 과거/미래에 대한 입력과 상관없다. 즉, 오차의 자기상관그래프의 패턴이 없음
      3. 오차의 분산은 시간으로부터 독립적이다.
    • 위의 두가지 가정이 성립할 경우 보통 최소제곱회귀(Ordinary Least Squares Regression)는 주어진 입력에 대한 계수의 비편향추정량(Unbiased Estimator)이 되며, 이는 시계열 Data에서도 동일하다
    • 위의 가정 미충족에 선형회귀 적용할 경우
      1. 계수가 Model의 오차를 최소화하지 못한다.
      2. 미충족가정에 의존하므로 계수가 0이 아닌지 식별하기 위한 p-value가 부정확하다. 따라서 계수의 유의성 평가가 잘못되었다는 의미가 된다.
반응형
  • Data가 AR(Autoregressive) Model에 적합한지 평가하려면 먼저 편자기상관함수(Partial Autocorrelation Function)그래프를 그려보아야한다.
    • AR과정 PACF: AR(p)과정의 차수 p를 넘는 부분을 0으로 잘라버림. 그 결과로 실증적으로 볼 수 있는 AR과정의 차수를 구체적이며 시각적으료 표시한다.

PACF 시각화 예제

728x90
반응형