시계열 데이터
과거가 미래에 어떤 영향을 주는가?
•
일정기간 동안 수집된 순차적 데이터 셋의 집합.
•
시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받게 되는 데이터 ex) 일별, 월별, 분기별, 년도별 ..
◦
이렇게 순차적으로 발생한 연속적인 관측치는 서로 상관관계를 맺고 있음
분석 목적
•
시계열 데이터의 분석 목적은 시계열이 갖고 있는 법칙성을 발견해 이를 모형화하고, 또 추정된 모형을 통하여 미래의 값을 forecasting 하는 것
시계열 자료의 종류
•
POS (Point of sales) 구매 자료 (불규칙적인 시차)
•
일일 코스피 주식가격
•
월별/분기별/연도별 특정 사건의 수치 (규칙적인 시차)
등 일어난 사건의 데이터 값을 모은 데이터 셋.
◦
특히, 시계열 자료를 볼 때 유의해야할 점은 y축을 확인하여 노이즈 값에 영향을 많이 받는가 를 확인 해야 한다.
◦
주기가 길 수록 스무스한 곡선을 띠는 한 편, facebook과 같은 데일리 데이터는 노이즈 값의 영향을 많이 받는 것으로 보인다.
시계열 종류
1. 추세변동
•
시계열의 장기간에 걸친 점진적이고 지속적인 변화 상태를 나타낸 것을 의미
•
시간의 흐름에 따른 시계열자료들의 상승경향이나 하강경향의 상태를 의미
2. 계절변동
•
관측된 시계열 자료들을 일 년 단위 혹은 더 짧은 기간의 주기로 기록했을 때 기후 등과 같은 자연의 조건, 사회적 관습, 혹은 제도 등의 영향을 받아서 계절적인 차이를 나타내는 것
•
시계열 자료에서 주기적인 패턴을 갖고 반복적으로 나타나는 주기변동
•
보통 분기별, 월별 자료에서 나타남
3. 순환변동
•
경기변동이라고도 함
•
수년간의 간격을 두고 상승과 하락이 주기적으로 나타나는 변동으로 의미
•
기후조건, 사회적 관습 등과 같은 계절변동으로 설명되지 않는 장기적인 주기변동
•
순환변동을 계절변동과 혼동할 수 있겠지만, 계절변동으로 설명되지 않는 장기적인 변동을 주기 변동을 뜻한다.
4. 불규칙 변동
•
사전적으로 예상할 수 없는 특수한 사건에 의해 야기 되는 변동 (지진, 전쟁, 홍수, 파업)
•
명확히 설명될 수 없는 요인에 의해 발생되는 우연변동 (시계열 데이터가 랜덤한 것인지를 확인할 필요가 있음)