Thumbnail_20240429_1.png

알아두면 쓸데많은 전망모형 개발 비법

등록일
2024.04.29
조회수
28849
키워드
전망모형 개발
담당부서
디지털혁신실 디지털신기술팀
저자
이창훈 과장

베이조스의 인사이트


 아마존닷컴의 창업자 제프 베이조스(Jeff Bezos)는 2012년 대담에서 “향후 10년 동안 어떤 것들이 변하게 될까?”란 질문에 대해 앞으로 달라질 것보다 10년 후에도 변하지 않는 것을 아는 것이 미래 비즈니스 전략 수립의 본질임을 강조하였다. 소비자는 항상 낮은 가격, 빠른 배송, 다양한 선택권을 원하고, 이처럼 변하지 않는 것을 기준으로 전략을 수립하는 것이 미래의 알 수 없는 변화를 예측하는 것보다 중요하다는 것이다.

 중앙은행의 주요 기능 중 하나인 거시경제변수 전망에 베이조스의 인사이트를 단순 대입해본다면, 그 본질은 미래에 어떤 일이 일어날지 맞추는 것이 아니라 데이터로부터 쉽사리 변하지 않는 경제·금융변수 간 관계를 찾아내는 것이라 할 수 있다.

 우리가 뉴스나 통계 포털에서 보는 경제·금융변수에는 다른 수많은 변수와 서로 영향을 주고받으면서 형성된 복잡한 관계들이 반영되어 있다. 이러한 관계들은 크게 볼 때, 변하지 않는 부분과 변하는 부분으로 구분된다. 변하지 않는 부분이란 단순한 예로 국제유가가 상승하면 인플레이션이 상승하는 것과 같은 일반적인 관계를 의미하며, 변하는 부분은 국제유가가 상승했음에도 따뜻한 겨울 날씨로 인한 난방 수요 감소로 인플레이션이 상승하지 않는 것과 같은 경우를 말한다. 언제 태풍이 올지, 어디서 전쟁이 발발할지 예측하는 것은 어찌 보면 예언가의 영역이라고 할 수 있다. 경제전망이 쉽지 않은 것은 글로벌 경제 여건 변화, 전쟁과 같은 지정학적 리스크, 자연재해 등의 노이즈가 변수 간 관계를 교란하기 때문이다. 전망담당자는 이러한 노이즈 속에서 미래에도 잘 변하지 않는 패턴을 찾아내는 데 집중해야 한다.


전망모형에 대한 오해


 몸이 아파지면 과거 비슷한 통증이 얼마나 지속되었는지를 기준으로 병원 진료를 결정하듯 사람들은 과거 경험을 토대로 앞으로 일어날 일을 예상하고 행동한다. 만약 통증이 큰 병으로 이어질 수 있는 신호인데, 최근 한 두번 경험에만 의존해 병원에 가지 않으면 더 큰 병을 키울 수 있다.

 전망모형은 결국 과거 데이터에 기반해 관심 변수 간의 관계를 체계적으로 정리한 것이다. 그리고, 사람들은 과거 데이터를 잘 설명하는 전망모형이 앞으로도 좋은 예측력을 보일 것으로 기대한다. 하지만 전망모형이 과거 데이터에 드러난 변수 간 관계를 완벽하게 설명한다는 것은 변하지 않는 패턴뿐 아니라 과거 특정 기간에만 해당되는 노이즈까지 학습했다는 것을 의미한다. 이러한 현상을 과적합(over-fitting)이라고 하며, 과적합된 전망모형은 비전문가가 만든 아주 단순한 모형보다도 더 크게 틀릴 수 있다.

 과적합의 한 예로 코로나19 팬데믹 이후 인플레이션이 빠르게 상승하던 시기를 들 수 있다. 당시 미 연준을 포함한 대부분 중앙은행은 인플레이션 흐름을 실제보다 지속적으로 낮게 전망하였으며, 인플레이션이 빠르게 본래 수준으로 돌아올 것으로 기대하였다. 전통적인 전망모형은 일반적으로 팬데믹과 같은 노이즈(충격)가 발생하면 경제변수가 크게 상승 또는 하락하였다가 다시 평균 수준으로 돌아오는 것으로 가정한다. 실제 미국 인플레이션은 2009년 이후 여러 해에 걸쳐 1% 내외의 낮은 수준을 유지하였다. 만약 전망모형이 이 시기 데이터에 과적합되었다면 팬데믹 영향을 과소평가하고 인플레이션이 이전과 같은 수준으로 빠르게 하락할 것이라고 전망할 것이다.


변하지 않는 관계를 잘 찾는 전망모형


 과적합 함정에 빠지지 않으면서 변수 간 변하지 않는 관계를 잘 찾아내는 전망모형은 어떻게 만들 수 있을까? 최근 정보기술 발전과 함께 다양한 분야에서 빠르게 확산되고 있는 AI/ML 알고리즘 및 빅데이터에서 일부 해답을 찾을 수 있다. AI/ML 알고리즘은 변수 간 관계에 대한 특별한 이론적 가정 없이 최소 수십에서 수만 개에 달하는 파라미터를 이용하여 데이터에 내재한 패턴을 찾아내는데 특화되어 있다. 또한 앞서 설명했듯이 현실에서 관찰되는 경제변수는 다른 수많은 변수와 서로 영향을 주고 받으며 변화한다. 그렇기 때문에 전망모형을 개발할 때도 가능한 많은 변수, 즉 빅데이터를 활용하는 것이 효과적이다.

 물론, AI/ML 알고리즘만으로 과적합 문제가 해결되는 것은 아니다. 경제학계에서는 아직 생소하지만, AI/ML을 적극 활용하는 데이터 사이언스 분야에서는 전망모형이 미래에도 잘 작동할지 가늠해봄으로써 과적합을 피하는 다양한 모형 검증(model validation) 기법이 발전해왔다. 타임머신이 있는 것도 아닌데 전망모형이 미래에 잘 작동할지 어떻게 알 수 있을까? 원리는 간단하다. 데이터를 A 그룹과 B 그룹으로 나누어 A 그룹 데이터만 이용해 모형을 학습시키고, 그 모형이 B 그룹 데이터를 잘 예측하는지 평가하는 것이다. 물론, 모형 학습과 평가에 필요한 데이터가 충분치 않은 경우 분석 목적과 데이터 특징을 고려하여 최대한 효율적으로 활용하려는 고민이 필요하며, 데이터 크기가 지나치게 작거나 데이터 내 노이즈 비중이 너무 큰 경우에는 어떻게 전망모형을 만들더라도 좋은 예측력을 기대하기 힘들다.

 한편, 전망모형을 누가, 어떻게 활용할 것인지도 모형 개발 과정에서 간과해서는 안될 부분이다. 전망은 결국 사람이 하는 것인데, 수시로 입수되는 정보를 전망에 어떻게 반영하고 판단해야 할지에 대한 가이드나 기준이 없어 난감한 경우가 많다. 이런 상황에서 실시간 전망 프로세스와 전망결과 시각화 도구는 새롭게 입수된 정보를 반영하여 전망을 업데이트함과 동시에 그 정보가 업데이트에 어떤 영향을 미쳤는지 이해하는데 도움이 될 수 있다. 이러한 시각화 도구를 이용하여 전망담당자는 실시간으로 업데이트되는 데이터와 뉴스 등의 정보를 의사결정에 활용할 수 있다.


실시간 인플레이션 전망


 최근 발표된 BOK이슈노트는 변수 간 변하지 않는 패턴을 찾아내고, 수시로 입수되는 데이터를 효과적으로 활용하기 위해 AI/ML 알고리즘, 빅데이터, 실시간 전망 프로세스를 인플레이션(전년동월대비 소비자물가지수 상승률) 전망모형 개발에 적용하였다. 엄밀한 검증을 거쳐 최종 선별된 ML 알고리즘은 최대 298개 경제·금융변수를 학습하였으며, 매주 금요일마다 새롭게 입수되는 데이터와 실시간 전망 프로세스를 통해 당월(nowcasting), 3개월 후, 1년 후 인플레이션을 전망한다.

 아래 그림은 2023년 11월에 수행한 실시간 인플레이션 전망결과이다. 2023년 7월 2.4%까지 하락한 인플레이션은 이후 유가 및 농산물가격 상승으로 반등하여 10월 3.8%까지 상승하였다. 시장에서는 이 흐름이 11월까지 이어질 것으로 예상하였다. 그러나, 아래 그림 당월 전망(가장 왼쪽)에 나타나듯, 인플레이션은 11월 초부터 3.5% 수준으로 하락할 것으로 전망되었으며, 넷째 주(11월 17일)에는 아파트실거래가격지수 하락 영향이 반영되어 전망치가 더욱 하락하는 모습을 보였다. 이후 실제 공표된 11월 인플레이션은 전월(3.8%)에 비해 0.5%p 하락한 3.3%였다.[1]

그림. 2023년 11월 실시간 전망결과



쓸만한 전망모형


 통계학자 조지 박스(George E. P. Box, 1919 ~ 2013)는 “모든 모형은 틀렸다. 하지만, 그 중에 어떤 모형은 쓸만하다(all models are wrong, but some are useful).”고 하였다.[2] 경제·금융·사회적 요인이 복잡하게 얽혀 변화하는 현실경제를 하나의 전망모형에 온전히 담아낸다는 건 불가능한 일이다. 이 글에서 소개한 인플레이션 전망모형 또한 보다 쓸만한 모형을 만들기 위한 수많은 시도 중 하나이며, 앞으로도 전망결과를 검증하고 기술적으로 개선해 나갈 필요가 있다. 다만, 동 모형은 쉽게 변하지 않는 변수 간 관계를 찾아낸다는 전망의 본질에 집중하였으며, 빅데이터, AI/ML 알고리즘, 실시간 전망 등 새로운 방법을 활용한 데 의의가 있다고 할 수 있다.

 최근 AI/ML 기술 발전과 함께, 데이터 분석 인프라가 빠르게 변화하고 있다. 경제학계와 각국 중앙은행은 AI/ML 알고리즘, 빅데이터, ChatGPT와 같은 거대언어모형(LLM)을 경제·금융변수 전망에 활용하기 위한 연구를 진행 중이다. AI/ML은 전망뿐 아니라 텍스트 데이터 분석을 통해서도 경제·금융현상 분석에 기여할 수 있다. 한국은행은 GDP성장률, 인플레이션 등 거시경제변수와 금리, 환율 등 금융변수 전망에 AI/ML 알고리즘 활용방안을 연구하고 있으며, AI 언어모형을 이용한 경제분석 도구 개발에도 힘쓰고 있다.[3]


[1] 일반적으로 전망모형의 예측력은 예측오차(전망치-실제치)가 얼마나 작은지와 변동 방향을 얼마나 높은 비율로 맞추었는지를 기준으로 평가한다. 2016년 1월부터 2023년 9월까지 기간 중 전망모형의 평균 예측오차(Mean Absolute Error, 이하 당월 전망 기준)는 0.27%p 수준이었으며, 같은 기간 변동 방향을 맞춘 비율(Mean Directional Accuracy)는 70% 정도이다. 참고로 모형이 운영된 2023년 10월부터 2024년 3월까지 예측오차는 0.2%p 이내이며, 변동 방향은 모두 맞추었다.

[2] Box, G.E.P. and Draper, N.R. (1987), Empirical Model-Building and Response Surfaces, Wiley.

[3] 이현창·최동규·김용건·허정 (2022), 디지털 신기술을 이용한 실시간 당분기 경제전망 시스템 개발, BOK 이슈노트 제2022-7호. 

한승욱·김태완·이현창 (2022), 인공지능 언어모형을 이용한 인플레이션 어조지수 개발 및 시사점, BOK 이슈노트 제2022-38호.

이민영 (2023), 고빈도 실시간 데이터를 이용한 국고채 시장의 market dysfunction 모니터링, BOK 이슈노트 제2023-34호. 

김태완·박정희·이현창 (2024), 데이터 기반 금융·외환 조기경보모형, BOK 이슈노트 제2024-11호.

유용한 정보가 되었나요?

내가 본 콘텐츠