[제2022-18호] 뉴스 텍스트를 이용한 경기 예측: 경제 부문별 텍스트 지표의 작성과 활용

구분
경제일반
등록일
2022.05.16
조회수
4775
키워드
뉴스 텍스트 경제지표 경기 예측 빅데이터 텍스트 마이닝 BOK 이슈노트
등록자
서범석
담당부서
통계연구반(02-759-5253)

최근 코로나19, 우크라이나 사태 등 경제불확실성이 높아짐에 따라 신속한 경기 판단을 위한 다양한 데이터의 활용이 더욱 중요해지고 있다. 특히 뉴스 텍스트 데이터는 다양(variety)하고 방대(volume)한 정보를 신속히(velocity) 전달한다는 점에서, 경기 예측을 위한 새로운 빅데이터로 주목받고 있다.


본 논고는 뉴스 텍스트를 정량화하여 경제지표로 작성하는 새로운 텍스트 마이닝 방법론을 제시하였다. 이를 위해 2005년 이후 연간 약 100만 건(문장기준 1800만 문장)의 경제뉴스를 분석하여, 생산, 물가, 고용, 주가, 주택가격 등 경제적으로 관심이 높은 15개 부문의 뉴스 텍스트 기반 경제지표를 작성하였다.


작성한 텍스트 지표는 대부분 관련 공식 통계와 높은 상관관계를 보이며, 공식 통계 대비 0~9개월 선행하는 것으로 나타났다. 이는 뉴스 텍스트 기반 경제지표가 경기 예측을 위한 중요한 정보를 내포하고 있음을 보여준다.

 
뉴스 텍스트 기반 경제지표를 이용하여 경기 예측모형을 구축한 결과, 텍스트 지표를 예측모형에 반영할 경우 분기 GDP에 대한 예측 정확도가 유의미하게 높아지는 것을 확인하였다. 본 논고는 텍스트 지표의 특성을 반영할 수 있도록, 동적인자모형(Dynamic Factor Model, DFM) 기반의 선형모형과 인공신경망모형(Convolutional Recurrent Neural Network, CRNN) 기반의 비선형모형을 비교하여, 텍스트 지표 활용에 적합한 새로운 예측모형을 도출하였다. 새롭게 구축한 DFM 기반 경기 예측모형은 공식 통계가 발표되지 않은 상황에서도 텍스트 지표를 이용하여 GDP, CPI 63개 경제변수를 월별로 동시에 예측할 수 있도록 설계되었다.


뉴스 텍스트에는 다양한 전문가의 견해·전망 등 정성적 정보가 포함되어 있으므로, 이를 종합하고 정량화하여 경기 예측에 활용할 필요가 있다. 이러한 뉴스 텍스트의 정량적 활용은 신속하고 정확한 경기동향 파악 및 경기 예측에 유용하며, 정성적 방법으로 뉴스를 이용하는 것에 비해 휴먼 에러를 줄이는 데도 기여할 것으로 기대된다.

유용한 정보가 되었나요?

담당부서
커뮤니케이션국 디지털미디어기획팀
전화번호
02-759-5393

내가 본 콘텐츠