[제2023-10호] Econometric Forecasting Using Ubiquitous News Text: Text-enhanced Factor Model

등록일
2023.06.02
조회수
10610
키워드
dynamic factor model text mining machine learning economic forecasting nowcasting
등록자
서범석
담당부서
거시모형팀(02-759-4248)

제목 : 보편적 뉴스 텍스트를 이용한 계량적 경제전망: 텍스트 강화 인자모형

저자 : 서범석(경제모형실 거시모형팀)


<요약>


뉴스 텍스트를 경제 예측에 활용하고자 하는 연구들이 주목받고 있다. 본 논문은 학습 데이터 없이 경제 부문별 서술형 정보를 효과적으로 정량화하여 경제예측에 활용하는 방법을 검토하였다. 본 논문은 경제 도메인별로 나타나는 주어-술어 패턴을 이용하여 ’테마별 빈도 지수(Theme Frequency Index, TFI)’를 추정하고 이를 통해 경제에 대한 대중의 인식을 측정하였다. 구체적으로 생산, 인플레이션, 고용, 자본 투자, 주식, 주택 가격 등 15개 부문의 TFI를 제시하고 은닉인자 구조에 기반한 ’텍스트 강화 인자모형 (Text-enhanced Factor Model, TFM)’을 구축하여 서술형 정보를 경제 예측에 반영하였다. 약 1천8백만 건의 뉴스기사를 바탕으로 한 실증분석 결과 TFM은 단기 GDP 예측 정확도를 향상시키는 것으로 나타나며, 이는 도메인 지식을 반영한 텍스트 마이닝 기술이 학습 비용 없이도 정성적 정보를 효과적으로 처리할 수 있음을 보여준다. 본 논문에서 제시한 방법론은 신속하고 효율적이며, 서술형 정보를 이용하기 위한 다양한 경제 부문에서 활용이 가능할 것으로 기대된다.



The use of news text as a novel source for econometric forecasting is gaining increasing attention. This paper revisited the way of incorporating narrative information into econometric forecasting by effectively quantifying sector-specific textual information without requiring training data. We exploit Theme Frequency Indices(TFI) utilizing domain-specific subject-predicate patterns to gauge public perception of the economy. TFIs of 15 sectors, including production, inflation, employment, capital investment, stock and house prices, and others, were examined and integrated into Text-enhanced Factor Model(TFM) using latent factor structures. Empirical analysis, based on over 18 million news articles in Korea, reveals that TFM improves the accuracy of near-term GDP forecasts, demonstrating simple text-mining techniques along with domain knowledge are capable of leveraging qualitative information from news without costly training. The proposed method is applicable to a wide range of subjects for measuring narrative information of the economy, offering a rapid and cost-effective approach.


유용한 정보가 되었나요?

내가 본 콘텐츠