지금까지 금융기관의 신용위험관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용등급 예측 문제를 해결하...

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=G3746982
-
2015년
Korean
한국연구재단(NRF)
0
상세조회0
다운로드지금까지 금융기관의 신용위험관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용등급 예측 문제를 해결하...
지금까지 금융기관의 신용위험관리를 효과적이고 효율적으로 수행하기 위한 지능형 기술에 대한 연구가 활발하게 이루어져 왔다. 특히 기업의 부실 예측이나 신용등급 예측 문제를 해결하는데 있어, 다양한 기계학습 분류 알고리즘들이 제안되고 적용되어 왔는데, 이들은 효과적인 입력변수 선정에 대한 해답을 제공해 주지 못하고, 과적합 및 잡음·이상치에 취약할 수 있는 위험이 있으며, 각종 모수에 대한 조정 작업이 요구되는 한계점이 있었다.
이러한 기존 기법들의 한계를 극복하기 위한 대안으로 본 연구는 랜덤 포레스트(Random Forests, 이하 RF)의 응용을 제안한다. 미국의 통계학자 Leo Breiman에 의해 제안된 랜덤 포레스트는 배깅(bagging)과 무작위 입력 변수 선택(random input selection)을 통해 단일 의사결정 나무를 다수의 의사결정 나무로 확장시킨 기계학습 기법이다. 랜덤 포레스트는 과적합에서 자유로우며, 잡음이나 이상치에 받는 영향이 적고, 높은 정확도를 얻을 수 있는 특징을 지닌다.
이러한 RF가 실제로 기업신용위험 관리에 효과적인지 검증하기 위해, 본 연구에서는 RF를 세 종류의 실제 데이터셋에 적용해 보고 그 성능을 확인해 보고자 하였다. 우선 첫번째 데이터셋은 외감기업을 대상으로 한 부실예측 데이터였고, 두번째 데이터셋은 비외감기업을 대상으로 한 부실예측 데이터였다. 이 두 데이터셋은 이분류 예측에 있어 RF의 성능을 확인해 보고자 활용되었다. 마지막 세번째 데이터셋은 다분류 예측에 있어 RF의 성능을 확인해 보기 위해, 채권등급예측 데이터로 하였다.
실증분석을 수행한 결과, 외감이든 비외감이든 상관없이 부실예측에 있어서 RF는 전통적인 알고리즘인 인공신경망이나 SVM(support vector machines)에 비해 더 뛰어난 예측정확도를 산출하지는 못함을 확인할 수 있었다. 대신 RF가 모형들 가운데서 가장 낮은 부정오류율(부도날 기업을 정상으로 오판하는 비율)을 나타낸다는 점을 확인하였는데, 이는 예측정확도와는 별개로 기회비용 측면에서 RF가 상당히 유용한 기법이 될 수 있음을 우리에게 시사한다. 한편 채권등급예측 문제에 있어서는 RF가 다중판별분석이나 인공신경망, 다분류 SVM과 같은 모든 비교 알고리즘 대비 월등히 우수한 예측정확도를 보임을 확인할 수 있었다. 아울러 그 차이도 99% 신뢰수준 하에서 통계적으로 유의함을 알 수 있었다. 이 같은 본 연구의 결과는 RF가 국내 금융기관들의 기업신용위험 관리에 상당히 유용할 수 있음을 의미하고 있다 하겠다.
다국어 초록 (Multilingual Abstract)
There has been a lot of research on intelligent information processing techniques to effectively and efficiently manage credit risk in the financial industry. To predict corporate credit ratings better, various algorithms of machine learning have been...
There has been a lot of research on intelligent information processing techniques to effectively and efficiently manage credit risk in the financial industry. To predict corporate credit ratings better, various algorithms of machine learning have been proposed and applied. However, the algorithms have some limitations. First of all, they are unable to give a solution for which variables in the dataset should be considered as input variables to effectively predict a dependent variable. Also, they are easily exposed to overfitting and risk being affected by outliers and noise. In addition, they are required to tune their numerous parameters.
Under this background, this study proposes the application of Random Forests(RF) to overcome the weakness of the traditional techniques. RF were designed by Leo Breiman, an American statistician and professor, and are an ensemble learning technique. This algorithm has both features originating from bagging algorithm, which is to extend a single decision tree to various decision trees, and from random input selection. The benefit of our proposed algorithm is free from an overfitting issue, and both noise and outliers in the dataset cannot have an effect on it.
To validate the effectiveness of RF in corporate credit risk management, we applied