RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      시계열 데이터 변환을 활용한 XAI기반 신용위험예측 모델 연구 = A Study on Credit Risk Predicting base on XAI using Transformation of Time Series Data

      한글로보기

      https://www.riss.kr/link?id=T16962646

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 있으며, 수집되는 정보는 다양한 요인들로 인해 빠르게 변화되어 예측이 어려운 자료들이 대부분이다. AI 기술 발달로 뛰어난 분석모델들이 등장하고 있지만, 모델의 단편적인 구성만으로는 정확한 예측을 하기 쉽지 않다. 예측결과에 대한 근거도 부족한 게 현실이다. 여러 관련 연구들을 고찰하면서 신용위험의 정확한 예측은 물론, 외부 환경적인 요소를 감안한 연구의 필요성도 높아가고 있음을 인지하게 되었다. 이에 다음과 같은 연구목적을 설정하였다. 첫째 복잡한 금융데이터를 효율적으로 처리할 수 있는 모형의 설계 및 성능의 검증이다. 둘째 금융데이터 시계열 요소를 도출하여 시계열 분석의 효율성 검증이다. 셋째 연구모형에서 설계된 분석모델들의 예측과정에 대한 해석제공이다.
      본 논문에서는 P2P 대출회사 렌딩클럽 개인대출 데이터를 기반으로 채무불이행 여부를 예측하였다. 분류모델 성능향상을 위한 표준화, 전처리, 교차검증을 진행하였고, 데이터의 이미지 변환, 시계열 변환을 통해 유형별 모델학습을 진행하였다. 총 11개 분류모델의 성능을 비교하여 해석제공을 위한 유형별 기본 모델을 설정하였고, 예측결과 해석을 비교 검토하였다.
      본 연구의 분석방법론이 대외적 환경과 제도적 제약을 고려한 금융 위험예측 프레임워크 기반이 되어 향후 금융, 빅데이터, AI 관련한 도움이 되길 기대한다.
      번역하기

      21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 ...

      21세기 디지털 시대는 빅데이터와 인터넷 금융분야에서 많은 발전을 이루었다. 새롭게 등장한 금융 비즈니스는 다양한 환경에서 접하게 되는 정보를 바탕으로 신속한 의사결정을 요구하고 있으며, 수집되는 정보는 다양한 요인들로 인해 빠르게 변화되어 예측이 어려운 자료들이 대부분이다. AI 기술 발달로 뛰어난 분석모델들이 등장하고 있지만, 모델의 단편적인 구성만으로는 정확한 예측을 하기 쉽지 않다. 예측결과에 대한 근거도 부족한 게 현실이다. 여러 관련 연구들을 고찰하면서 신용위험의 정확한 예측은 물론, 외부 환경적인 요소를 감안한 연구의 필요성도 높아가고 있음을 인지하게 되었다. 이에 다음과 같은 연구목적을 설정하였다. 첫째 복잡한 금융데이터를 효율적으로 처리할 수 있는 모형의 설계 및 성능의 검증이다. 둘째 금융데이터 시계열 요소를 도출하여 시계열 분석의 효율성 검증이다. 셋째 연구모형에서 설계된 분석모델들의 예측과정에 대한 해석제공이다.
      본 논문에서는 P2P 대출회사 렌딩클럽 개인대출 데이터를 기반으로 채무불이행 여부를 예측하였다. 분류모델 성능향상을 위한 표준화, 전처리, 교차검증을 진행하였고, 데이터의 이미지 변환, 시계열 변환을 통해 유형별 모델학습을 진행하였다. 총 11개 분류모델의 성능을 비교하여 해석제공을 위한 유형별 기본 모델을 설정하였고, 예측결과 해석을 비교 검토하였다.
      본 연구의 분석방법론이 대외적 환경과 제도적 제약을 고려한 금융 위험예측 프레임워크 기반이 되어 향후 금융, 빅데이터, AI 관련한 도움이 되길 기대한다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environments, with much of the collected data being difficult to predict due to various factors. Despite the development of advanced analytical models through AI technology, accurate predictions are not easily achieved with the models' fragmented structures alone. The reality is that there is a lack of evidence for prediction results. As we reviewed various related studies, it became apparent that there is an increasing need not only for accurate credit risk prediction but also for studies that consider external environmental factors. With this
      in mind, the following research objectives were set: Firstly, to design and verify the performance of a model that can efficiently process complex financial data. Secondly, to derive the time-series elements of financial data and verify the efficiency of time-series analysis. Thirdly, to provide interpretation for the prediction
      process of the analytical models designed in this framework.
      In this paper, we predicted the default status of individual loans based on the data from the P2P lending company, LendingClub. We conducted standardization, preprocessing, and cross-validation to improve the performance of classification models. By transforming the data into images and time series, we proceeded with
      type-specific model training. We compared the performance of the 11 classification models, established basic models for interpretation, and reviewed and compared the interpretations of prediction results.
      The analytical methodology of this study serves as a financial risk prediction framework that considers external environmental and institutional constraints, and it is hoped that it will be beneficial for future endeavors in finance, big data, and AI-related fields.
      번역하기

      The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environme...

      The technologies in the fields of big data and internet finance have seen substantial advancements in the digital era of the 21st century. Emerging financial businesses demand rapid decision-making based on information encountered in various environments, with much of the collected data being difficult to predict due to various factors. Despite the development of advanced analytical models through AI technology, accurate predictions are not easily achieved with the models' fragmented structures alone. The reality is that there is a lack of evidence for prediction results. As we reviewed various related studies, it became apparent that there is an increasing need not only for accurate credit risk prediction but also for studies that consider external environmental factors. With this
      in mind, the following research objectives were set: Firstly, to design and verify the performance of a model that can efficiently process complex financial data. Secondly, to derive the time-series elements of financial data and verify the efficiency of time-series analysis. Thirdly, to provide interpretation for the prediction
      process of the analytical models designed in this framework.
      In this paper, we predicted the default status of individual loans based on the data from the P2P lending company, LendingClub. We conducted standardization, preprocessing, and cross-validation to improve the performance of classification models. By transforming the data into images and time series, we proceeded with
      type-specific model training. We compared the performance of the 11 classification models, established basic models for interpretation, and reviewed and compared the interpretations of prediction results.
      The analytical methodology of this study serves as a financial risk prediction framework that considers external environmental and institutional constraints, and it is hoped that it will be beneficial for future endeavors in finance, big data, and AI-related fields.

      더보기

      목차 (Table of Contents)

      • Ⅰ. 서론 1
      • 1. 연구의 배경 및 목적 1
      • 1.1 연구의 배경 1
      • 1.2 연구의 목적 7
      • 2. 논문 구성 9
      • Ⅰ. 서론 1
      • 1. 연구의 배경 및 목적 1
      • 1.1 연구의 배경 1
      • 1.2 연구의 목적 7
      • 2. 논문 구성 9
      • Ⅱ. 이론적 배경 10
      • 1. 관련 연구 10
      • 1.1 신용위험예측의 발전 10
      • 1.2 신용위험예측의 새로운 접근 12
      • 1.3 신용위험예측의 해석가능성 14
      • 2. 인공지능 알고리즘 16
      • 2.1 로지스틱 회귀 16
      • 2.2 랜덤포레스트 17
      • 2.3 XGBoost 17
      • 2.4 인공신경망 18
      • 2.5 합성곱 신경망 19
      • 2.6 LSTM 20
      • 2.7 Bidrectional LSTM 21
      • 2.8 XAI 22
      • 3. 분석 방법 26
      • 3.1 데이터 변환 26
      • 3.2 데이터 샘플링 28
      • 3.3 데이터 교차검증 28
      • 3.4 변수 선택 30
      • Ⅲ. XAI기반 신용위험예측 모델 32
      • 1. 연구모형 설계 32
      • 2. 분석모델 및 평가방법 33
      • 2.1 분석모델 33
      • 2.2 평가방법 34
      • 3. XAI 설계 36
      • 4. 연구 절차 37
      • Ⅳ. 실험 및 연구 결과 38
      • 1. 데이터 38
      • 1.1 데이터 수집 38
      • 1.2 데이터 전처리 39
      • 1.3 데이터 변환 43
      • 1.4 시계열 분석준비 44
      • 2. 모델 학습 45
      • 2.1 데이터 준비 45
      • 2.2 교차검증 46
      • 2.3 하이퍼파라미터 46
      • 2.4 구현 모델 48
      • 3. 결과 분석 56
      • 3.1 일반 예측모델 성능비교 56
      • 3.2 시계열 예측모델 성능비교 57
      • 3.3 일반 예측모델과 시계열 예측모델 비교 59
      • 3.4 예측모델 해석력 비교 60
      • Ⅴ. 결론 69
      • 1. 연구 결과 69
      • 2. 향후 과제 70
      • 요약 71
      • ABSTRACT 72
      • REFERENCES 74
      • 감사의 글 85
      더보기

      참고문헌 (Reference)

      1. Visualizing data using t-SNE, L. Van der Maaten, G. Hinton, 9(11), , 2008

      2. Feature selection with the Boruta package, M. B. Kursa, W. R. Rudnicki, 36:1-13, , 2010

      3. Platform competition in two-sided markets, J. C. Rochet, J. Tirole, 1(4):990-1029, , 2003

      4. Online peer-to-peer lending-a literature review, M. Lehmann, P. Tiburtius, B. Funk, M. Hilker, F. Kock, D. Buerckner, A. Becker, A. Bachmann, 16(2): 1, , 2011

      5. An introduction to variable and feature selection, I. Guyon, A. Elisseeff, 1157-1182, , 2003

      6. Financial credit risk assessment: a recent review, A. Chen, B. Ribeiro, N. Chen, 45:1-23, , 2016

      7. Best classification algorithms in peer-to-peer lending, M. Polena, P. Teply, 51:100904, , 2020

      8. Credit rationing in markets with imperfect information, J. E. Stiglitz, A. Weiss, 71(3):393-410, , 1981

      9. Fuzzy support vector machine for bankruptcy prediction, K. De, A. Chaudhuri, 11(2):2472-2486, , 2011

      10. Big Data: Deep Learning for financial sentiment analysis, A. Pomeranets, S. Sohangir, D. Wang, T. M. Khoshgoftaar, 5(1):1-25, , 2018

      1. Visualizing data using t-SNE, L. Van der Maaten, G. Hinton, 9(11), , 2008

      2. Feature selection with the Boruta package, M. B. Kursa, W. R. Rudnicki, 36:1-13, , 2010

      3. Platform competition in two-sided markets, J. C. Rochet, J. Tirole, 1(4):990-1029, , 2003

      4. Online peer-to-peer lending-a literature review, M. Lehmann, P. Tiburtius, B. Funk, M. Hilker, F. Kock, D. Buerckner, A. Becker, A. Bachmann, 16(2): 1, , 2011

      5. An introduction to variable and feature selection, I. Guyon, A. Elisseeff, 1157-1182, , 2003

      6. Financial credit risk assessment: a recent review, A. Chen, B. Ribeiro, N. Chen, 45:1-23, , 2016

      7. Best classification algorithms in peer-to-peer lending, M. Polena, P. Teply, 51:100904, , 2020

      8. Credit rationing in markets with imperfect information, J. E. Stiglitz, A. Weiss, 71(3):393-410, , 1981

      9. Fuzzy support vector machine for bankruptcy prediction, K. De, A. Chaudhuri, 11(2):2472-2486, , 2011

      10. Big Data: Deep Learning for financial sentiment analysis, A. Pomeranets, S. Sohangir, D. Wang, T. M. Khoshgoftaar, 5(1):1-25, , 2018

      11. Backpropagation applied to handwritten zip code recognition, D. Henderson, L. D. Jackel, W. Hubbard, Y. LeCun, J. S. Denker, B. Boser, R. E. Howard, 1(4):541-551, , 1989

      12. Corporate bankruptcy prediction: a high dimensional analysis, S. Jones, 22:1366-1422, , 2017

      13. Financial ratios and the probabilistic prediction of bankruptcy, J. A. Ohlson, 18(1):109-131, , 1980

      14. On the rise of fintechs: Credit scoring using digital footprints, M. Puri, T. Berg, A. Gombović, V. Burg, 33(7):2845-2897, , 2020

      15. Bankruptcy prediction using partial least squares logistic regression, S. B. Jabeur, 36:197-202, , 2017

      16. Predictably unequal? The effects of machine learning on credit markets, P. Goldsmith Pinkham, A. Fuster, T. Ramadorai, A. Walther, 77(1):5-47, , 2022

      17. Linear discriminant analysis for the small sample size problem: an overview, K. K. Paliwal, A. Sharma, 6:443-454, , 2015

      18. A comparative performance assessment of ensemble learning for credit scoring, Y. Li, W. Chen, 8(10):1756, , 2020

      19. Instance-based credit risk assessment for investment decisions in P2P lending, C. Luo, Y. Guo, H. Xiong, W. Zhou, C. Liu, 249(2):417-426, , 2016

      20. Loan default prediction of Chinese P2P market: a machine learning methodology, Z. Lu, Y. Xie, J. Xu, 11(1):18759, , 2021

      21. CNN-LSTM neural network model for quantitative strategy analysis in stock markets, C. Zhang, S. Liu, J. Ma, Neural Information Processing: 24th International Conference, ICONIP 2017, Part II 24 :198-206, , 2017

      22. An ensemble of LSTM neural networks for high frequency stock market classification, S. Borovkova, I. Tsiamas, 38(6):600-619, , 2019

      23. Converting tabular data into images for deep learning with convolutional neural networks, J. H. Doroshow, F. Xia, M. Shukla, Y. Zhu, T. Brettin, R. L. Stevens, Y. A. Evrard, H. Yoo, A. Partin, 11(1):11325,, , 2021

      24. Two-stage rule extraction method based on tree ensemble model for interpretable loan evaluation, G. Yang, X. Ye, L. A. Dong, 573:46-64, , 2021

      25. Internet Financial Credit Risk Assessment with Sliding Window and Attention Mechanism LSTM Model, R. Liu, Y. Zhang, M. Lu, M. Li, Z. Zhang, X. Zhou, X. Jia, 30(1):1-7, 2023, , 2023

      26. LSTM-based deep learning for time series forecasting: The case of corporate credit score prediction, H. S. Lee, S. Oh, 29(1):241-265, , 2020

      27. The image classification method with CNN-XGBoost model based on adaptive particle swarm optimization, C. Qin, X. Hao, W. Jiao, 12(4):156, , 2021

      28. Ensemble of diverse deep neural networks with pseudo-labels for repayment prediction in social lending, J. Y. Kim, S. B. Cho, 105(3):00368504221124004, , 2022

      29. Evaluating borrower’s default risk in peer-to-peer lending: evidence from a lending platform in China, X. Li, Z. Zheng, X. Lin, 49(35):3538-3545, , 2017

      30. Stock price forecasting model based on modified convolution neural network and financial time series analysis, J. Cao, J. Wang, 32(12):e3987, , 2019

      31. DeepInsight: A methodology to transform a non-image data to an image for convolution neural network architecture, D. Shigemizu, A. Sharma, K. A. Boroevich, T. Tsunoda, E. Vans, 9(1):11399, , 2019

      32. Representation of features as images with neighborhood dependencies for compatibility with convolutional neural networks, R. Pal, S. R. Dhruba, S. Ghosh, R. Rahman, O. Bazgir, R. Zhang, 11(1):4391, , 2020

      33. Deep learning meets decision trees: An application of a heterogeneous deep forest approach in credit scoring for online consumer lending, X. Guo, X. Chen, Y. Xia, L. He, Y. Li, 41(8):1669-1690, , 2022

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼