RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      랜덤포레스트를 활용한 소상공인 사업 지속가능성 예측모형 개발연구 = Development of Prediction Model for Small Business Sustainability of Business using RandomForest Analysis

      한글로보기

      https://www.riss.kr/link?id=T16045728

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      The purpose of this study is to present a model to predict the sustainability of a small business by using a RandomForest machine learning algorithm, to evaluate the prediction performance of the model, and to identify the characteristics of factors contributing to the prediction. For the empirical analysis, data from the “2019 Small Business Survey” jointly prepared by the Ministry of SMEs and Startups and the National Statistical Office was used.
      For the predictive model, 45 explanatory variables were set for variables that were verified to have an effect on startup preparation, management performance, and sustainability of small business owners in previous studies. As for the predictive performance of the small business sustainability model, the accuracy of correctly classifying the continuous operation of small business owners was 91.06%, and the sensitivity of predicting that small business owners thinking sustainable operation would continue was 95.0%. The precision, which is the probability that the result predicted as a small business owner with a sustainable management idea is correct, is 88.21%, the F1-Score, the harmonic average of sensitivity and precision, is 91.48%, and the ROC-AUC score, which measures the true positive rate to the false positive rate, is 91.02. % was shown. The results of this study can be said to be comparable to or superior to those of social science studies that use random forests to present results.
      The importance of the explanatory variables contributing to the prediction is, in order, sales, start-up motive (because it is likely to have more income), importance of start-up preparation activities (experience in the same industry), total start-up cost, and start-up motive (I want to run a business myself) in that order. As revealed in previous studies, sales are the most important variable used as an indicator of business performance as the factor that has the greatest influence on the sustainability of small businesses.
      As an academic implication of this study, it is relevant that a predictive model composed of a number of explanatory variables was derived from using a machine learning algorithm (RandomForest), which was rarely used in previous studies. Additionally, in most of the previous studies, there were limitations due to the restricted sample composition or the total sample size. It is also meaningful to use a variety of 45 explanatory variables based on the variables verified in previous studies when setting the explanatory variables.
      As a practical implication, it is meaningful in that the importance of 45 explanatory variables can be analyzed to provide a basis for the government or local governments to prepare countermeasures or support systems for the sustainability of small businesses. Start-up preparation is the key to the success of a business, and various consulting on preparation for start-up by the government or local governments will be effective for business sustainability of small businesses so that the preparation for start-up can be made more faithfully.
      As a limitation of the study, this study used the 「2019 Small Business Survey」, but only 14,692 out of 38,169 data were used. There was a limit to the study due to the entire data could not be used for analysis. Since the analysis was performed using only cross-sectional data, which is a one-time data, there is a limit to clearly clarifying the relationship between the project preparation stage and the project operation stage.
      번역하기

      The purpose of this study is to present a model to predict the sustainability of a small business by using a RandomForest machine learning algorithm, to evaluate the prediction performance of the model, and to identify the characteristics of factors c...

      The purpose of this study is to present a model to predict the sustainability of a small business by using a RandomForest machine learning algorithm, to evaluate the prediction performance of the model, and to identify the characteristics of factors contributing to the prediction. For the empirical analysis, data from the “2019 Small Business Survey” jointly prepared by the Ministry of SMEs and Startups and the National Statistical Office was used.
      For the predictive model, 45 explanatory variables were set for variables that were verified to have an effect on startup preparation, management performance, and sustainability of small business owners in previous studies. As for the predictive performance of the small business sustainability model, the accuracy of correctly classifying the continuous operation of small business owners was 91.06%, and the sensitivity of predicting that small business owners thinking sustainable operation would continue was 95.0%. The precision, which is the probability that the result predicted as a small business owner with a sustainable management idea is correct, is 88.21%, the F1-Score, the harmonic average of sensitivity and precision, is 91.48%, and the ROC-AUC score, which measures the true positive rate to the false positive rate, is 91.02. % was shown. The results of this study can be said to be comparable to or superior to those of social science studies that use random forests to present results.
      The importance of the explanatory variables contributing to the prediction is, in order, sales, start-up motive (because it is likely to have more income), importance of start-up preparation activities (experience in the same industry), total start-up cost, and start-up motive (I want to run a business myself) in that order. As revealed in previous studies, sales are the most important variable used as an indicator of business performance as the factor that has the greatest influence on the sustainability of small businesses.
      As an academic implication of this study, it is relevant that a predictive model composed of a number of explanatory variables was derived from using a machine learning algorithm (RandomForest), which was rarely used in previous studies. Additionally, in most of the previous studies, there were limitations due to the restricted sample composition or the total sample size. It is also meaningful to use a variety of 45 explanatory variables based on the variables verified in previous studies when setting the explanatory variables.
      As a practical implication, it is meaningful in that the importance of 45 explanatory variables can be analyzed to provide a basis for the government or local governments to prepare countermeasures or support systems for the sustainability of small businesses. Start-up preparation is the key to the success of a business, and various consulting on preparation for start-up by the government or local governments will be effective for business sustainability of small businesses so that the preparation for start-up can be made more faithfully.
      As a limitation of the study, this study used the 「2019 Small Business Survey」, but only 14,692 out of 38,169 data were used. There was a limit to the study due to the entire data could not be used for analysis. Since the analysis was performed using only cross-sectional data, which is a one-time data, there is a limit to clearly clarifying the relationship between the project preparation stage and the project operation stage.

      더보기

      국문 초록 (Abstract) kakao i 다국어 번역

      본 연구는 랜덤 포레스트 머신러닝 알고리즘을 활용하여 소상공인 사업 지속가능성 여부를 예측하는 모형을 제시하고 모형의 예측 성과를 평가하며, 예측에 기여하는 요인들의 특성을 파악하는 것을 목적으로 한다. 실증분석에는 중소벤처기업부와 통계청이 공동 작성한 「2019년 기준 소상공인 실태조사」데이터를 활용하였으며, 결측치가 없는 데이터를 만들기 위해 2013년~2018년 사이의 신규창업업체 14,692개를 대상으로 선정하였다.
      예측 모형은 선행연구에서 소상공인의 창업준비, 경영성과, 지속가능성 등에 영향을 미치는 것으로 검증된 변수에 대해 45개의 설명변수를 설정하였다. 소상공인 사업 지속가능성 모형의 예측 성과는 소상공인의 지속운영을 옳게 분류한 정확도가 91.06%, 지속운영을 생각하는 소상공인이 지속한다고 예측한 민감도가 95.0%로 나타났다. 지속운영 생각을 가진 소상공인이라고 예측한 결과가 맞을 확률인 정밀도는 88.21%, 민감도와 정밀도의 조화평균인 F1-Score는 91.48% 그리고 거짓 양성비율에 대한 참 양성비율을 측정한 ROC-AUC 점수는 91.02%로 나타났다. 본 연구의 결과는 랜덤포레스트를 활용하여 성과를 제시한 사회과학 연구들에 비견되거나 우수하다고 할 수 있다. 예측에 기여하는 설명변수의 중요도는 순서대로 매출액, 창업동기(수입이더많을것같아서), 창업준비활동중요성(동종업종종사경험), 총창업비용, 창업동기(사업을직접경영하고싶어서) 순이었고 매출액은 소상공인 사업 지속가능성에 가장 많은 영향을 미치는 요인으로 선행연구에서 밝혀진 바와 같이 경영성과의 지표로 사용되는 가장 중요한 변수이다.
      본 연구의 학문적 시사점으로는 선행연구에서 드물게 사용한 머신러닝 알고리즘(랜덤포레스트)을 활용하여 다수의 설명변수로 구성된 예측모형을 도출하였다는 것에 의의가 있다. 그리고 대부분의 선행연구에서는 표본 구성이 지역적으로 한정되거나 전체 표본 규모가 제한되어 한계점이 존재하였으나 본 연구에서는 전국을 대상으로 실시한 「2019년 기준 소상공인 실태조사」를 사용하여 대량의 패널데이터를 사용하였다. 설명변수 설정 시 선행연구에서 검증된 변수에 근거하여 다양한 45개의 설명변수를 사용한 것도 의미가 있다고 볼 수 있다.
      실무적 시사점으로는 45개 설명변수의 중요도를 분석하여 소상공인 사업 지속가능성을 위한 정부나 지자체의 대책마련이나 지원제도에 대한 근거를 마련할 수 있다는 점에서 의미가 있다. 창업준비는 사업의 성공을 판가름하는 열쇠로 창업준비를 좀 더 충실하게 할 수 있도록 정부나 지자체의 창업준비에 대한 다양한 컨설팅이 소상공인 사업 지속가능성에 주효할 것이다.
      연구의 한계점으로 본 연구는 「2019 소상공인 실태조사」를 활용하였으나 38,169개의 데이터 중 14,692개만 사용하였는데, 이는 2013년~2018년 사이의 신규창업 사업체만 응답을 하는 설문문항(창업준비, 창업과정어려움 등)을 사용하기 위함이었으나 전체 데이터를 분석에 활용하지 못한것에 연구의 한계가 있다. 1회성 자료인 횡단면 자료만을 이용하여 분석을 수행하였기 때문에 사업준비단계와 사업운영단계의 관계를 명확히 규명하는데에는 한계가 있다.
      번역하기

      본 연구는 랜덤 포레스트 머신러닝 알고리즘을 활용하여 소상공인 사업 지속가능성 여부를 예측하는 모형을 제시하고 모형의 예측 성과를 평가하며, 예측에 기여하는 요인들의 특성을 파악...

      본 연구는 랜덤 포레스트 머신러닝 알고리즘을 활용하여 소상공인 사업 지속가능성 여부를 예측하는 모형을 제시하고 모형의 예측 성과를 평가하며, 예측에 기여하는 요인들의 특성을 파악하는 것을 목적으로 한다. 실증분석에는 중소벤처기업부와 통계청이 공동 작성한 「2019년 기준 소상공인 실태조사」데이터를 활용하였으며, 결측치가 없는 데이터를 만들기 위해 2013년~2018년 사이의 신규창업업체 14,692개를 대상으로 선정하였다.
      예측 모형은 선행연구에서 소상공인의 창업준비, 경영성과, 지속가능성 등에 영향을 미치는 것으로 검증된 변수에 대해 45개의 설명변수를 설정하였다. 소상공인 사업 지속가능성 모형의 예측 성과는 소상공인의 지속운영을 옳게 분류한 정확도가 91.06%, 지속운영을 생각하는 소상공인이 지속한다고 예측한 민감도가 95.0%로 나타났다. 지속운영 생각을 가진 소상공인이라고 예측한 결과가 맞을 확률인 정밀도는 88.21%, 민감도와 정밀도의 조화평균인 F1-Score는 91.48% 그리고 거짓 양성비율에 대한 참 양성비율을 측정한 ROC-AUC 점수는 91.02%로 나타났다. 본 연구의 결과는 랜덤포레스트를 활용하여 성과를 제시한 사회과학 연구들에 비견되거나 우수하다고 할 수 있다. 예측에 기여하는 설명변수의 중요도는 순서대로 매출액, 창업동기(수입이더많을것같아서), 창업준비활동중요성(동종업종종사경험), 총창업비용, 창업동기(사업을직접경영하고싶어서) 순이었고 매출액은 소상공인 사업 지속가능성에 가장 많은 영향을 미치는 요인으로 선행연구에서 밝혀진 바와 같이 경영성과의 지표로 사용되는 가장 중요한 변수이다.
      본 연구의 학문적 시사점으로는 선행연구에서 드물게 사용한 머신러닝 알고리즘(랜덤포레스트)을 활용하여 다수의 설명변수로 구성된 예측모형을 도출하였다는 것에 의의가 있다. 그리고 대부분의 선행연구에서는 표본 구성이 지역적으로 한정되거나 전체 표본 규모가 제한되어 한계점이 존재하였으나 본 연구에서는 전국을 대상으로 실시한 「2019년 기준 소상공인 실태조사」를 사용하여 대량의 패널데이터를 사용하였다. 설명변수 설정 시 선행연구에서 검증된 변수에 근거하여 다양한 45개의 설명변수를 사용한 것도 의미가 있다고 볼 수 있다.
      실무적 시사점으로는 45개 설명변수의 중요도를 분석하여 소상공인 사업 지속가능성을 위한 정부나 지자체의 대책마련이나 지원제도에 대한 근거를 마련할 수 있다는 점에서 의미가 있다. 창업준비는 사업의 성공을 판가름하는 열쇠로 창업준비를 좀 더 충실하게 할 수 있도록 정부나 지자체의 창업준비에 대한 다양한 컨설팅이 소상공인 사업 지속가능성에 주효할 것이다.
      연구의 한계점으로 본 연구는 「2019 소상공인 실태조사」를 활용하였으나 38,169개의 데이터 중 14,692개만 사용하였는데, 이는 2013년~2018년 사이의 신규창업 사업체만 응답을 하는 설문문항(창업준비, 창업과정어려움 등)을 사용하기 위함이었으나 전체 데이터를 분석에 활용하지 못한것에 연구의 한계가 있다. 1회성 자료인 횡단면 자료만을 이용하여 분석을 수행하였기 때문에 사업준비단계와 사업운영단계의 관계를 명확히 규명하는데에는 한계가 있다.

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼