RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
          펼치기
        • 학술지명
          펼치기
        • 주제분류
          펼치기
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        서포트 벡터 머신을 이용한 탄산염암 저류층에서의 암상 예측

        서광원,임종세 한국자원공학회 2010 한국자원공학회지 Vol.47 No.2

        저류층의 특성변수인 공극률과 유체투과도는 주로 암상의 변화에 의해 결정되며, 물리검층자료로부터 암상을 예측하기 위한 방법으로 경험적인 방법과 추계학적인 방법이 있다. 이 연구에서는 자료 간의 최적 분류 초평면을 결정함으로써 구조적인 위험을 최소화하는 패턴인식 기법인 서포트 벡터 머신을 이용하여 코어 분석 자료와 물리검층자료를 통합적으로 해석함으로써 코어가 취득되지 않은 구간에서의 암상을 예측하였다. 입력 자료로 미국 텍사스 주의 Permian Basin에 위치한 탄산염암 저류층인 Salt Creek Field Unit의 물리검층자료와 코어의 암상 자료를 사용하였으며, 암상 예측 결과를 선형 판별 분석에 의한 암상 예측 결과와 비교하였다. 학습 자료에 대한 교차검증 시 서포트 벡터 머신의 정확도는 평균 98.7%로서 불균질성이 심한 탄산염암 저류층에서도 특징변수에 대한 분류 능력이 우수함을 확인하였다. 예측 결과 5개의 시추공에서 선형 판별 분석의 암상 예측의 정확도는 55.3%이고 서포트 벡터 머신에 의한 암상 예측의 정확도는 평균 67.6%로서 서포트 벡터 머신에 의한 예측이 더 우수함을 확인하였다. 또한 유사한 물리검층 특성을 갖는 암상을 하나의 군집으로 가정하였을 경우에 서포트 벡터 머신이 82.3%의 높은 예측 정확도를 나타내었다. Petrophysical properties such as porosity and permeability are mainly determined by lithofacies variation. There are empirical and stochastic methods to identify lithofacies from well logs. In this study, lithofacies in un-cored ranges are estimated by support vector machine as integrating well log data and core data. Support vector machine is a pattern recognition method minimizing structural risk by optimal separating hyperplane. Well log data and core lithofacies data in carbonate reservoir, Salt Creek Field Unit, Permian basin, Texas, U.S.A., are used as input data. The results of lithofacies estimation by support vector machine are compared with lithofacies estimated by linear discriminant analysis. Average accuracy of cross validation is 98.7% in support vector machine. It is evidence that support vector machine is excellent for classifying characteristic variables in heterogeneous carbonate reservoir. Average accuracy of lithofacies estimation is 67.6% by support vector machine and 55.3% by linear discriminant analysis, respectively. Therefore, it is confirmed that support vector machine is more accurate than linear discriminant analysis. Average accuracy of lithofacies estimation by support vector machine is 82.3% when several lithofacies that have similar characteristics on well log data are assumed as a group.

      • KCI등재

        재무지표에 기초한 횡령 및 배임 위험평가

        백승현 ( Seung Hyun Baek ),김유찬 ( Yoo Chan Kim ) 한국회계학회 2016 회계저널 Vol.25 No.6

        본 연구의 목적은 (1) 회계정보의 횡단면상 혹은 시계열상 비기대 금액을 이용하여 횡령·배임 위험평가에 도움이 될 수 있는 재무지표를 식별하고, (2) 횡령·배임 부정의 예측과 관련하여 로지스틱회귀모형과 서포트벡터머신의 예측정확도를 비교ㆍ평가하는데 있다. 재무제표 상에서 손쉽게 획득 가능한 분석지표를 바탕으로 수행되는 횡령ㆍ배임 위험의 예단은 다양한 이해관계자들의 정보수요를 충족시키는데 도움을 줄 수 있을 것이다. 본 연구의 분석결과를 살펴보면 다음과 같다. 첫째, 네 가지 의사결정영역(즉, 영업관리, 투자관리, 재무전략, 배당정책)에 속한 주요 재무지표들의 전기 비기대 금액은 대부분 당기횡령ㆍ배임과 통계적으로 유의한 관련성을 갖는 것으로 나타났다. 둘째, 로지스틱회귀모형확률변화와 서포트벡터머신 분류초평면 가중치에 관한 분석은 영업관리에 속하는 수익성관련지표들(예; 매출총이익과 영업현금흐름)이 횡령ㆍ배임 위험평가에 보다 유용할 수 있음을 보여주었다. 셋째, 횡령ㆍ배임의 예측과 관련하여, 서포트벡터머신은 로지스틱회귀모형에 비해 유의하게 높은 예측성과를 갖는 것으로 확인되었다. 본 연구의 결과는 재무제표상의 회계정보에 대한 관찰만으로도 횡령ㆍ배임 위험의 예단이 가능할 수 있음을 시사하고 있다. 또한 본 연구의 결과는 회계이슈에 대한 서포트벡터머신의 적용가능성을 시사하고 있다. 서포트벡터머신은 경영 및 의료분야를 비롯하여 그 외의 여러 분야에서 높은 예측정확도를 보여주는 분류모형의 하나로 평가되고 있다. 하지만 지금껏 서포트벡터머신을 이용하여 회계실무에서의 분류 의사결정 문제를 다룬 연구는 많지 않았던 것으로 보인다. 회계실무에 대한 서포트벡터머신의 적용가능성은 향후 회계문헌에 방법론적 차원의 기여를 할 수 있을 것으로 기대된다. The purpose of this paper is (1) to identify financial indicators that can help assess the risk for misappropriation and the breach of trust using the unexpected values of accounting information either in a cross section or in a time series, and (2) to compare and evaluate the performance of logistic regression model and support vector machine in the fraud prediction. The fraud prediction using financial indicators that are readily obtained on the financial statements is expected to help satisfy the information demand of various interested parties. The results show that (1) the unexpected values of key financial indicators in four decision areas (i.e., operating management, investment management, financial strategy, and dividend policies) in the prior period are mostly statistically associated with the fraud detected in the current period, (2) the analysis based on both the probability change of logistic regression model and the hyper-plane weights of support vector machine shows that the profitability-related indicators (e.g., gross profit margins and operating cash flows) are found to be more useful for fraud prediction, and (3) support vector machine significantly outperforms logistic regression model in the prediction accuracy. The results of this paper imply that the risk for misappropriation and breach of trust can be assessed and predicted just simply by observing the accounting information on the financial statements. In addition, the results of this paper also imply the possibility of applying support vector machine to the accounting issues. Support vector machine is believed to be one of classification algorithms with superior prediction accuracy in such areas as business, medicine, and others. However, little research in accounting field applied support vector machine to accounting issues. From the methodological perspective, the discussion of applying support vector machine to accounting issues is able to contribute to accounting literature.

      • KCI등재

        머신 러닝 방법을 이용한 오피스 임대료 산정 -랜덤 포레스트, 인공 신경망, 서포트 벡터 머신 활용을 중심으로-

        정성훈 ( Jeong Sung-hoon ),진창하 ( Jin Changha ) 한국부동산분석학회 2020 不動産學硏究 Vol.26 No.2

        본 연구는 최근 자동 평가 모형과 관련한 연구에서 보편적으로 활용되고 있는 랜덤 포레스트, 인공 신경망, 서포트 벡터 머신을 사용하여 오피스 임대료 산정 모형을 구축하고 이들의 적용 가능성을 검토하였다. 이를 위해 서울시에 소재한 507동 오피스의 임대 조사 자료를 활용하여 각 방법별 최적 모형을 구축하고 이들의 성능을 비교하였고, 가장 좋은 성능을 보인 모형으로부터 PD plot을 도출하였다. 표본 전체를 대상으로 하여 임대료 산정모형을 구축한 결과, 모형별 성능의 순위는 서포트 벡터 머신 모형, 인공 신경망 모형, 랜덤 포레스트 모형 순으로 나타났고, 서포트 벡터 머신 모형으로부터 PD plot을 도출하여 해당 모형이 공실률이 높을수록, 전용률이 높을수록, 연면적이 클수록, 층수가 높을수록, 연식이 낮을수록, 승강기수가 많을수록 임대료를 높게 산출하는 것을 확인하였다. 주차대수는 모형의 예측값과 2차 곡선의 형태를 보이는 것으로 나타났다. 추가적으로 표본을 초대형, 대형, 중대형, 중형 등급으로 나누어 각 규모 등급별 임대료 산정 모형을 각각 구축하고 이들의 PD plot을 도출하였다. 본 연구는 다양한 머신 러닝 방법을 사용하여 오피스 임대료 산정 모형을 구축하고자 하였다는 점, PD plot을 통해 모형의 학습 결과에 대한 해석을 시도하였다는 점, 규모 등급별 임대료 산정 모형을 각각 구축하여 그 결과를 제시함으로써 규모 등급별 분석의 필요성을 입증하였다는 점에서 의의를 갖는다. We estimate office market rent using random forests, artificial neural networks, and support vector machines, which are commonly used in recent studies related to automatic evaluation models. We examine each method and compare the performances based on our sample data of the 507 offices located in Seoul, and depict PD(Partial Dependence) Plots to identify the influence of variables on predicted values. Using random forests, artificial neural networks, and support vector machines method, we estimate office market rent determinant model based on 507 office rental information data in Seoul. We attempt to identify the best performed model and also adopt the Partial Dependence(PD) Plots to examine the relative impact of research variables on predicted value. We classify the sample data into Class A, Class B, Class C, and the below Class C group. We apply the same method for each of those group. In general, we find that the support vector machines model performs best followed by random forests model and artificial neural networks model. The results indicate that the rent has a positive relation with rentable/usable ratio, floor, building age, and number of elevator. The number of parking vehicles showed the quadratic curve on rent in the model. Our study contributes to compare and allows appraisers to have a cross validation process with traditional valuation model against the finding from a machine learning method on office market.

      • KCI등재

        머신러닝 기법을 활용한 사교육 참여 예측 모형 탐색

        김영식(Kim, Young-sik),김훈호(Kim, Hoonho) 한국교육재정경제학회 2019 敎育財政 經濟硏究 Vol.28 No.3

        그 동안 사교육 수요의 원인 분석과 해결 방안 모색을 위한 다양한 연구들이 수행되었지만, 학생들의 사교육 참여 및 사교육비 지출에 대한 논의는 여전히 하나의 결론에 도달하지 못하고 있다. 선행연구들 중에는 그러한 이유를 그 동안 사교육 수요를 설명하기 위해 사용된 분석 모형이나 변수들이 상당히 제한적이었으며, 그로 인해 중요한 변수를 간과하거나 보다 직접적인 변수들을 통합․분리해 내는데 실패했기 때문이라고 설명하고 있다. 이에 본 연구에서는 빅데이터 분석과 함께 최근 주목을 받고 있는 네 가지 머신러닝 기법 즉, ‘랜덤 포레스트’, ‘나이브 베이즈 분류’, ‘서포트 벡터 머신’, ‘인공신경망 모형’을 적용하여 고등학생들의 사교육 참여에 영향을 미치는 변수들을 탐색적으로 살펴보았다. 그리고 이들 각 기법들의 예측성과를 비교․분석함으로써 머신러닝 기법이 갖는 성능과 한계를 조망해 보고, 향후 사교육 영향 요인 연구를 비롯한 다양한 교육 분야의 연구로 확대 가능한지 여부를 함께 검토해 보았다. 분석을 위해 본 연구에서는 한국교육고용 패널 Ⅱ의 1차 년도 자료를 사용하였다. 분석 결과 첫째, 머신러닝 기법에 따라 고등학생들의 사교육 참여를 예측하는 변수는 상이하였으며, 네가지 기법의 분석 결과에 공통적으로 포함된 예측 변수는 하나도 존재하지 않았다. ‘방과후 자율학습 참여여부’ 변수가 그나마 세 가지 기법에 공통적으로 포함되었으나, 상대적인 중요도에는 상당한 차이가 있었다. 둘째, 시험 자료를 기반으로 각 머신러닝 기법의 사교육 참여 예측률을 산출한 결과, 랜덤 포레스트 기법과 나이브 베이즈 분류 기법이 서포트 벡터 머신 기법이나 인공신경망 기법보다 고등학생의 사교육 참여를 더욱 정확하게 예측하는 것으로 나타났다. 따라서 표본 및 변수 선정 과정에서의 편의를 줄이고 분석 결과의 일반화 가능성을 높이기 위한 방편으로 머신러닝 기법을 적극 활용할 수 있으나, 분석의 목적이나 자료의 구조에 적합한 머신러닝 기법을 선택하기 위한 적절한 검증 작업이 선행되어야 할 것으로 보인다. There’s a plenty of literature on the demand of private tutoring across east-asian countries, particularly in the republic of Korea. To predict the demand for private tutoring more accurately, various methodologies have been proposed and applied. However, the methodologies have some deficits. First of all, they are unable to give a solution for which variables in the dataset should be considered as explanatory variables to effectively predict the demand for private tutoring. Also, they are easily exposed to over-fitting and risk being affected by outliers and noise. To overcome those limitations, this study proposes the application of multiple machine learning mechanisms including Random Forests(RF), Naive Bayes Classifier, Support Vector Machine, and Artificial Neural Network on the 1ST year dataset of the Korea Education and Employment Panel II. And to evaluate and compare our those results of multiple machine learning mechanisms, each model’s performance was calculated by Correct Classified Rate, Sensitivity, and Specificity based on test dataset. Empirical results showed that RF outperforms other machine learning algorithms from the perspective of prediction accuracy.

      • KCI등재

        고장 확률 계산을 위한 서포트 벡터 머신 기반 몬테칼로 시뮬레이션 개선 방안

        이승규(Seunggyu Lee),김재훈(Jae Hoon Kim) 대한기계학회 2020 大韓機械學會論文集A Vol.44 No.4

        몬테칼로 시뮬레이션(Monte Carlo simulation)은 불확실성을 확률로 계산하기 위한 수치 계산 도구로 이용될 수 있다. 몬테칼로 시뮬레이션은 공학 시스템의 상태가 고장인지 정상인지를 결정하는 과정을 반복한다. 공학 시스템의 상태를 결정하기 위해 수치 비용이 많이 소모되는 전산 해석 모델이 필요하다면, 몬테칼로 시뮬레이션에는 막대한 수치 비용이 소모된다. 이러한 수치 비용을 줄이기 위해 서포트 벡터 머신(support vector machine)이 적용될 수 있다. 서포트 벡터 머신에 필요한 수치 비용은 통상 복잡한 공학 전산 모델보다 작다. 본 연구에서는 기존에 제시된 서포트 벡터 머신 기반의 몬테칼로 시뮬레이션을 개선하기 위해 메트로폴리스-하스팅스(Metropolis-Hastings) 알고리즘과 군집 분석을 적용한다. Monte Carlo simulation is used as a numerical tool to estimate the uncertainties in process models. This tool is also used to estimate the probability of the failure of engineering systems. Monte Carlo simulation of complex engineering models involves high computational costs, which can be reduced by applying support vector machines. In this study, the Metropolis-Hasting algorithm and cluster analysis are applied to improve the existing support vector machine-based Monte Carlo simulation method to estimate failure probability.

      • KCI등재

        머신러닝을 사용한 스마트워치 사용자의 고혈압 예측모델: 국민건강영양조사 자료 활용

        김민정 한국소비자정책교육학회 2023 소비자정책교육연구 Vol.19 No.4

        본 연구는 최근 스마트워치가 개인의 건강상태 및 개인 활동에 대한 자가 모니터링을 제공함으로써 건강 관리를 지원할 수 있다는 가정 하에 스마트워치 사용자가 쉽게 측정할 수 있는 건강 관련 데이터를 이용하여 고혈압의 유병률을 예측하는 모델을 개발하였다. 이를 위해 스마트워치에서 제공하는 건강 관련 기능에 해당하는 데이터는 질병관리청에서 발간하는 국민건강영양조사에서 선정하였다. 분석자료로 제7기(2016-2018년) 국민건강영양조사의 11,469명의 자료를 사용하였다. 타겟변수는 고혈압 유병여부, 독립변수는 성별, 연령, 15초간 맥박수, 수축기 혈압, 이완기 혈압, 공복 혈당, 체질량지수, 신체활동(운동)여부, 음주여부, 흡연여부, 수면시간을 포함하였다. 먼저 전체 데이터 세트를 학습용 데이터 세트(70%)와 시험용 데이터 세트(30%)로 나눈 후 학습용 데이터 세트에서 세 가지 머신러닝 분류모델(로지스틱 회귀분석, 인공신경망, 서포트 벡터 머신)을 사용하여 고혈압 질환을 분류하고, 모델들이 얼마나 정확하게 예측을 수행하는지 주어진 시험용 데이터 세트에서 확인하였다. 세 가지 머신러닝 분류모델 중 성능 평가 지표를 계산한 결과, 서포트 벡터 머신이 가장 성능이 좋은 것으로 나타났다. 다음으로 서포트 벡터 머신 모델 하에서 독립변수들의 중요도를 살펴보았다. 연령이 가장 높았고, 수축기혈압, 공복혈당, 체질량지수가 상위권에, 음주여부는 상대적으로 중요도가 낮게 나타났다. 마지막으로, 연령이 고혈압 발병의 가장 중요한 위험인자로 도출됨에 따라서 60대 이상을 대상으로 연령별로 변수들의 중요도를 분석하였다. 그 결과 노년층에서도 연령대별로 동일한 중요도를 가지는 요인들이 있는 반면, 차이가 나타나는 요인들이 있었다. 대표적으로 체질량지수와 혈당은 모든 노년층에서 가장 중요한 요인으로 나타났고, 신체활동(운동)여부는 연령대별로 차이가 있었다. 본 연구는 우리나라 인구 모집단을 대표할 수 있는 대규모 표본집단 대상으로 한 국민건강영양조사 자료를 이용하여 고혈압의 위험 요인을 분석함으로써 스마트워치 이용자들이 본인의 건강 관련 기능에 해당하는 값을 가지고 고혈압 유병여부를 예측할 수 있다는 점에서 의의가 있다고 할 수 있다. This study developed a model that predicts the prevalence of hypertension using health- related data that can be easily measured by smartwatch users under the assumption that smartwatches recently have the potential to support health care in everyday life by supporting self-monitoring of health conditions and personal activities. For this purpose, data corresponding to the health-related data variables provided by the smartwatch were selected from the Korea National Health and Nutrition Examination Survey published annually by the Korea Disease Control and Prevention Agency. Data from 11,469 people from the 2016-2018 Korea National Health and Nutrition Examination Survey were used as analysis data. The target variable included the presence or absence of hypertension, and the independent variables included sex, gender, age, pulse rate in 15 seconds, systolic blood pressure, diastolic blood pressure, fasting blood sugar, body mass index, physical activity (exercise), drinking status, smoking status, and sleep time. First, we divide the entire data set into training data set (70%) and testing data set(30%), and then classify hypertensive diseases using three machine learning classification models (logistic regression, artificial neural network, and support vector machine) in the training data set. We checked how accurately the models made predictions on a given test data set. As a result of calculating the performance evaluation index among the three machine learning classification models, the support vector machine showed the best performance. Next, we examined the importance of independent variables under the support vector machine model. Age was the highest, systolic blood pressure, fasting blood sugar, and body mass index were in the upper range, and drinking status was in the lowest Finally, as age is derived as the most important risk factor for developing hypertension, the importance of variables by age was analyzed for those in their 60s and older. As a result, while there were factors that had the same importance for each age group in the elderly, there were factors that showed differences. Typically, body mass index and fasting blood sugar were the most important factors in all older age groups, and physical activity (exercise) differed by age group. This study is significant in that smartwatch users can predict the prevalence of hypertension with their health-related data by analyzing various factors that can affect hypertension using data from the National Health and Nutrition Survey of large population groups that can represent the Korean population.

      • 머신러닝을 이용한 공동주택 가격 추정: 서울 강남구 사례를 중심으로

        배성완,유정석 한국부동산분석학회 2017 부동산분석학회 학술발표논문집 Vol.2017 No.1

        본 연구는 부동산 가격 산정에 있어서 머신 러닝 방법의 적용 능성을 검토하였다. 서울시 강남구를 사례지역으로 선정하였고, 2016년 신고 된 거래사례를 이용하여 아파트 가격을 추정하였다. 머신 러닝 방법인 서포트 벡터 머신(support vector machine, SVM), 앙상블 모형(ensenble model), 심층신경망(deep neural networks, DNN)의 예측력이 다중회귀분석(multiple regression analysis, MRA)모형보다 우수한 것으로 나타났다. 머신 러닝 방법 중에서는 GBRT(gradient boosting regression tree, GBRT)의 예측력이 다른 머신 러닝 방법보다 우수하나 그 정도는 미미한 수준인 것으로 나타났다. 추가적으로 추정된 아파트 가격에 공시비율을 적용하여 과세가격을 산출하였다. 머신러닝 모형에 의해 산출된 과세 가격은 실제 과세 가격보다 실거래가반영률이 높았으며 과세 형평성 조건도 충족하고 있는 것으로 나타났다. 향후 머신 러닝 방법을 활용함으로써, 과세 평가와 같은 대량 평가에 있어서 업무 효율성을 향상시키는데 도움이 될 것으로 기대된다. This study examined the applicability of the machine learning methods to the real estate valuation. Gangnam-gu, Seoul was chosen as a study area and the housing prices were estimated using the sales cases collected in 2016. The predictive power of the machine learning methods such as SVM(support vector machine), Ensenble Model and DNN(deep neural networks) is superior to that of the multiple regression analysis(GRA) methods. Among the machine learning methods, the predictability of the GBRT(gradient boosting regression tree) model is slightly superior to that of the others. In addition, we estimated the assessment prices by applying a assessment ratio to estimated housing prices. The assessment values estimated by the machine learning methods reflect the actual transaction prices better than the actual assessment values do, and satisfy the taxation equity requirements. Drawing on the machine learning methods, it is hoped that this study will help improve the efficiency of mass appraisal such as the housing assessment.

      • KCI우수등재

        머신러닝을 활용한 개인의 교통수단 선택 예측모형 구축

        이영호,홍성연 한국데이터정보과학회 2019 한국데이터정보과학회지 Vol.30 No.5

        A reliable prediction of individual travel mode choices is an important factor for implementing transportation polices, because it is directly related to the demand for transport services and infrastructure. While machine learning methods have become increasingly popular in this field, it is not widely applied in the Korea context. In this paper, we attempt to develop a model that can predict individual travel mode choices by comparing three different machine learning techniques, multinomial logistic regression, decision tree and support vector machine. The performance of the prediction models is evaluated using a confusion matrix, and the results show that the model developed by support vector machine performs better than other methods. Our analysis can contribute to the expansion of transportation policies and support management decision-making. 교통수단 선택을 예측하는 것은 해당 지역의 교통 관련 정책 수립에 있어서 중요하기 때문에, 이와 관련된 연구는 과거부터 많이 진행되어 왔다. 해외에서는 다양한 머신러닝 기법을 적용하여 개인의 교통수단 선택을 예측하는 연구가 활발히 진행된 반면, 우리나라에서는 아직까지 이러한 연구가 부족한 상황이다. 따라서 본 연구에서는 2016년 서울시 가구통행실태조사 데이터를 바탕으로 다항로짓모형, 의사결정나무, 서포트 벡터 머신의 세 가지 머신러닝 기법을 적용하고, 최적의 예측모형을 도출하고자 하였다. 각 모형의 예측 결과는 혼동행렬을 통해 검증하였으며, 서포트 벡터 머신, 다항로짓모형, 의사결정나무 순으로 높은 예측 정확도를 나타냈다. 이러한 개인의 교통수단 선택 예측모형은 교통 정책의 확대와 의사결정 과정에도 기여할 수 있을 것으로 기대된다.

      • KCI등재

        머신러닝 기법을 이용한 수도권 지역의 호우피해 예측함수 개발

        최창현,김종성,김동현,이준형,김덕환,김형수 한국방재학회 2018 한국방재학회논문집 Vol.18 No.7

        In this study, we developed heavy rain damage prediction functions using three machine learning techniques (support vector machine, decision tree, and random forest) for the Seoul Capital Area, South Korea. Data on damage caused by heavy rain were used as the dependent variable for the development of the heavy rain damage prediction function, and weather observation data were used as the independent variables. When we compared the results, the best function was the support vector machines based on weather observation data of the past two days. Compared to the linear regression model used primarily in previous studies, the results showed that the functions using machine learning techniques were mostly predictable. Therefore, it was judged that the machine learning techniques could be applied to disaster management areas. Also, it is believed that using the heavy rain damage prediction function developed in this study can help reduce damage through proper disaster management before the damage occurs. 본 연구에서는 3가지의 머신러닝 기법(서포트 벡터 머신, 의사결정나무, 랜덤포레스트)을 이용하여 수도권 지역의 호우피해 예측함수를 개발하였다. 호우피해 예측함수의 종속변수로 호우피해액 자료를 사용하였고, 독립변수로 기상관측자료를 사용하였다. 분석결과 과거 2일전의 기상관측자료를 기반으로 서포트 벡터 머신을 이용하여 개발한 함수가 가장 높은 예측력을 보였다. 기존의 연구들에서 주로 사용하였던 선형회귀모형과 비교한 결과 머신러닝 기법을 이용한 함수가 대부분 예측력이 높은 것으로 나타나 재난관리 분야에 머신러닝 기법의 적용이 가능한 것으로 판단되었다. 또한, 본 연구에서 개발된 호우피해 예측함수를 활용하여 피해 발생 전에 호우피해를 예측한다면, 적절한 재난관리를 통해 피해를 저감하는데 도움이 될 수 있을 것으로 판단된다.

      • KCI등재

        기계학습을 통한 잉여현금흐름 예측:서포트벡터머신과 로지스틱 회귀 모형을 중심으로

        김태영,김태성,이미영 한국전산회계학회 2021 電算會計硏究 Vol.19 No.2

        잉여현금흐름은 기업가치의 중요한 지표로서, 경영자, 투자자, 노동자 등 다양한 정보이용자들에게 유용한 정보이다. 그러나 잉여현금흐름예측 모형의 개발이나 관련된 연구는 많이 이루어지지 않고 있다. 이에 본 연구에서는 우리나라 상장기업들의 재무 빅데이터를 활용하여 기업의 잉여현금흐름을 예측하는 머신러닝 모형들 간의 성능을 비교하였다. 예측력이 뛰어난 것으로 알려져 있는 서포트벡터머신 알고리즘을 중점적으로 논의하였는데, 서포트벡터머신(support vector machine)은 p차원 공간에 존재하는 개체들을 p-1차원의 초평면(hyperplane)을 사용해 분리시키는 최대마진분류기(maximal margin classifier)의 발상을 일반화시킨 것이다. 또한 서포트벡터머신과 연관성을 가지는 로지스틱 회귀 모형을 함께 고려하였다. 분석 결과, 로지스틱 회귀 모형의 전반적인 예측력이 가장 좋았다. 그럼에도 불구하고, 본 연구에서 고려된 모형들 간의 유의한 차별성은 없었는데, 이는 향후 변수의 속성을 반영한 다양한 머신러닝 알고리즘을 감안할 필요성을 제기하고 있다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼