http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Oversampling 기반 Machine Learning 기법별 백제보 상류하천구간의 CDOM 흡수계수 예측
김진욱 ( Jinuk Kim ),장원진 ( Wonjin Jang ),김진휘 ( Jinhwi Kim ),박용은 ( Yongeun Park ),김성준 ( Seongjoon Kim ) 한국농공학회 2022 한국농공학회 학술대회초록집 Vol.2022 No.-
금강 백제보는 준공 이후 긴 체류시간과 깊은 수심으로 인해 상류에서 유입된 유기물질로 인한 녹조 번성이 유리한 유역이다. 유기물질을 조절하기 위해 최근 머신러닝과 원격감지 기술로 CDOM(Colored Dissolved Organic Matter)을 모니터링하기 위한 연구가 진행되고 있다. 한편, 머신러닝을 통해 CDOM을 예측할 때 데이터 품질과 양에 따라 결과 값이 달라지며, 백제보는 모니터링 기간 중 CDOM 값은 전체기간 동안 2.0~11.0 m<sup>-1</sup>의 분포를 가지며, 5 m<sup>-1</sup> 이상의 고농도 구간 자료 개수가 18개로 전체(105개)의 17%를 보였다. 따라서 본 연구에서는 녹조 번성이 심했던 2016~2017년의 백제보의 초분광영상을 이용하여, oversampling 기법 중 하나인 SMOTE(Synthetic Minority Over-sampling Technique)와 ADASYN(Adaptive Synthesis Sampling Approach) 기법을 통해 불균형 문제를 해결하고, 여러 머신러닝 기법을 적용하여 CDOM을 모니터링하고자 하였다. 고농도와 저농도 비율을 고려하여 Train 데이터와 Test 데이터를 70:30으로 분할 한 후, Train 데이터에 대해 SMOTE와 ADASYN 기법을 적용해 고농도 데이터를 생성하였다. 머신러닝은 OLS(Ordinary Least Squres), SVR(Support Vector Regression), RFR(Random Forest Regression), LGB(Light Gradient Boosting Regression), ANN(Artificial Neural Network)을 적용하여 평하가였다. 평가결과 SMOTE+RFR의 overall 결과는 Train R<sup>2</sup> 0.826, Test R<sup>2</sup> 0.439를 보였으며 best case에서는 Train R<sup>2</sup> 0.831, Test R<sup>2</sup> 0.882으로 가장 높은 예측력을 보였다. 해당 결과를 활용하여 공간분포를 실시하였으며, 공간적으로 유기물이 밀집된 지역과 아닌 지역을 판별하였다. 본 연구결과를 활용하여 하천 내 유기 오염물질 관리를 위한 설계를 지원하는데 사용할 수 있을 것으로 판단된다.
황수진 ( Soojin Hwang ),김애련 ( Aeryun Kim ),문선혜 ( Sunhye Moon ),김지희 ( Jihee Kim ),김진휘 ( Jinhwi Kim ),하영혜 ( Younghea Ha ),양옥영 ( Okyoung Yang ) 한국보건행정학회 2016 보건행정학회지 Vol.26 No.4
Background: Rehabilitations in subacute phase are different from acute treatments regarding the characteristics and required resource consumption of the treatments. Lack of accuracy and validity of the Korean Diagnosis Related Group and Korean Out-Patient Group for the acute patients as the case-mix and payment tool for rehabilitation inpatients have been problematic issues. The objective of the study was to develop the Korean Rehabilitation Patient Group (KRPG) reflecting the characteristics of rehabilitation inpatients. Methods: As a retrospective medical record survey regarding rehabilitation inpatients, 4,207 episodes were collected through 42 hospitals. Considering the opinions of clinical experts and the decision-tree analysis, the variables for the KRPG system demonstrating the characteristics of rehabilitation inpatients were derived, and the splitting standards of the relevant variables were also set. Using the derived variables, we have drawn the rehabilitation inpatient classification model reflecting the clinical situation of Korea. The performance evaluation was conducted on the KRPG system. Results: The KRPG was targeted at the inpatients with brain or spinal cord injury. The etiologic disease, functional status (cognitive function, activity of daily living, muscle strength, spasticity, level and grade of spinal cord injury), and the patient`s age were the variables in the rehabilitation patients. The algorithm of KRPG system after applying the derived variables and total 204 rehabilitation patient groups were developed. The KRPG explained 11.8% of variance in charge for rehabilitation inpatients. It also explained 13.8% of variance in length of stay for them. Conclusion: The KRPG version 1.0 reflecting the clinical characteristics of rehabilitation inpatients was classified as 204 groups.