http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
황영은(Yeungeun Hwang),강다영(Dayoung Kang),나명환(Myunghwan Na),윤상후(Sanghoo Yoon) 한국데이터정보과학회 2021 한국데이터정보과학회지 Vol.32 No.5
과채류 품질은 생육 단계별 일사량 노출에 영향받는다. 선행연구는 일사량의 시계열적 특성을 반영한 시계열모형과 일사량에 영향을 미치는 기상변수를 사용한 기계학습 연구가 수행되었다. 이 연구는 지표면 일사량에 영향을 미칠 수 있는 대기오염물질 농도와 기상변수가 모두 고려된 트리 기반의 앙상블로 일사량을 예측하는 모형을 제시한다. 연구자료는 기상자료개방포털과 에어코리아에서 수집하였으며 연구 기간은 2015년 1월 1일부터 2019년 12월 31일이다. 수집된 자료는 전처리를 통해 일 단위로 가공 후 기계학습인 랜덤포레스트 (RF), 일반화가속모형 (GBM), XGboost를 통해 일사량을 예측하였다. 모형검증을 위해 5겹 교차검증이 사용되었고 모형 간 예측성능은 평균절대값오차, 평균 제곱근오차, 그리고 결정계수로 비교하였다. 5겹 교차검증을 통한 모형 간 예측성능은 GBM이 가장 우수하나 과대적합 문제가 발생한다. 따라서 최적화된 모수를 적용한 결과 RF의 예측력이 가장 우수하였다. 변수의 중요도를 살펴보면 일조시간, 가조시간, 강수 순으로 구름의 양과 미세먼지 농도는 일 단위 일사량 예측에 중요한 변수가 아니다. The quality of fruits and vegetables is affected by exposure to insolation at each stage of growth. A machine-learning study using a time series model reflecting the time series characteristics of insolation and meteorological variables affecting insolation was performed. This study presents a model for predicting insolation in a tree-based ensemble that considers both atmospheric pollutant concentrations and meteorological variables that can affect surface insolation. The research data were collected from the Korea Meteorological Administrator and Air Korea, and the research period was between 2015 and 2019. The daily insolation was predicted through machine learning, Random Forest (RF), gradient boosting model (GBM), and XGboost. 5-fold cross-validation was used for model validation, and prediction performance was compared with mean absolute value error, root mean square error, and coefficient of determination. GBM was the best predictive performance among models through 5-fold cross-validation, but with overfitting. Therefore, as a result of applying the optimized parameters, the RF prediction was the best. Both sunshine time and duration were very important variables. However, the amount of clouds and fine dust concentration are not important variables in predicting.
온라인 기사의 크롤링 기법과 LSTM 모형을 이용한 소고기 가격 예측
강수람(Sooram Kang),조완현(Wanyun Cho),나명환(Myunghwan Na) 한국정보기술학회 2021 Proceedings of KIIT Conference Vol.2021 No.11
소고기는 한국인들이 가장 좋아하는 육류 중 하나이며 그에 따라 많은 소비가 이루어지고 있어 가계 경제에 중요한 요소 중 하나이다. 하지만 소고기의 가격은 유통, 질병 혹은 COVID-19과 같은 일시적인 이슈에 의해 공급과 수요의 불균형이 발생할 때 가격 변동이 크게 일어난다. 따라서 관련 기관에서는 소고기의 가격, 공급 등에 대한 동향을 지속해서 발표하고 있지만, 월별 혹은 분기별 단위로 이루어지기 때문에 즉각적인 정보 획득이 어렵다. 따라서 본 연구는 소고기와 관련한 이슈를 즉각적으로 반영하여 가격의 변동을 잘 반영하면서 주별 단위 가격을 예측하고자 한다. 이를 위해 관련 이슈를 반영하는 온라인 기사를 크롤링하여 소고기가 언급된 기사의 수와 경제지표, 공급관련 변수들을 외생변수로 사용하였고 예측모형으로는 LSTM을 사용하였다. 실험을 통해서 제안된 예측모형은 단기적인 이슈가 반영되어 짧은 기간 단위의 소고기 가격예측을 가능하게 하면서도 정확성을 높이는 것으로 나타났다. Beef is one of Koreans" favorite meat, and it is one of the important factors in the household economy as it is consumed a lot accordingly. However, the price of beef varies greatly when supply and demand imbalance occurs due to temporary issues such as distribution, disease, or COVID-19. Therefore, related organizations continue to present trends in the price and supply of beef. However, since the analysis of related trends is conducted on a monthly or quarterly basis, immediate information acquisition is difficult. For this reason, this study aim to immediately reflects the issues related to beef and to predict weekly unit prices. To this end, online articles reflecting related issues were crawled, and the number of articles mentioned with beef, economic indicators, and supply-related variables were used as exogenous variables, and LSTM was used as a predictive model. The prediction model proposed was found to reflect short-term issues and increase accuracy while enabling short-term beef price prediction.
조완현(Wanhyun Cho),김상균(Sangkyoon Kim),나명환(MyungHwan Na),김덕현(Deok Hyeon Kim) 한국자료분석학회 2020 Journal of the Korean Data Analysis Society Vol.22 No.1
In this paper, we try to develop a growth management system that can maximize the harvest by examining frequently the growing status of fruit trees using statistical regression model and image processing technique. First, we segment the background, stem and strawberry body from a strawberry image. Second, we calculate the height and width of the strawberry by counting number of pixels from the grid given in the background. Third, a multiple regression model is used to derive a predictive function that can predict its weight from the given height and width of strawberries. Fourth, the accuracy of the prediction is verified by comparing the actual value with the predicted value of the weight of the strawberry using the verification data. Fifth, we conducted experiments using verification images to verify the performance of the constructed prediction model. From the experimental results, the value of the coefficient of determination for the constructed model is 0.98771, which is very high value. Finally, based on the algorithms derived so far, we have developed a platform that can actually be used to manage strawberry growth in farms.