http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
XGBoost 기반의 2단계 확률적 일사량 예측과 태양광 예측 알고리즘의 성능 검증
이유림(Yurim Lee),김현진(Hyunjin Kim),이다한(Dahan Lee),이채정(Chaijung Lee),이두희(Duehee Lee) 대한전기학회 2019 전기학회논문지 Vol.68 No.12
We propose the novel solar power forecasting algorithm by using the Extreme Gradient Boosting (XGBoost) machine based on the 2-stage forecasting structure. Our algorithm is implemented to solve three problems. First, the solar power is linearly proportional to the solar irradiation on a target solar panel, but it is hard to obtain the target solar irradiation. Therefore, in the first stage, we predict the target solar irradiation by using the XGBoost based on numerical weather prediction, which is measured on a different location but modified for the target location. Second, the forecasting errors on the predicted solar irradiation can be transferred to the second stage when the predicted solar irradiation is used to predict the solar power. We forecast the conditional error distribution of predicted irradiation by collecting forecasting errors, and we sample solar irradiation scenarios, which are converted to the solar power scenarios. Then, the final point forecast of solar power is estimated by calculating the median of scenarios so that we can improve the forecasting accuracy. Third, in this process, the quality of numerical weather prediction deteriorates as the target hour is farther. Therefore, we build forecasting models for each target hour in parallel to minimize the forecasting accuracy deterioration from the quality deterioration. Finally, we verify our proposed algorithm by participating in the solar power forecasting competition hosted by KPX.
Lee Yurim(이유림) 한국어학회 2021 한국어학 Vol.90 No.-
본 연구에서는 구어와 문어 자료에서 어휘 다양성이 높은 집단이 많이 사용하는 어휘 학습 전략을 추출하고 추출한 교육하여 그 효과를 확인하고자 하였다. 상위 집단에서 사용하는 어휘 학습 전략을 추출하기 위해 설문 조사를 통해 어휘 학습 전략을 조사하고 평균 D값을 측정하였다. 그 결과, 어휘 다양성이 높은 집단이 많이 사용하는 어휘 학습 전략 세 개(‘새 단어를 여러 번 말하면서 암기한다.’, ‘새 단어가 사용될 수 있는 상황을 생각하면서 그 단어를 외운다.’, ‘모르는 단어가 있으면 문맥적 흐름으로 의미를 추측한다.’)를 추출할 수 있었다. 이를 바탕으로 추출된 어휘 학습 전략 교육 전후의 평균 D값을 통해 구어, 문어, 표현 어휘 다양성을 측정하고 그 결과를 제시하였다. 구어와 표현 어휘 다양성 교육 전후의 경우, ‘새 단어가 사용될 수 있는 상황을 생각하면서 그 단어를 외운다.’, ‘모르는 단어가 있으면 문맥적 흐름으로 의미를 추측한다.’, ‘새 단어를 여러 번 말하면서 암기한다.’ 순으로 전략 교육의 효과가 큰 것으로 나타났다. 그리고 문어 어휘 다양성은 교육 전후에 ‘새 단어를 여러 번 말하면서 암기한다.’ 전략을 사용하는 경우에만 효과가 있는 것으로 나타났다. In this research, we aimed to extract the well-used vocabulary learning strategies from advanced-level learners with high lexical diversity and confirm the effects after educating those strategies. We first conduct a survey to examine the strategies and measured lexical diversity with D_optimum average. After collecting the data, we extracted three common strategies from a group with advanced lexical diversity by categorizing each group. Based on this, lexical diversity of speaking, writing and expressive vocabulary was measured by D_optimum average before and after educating the strategies and the following result was produced. In a case of speaking and expressive vocabulary, the effects of educating the strategies were more noticeable in the order of ‘Think of a situation that new words can be used.’, ‘Speculate the meaning of new words from the context.’ and ‘Memorize new words as speaking them repeatedly.’ For writing, ‘Memorize new words as speaking them repeatedly.’ was the only effective strategy for enhancement of lexical diversity.
온라인 어학사전을 활용한 신조어 기계 번역의 정확도 향상 방법
이서정(SeoJeong Lee),이유림(YuRim Lee) 한국정보기술학회 2021 Proceedings of KIIT Conference Vol.2021 No.6
최근 기계번역 기술이 인공지능 기술을 기반으로 빅데이터를 학습하여 번역 결과물의 정확도가 높아지고 있다. 그러나 신조어는 끊임없이 생성되고 있으며, 그에 대한 학습 데이터가 부족하다. 따라서, 본 연구에서는 신조어가 포함된 문장의 기계 번역 정확도를 높이기 위하여 온라인 어학사전의 뜻을 활용하였다. 그 결과, 번역된 결과물의 Jaccard similarity 수치가 약 0.5245에서 약 0.5406으로 약 3.1% 증가하였다. 본 연구 결과를 통해 학습 데이터가 부족한 단어들의 기계 번역 정확도를 향상시킬 수 있음을 확인할 수 있었다. Recently, machine translation technology has learned big data based on artificial intelligence technology, increasing the accuracy of translation results. However, newly coined words are constantly being generated, and there is a lack of training data for them. Therefore, in this paper, the meaning of the online language dictionary was used to improve the accuracy of machine translation of sentences containing newly coined words. As a result, the Jaccard similarity level of translated results increased by about 3.1% from about 0.5245 to about 0.5406. The results of this paper confirm that we can improve machine translation accuracy of words lacking learning data.