데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A103692649
2017
Korean
학술저널
1910-1916(7쪽)
0
상세조회0
다운로드국문 초록 (Abstract)
데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨...
데이터 불균형 문제는 한 범주에 속한 데이터의 수가 다른 범주에 속한 데이터의 수보다 극단적으로 많거나 적을 때 발생하며, 기계 학습 알고리즘을 통해 학습한 분류기의 성능을 저하시킨다. 본 논문에서는 이 문제를 해결하기 위해 k-대푯값 (k-Medoids) 알고리즘을 사용하여 극단적으로 많은 데이터를 가진 다수 범주의 데이터를 군집화한다. 이후, 소수 범주에 가까운 대푯값에 가중치를 주어 추출될 확률을 높이는 거리 가중(Distance Weighting) 추출 방법을 사용하여 대푯값을 반복적으로 복원 추출함으로써 다수의 균형 데이터를 생성한다. 생성된 각각의 균형 데이터를 사용해 다수의 분류기를 학습시키고 앙상블(Ensemble) 기법 중 배깅(Bagging, Bootstrap Aggregating)을 사용하여 생성된 다수의 분류기 결과들을 종합, 최종 분류를 진행하는 방법을 제안한다. 또한, 실제 데이터를 이용한 실험을 통해 제안 기법이 기존 기법들보다 우수한 성능을 보임을 검증한다.
목차 (Table of Contents)
Real-time Pricing Scheme in Smart Grid Considering Time Preference
Theoretical model and optimal control for energy buffer system