머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A109597868
2025
Korean
004
학술저널
27-30(4쪽)
0
상세조회0
다운로드국문 초록 (Abstract)
머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리...
머신러닝에서 클래스 불균형 문제는 데이터의 클래스 간 샘플 수가 불균형하여 모델 성능을 저하시킬 수 있다. 이를 위해 Synthetic Minority Oversampling Technique (SMOTE)와 같은 리샘플링 기법이 널리 연구되었지만, 여전히 클래스 중첩 영역 문제, 고차원 및 혼합형 데이터 등 다양한 클래스 불균형 시나리오에서는 한계를 보인다. 본 논문에서는 이러한 한계를 극복하기 위해 고차원 및 혼합형 데이터를 효과적으로 처리하는 새로운 오버샘플링 알고리즘인 k-Nearest Neighbor Oversampling with Weighted Heterogeneous Euclidean Entropy Metric (KNNOR_WHEEM)을 제안한다. 이는 유용한 샘플 선택, 샘플 합성, 합성 샘플 검증의 세 단계로 구성된다. KNNOR_WHEEM은 피처 간 중요도를 반영한 거리 메트릭과 피처 유형 별 샘플 합성 방식을 이용하여 고차원 및 혼합형 데이터의 클래스 불균형 문제를 효과적으로 다룬다. 제안한 알고리즘의 성능을 평가하기 위해 다양한 데이터를 이용해 실험을 진행하였고, 특히 F1-score 측면에서 우수한 성능을 보임을 확인할 수 있었다.
객체 탐지와 대조 학습을 활용한 운전자 사고 영상 클러스터링 및 패턴 분석