http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
희소 데이터를 위한 강인 손실 함수를 이용한 준 지도 학습
안영준(Youngjun Ahn),심규석(Kyuseok Shim) 한국정보과학회 2021 정보과학회논문지 Vol.48 No.12
이 논문에서는 데이터의 레이블이 매우 부족한 상황에서 데이터 증강기법과 강인 손실 함수를 사용하여 준 지도 학습을 하는 방법을 제안한다. 기존 데이터 증강기법을 사용하는 준 지도 학습 방법은 레이블이 없는 데이터를 증강하고, 그 중 신뢰도가 높은 데이터에 대해서만 현재 모델이 예측한 레이블을 원 핫 벡터로 붙여 학습에 사용한다. 그래서 신뢰도가 낮은 데이터는 사용하지 않는 문제가 있었는데, 이를 해결하기 위해 강인 손실 함수를 이용하여 신뢰도가 낮은 데이터 또한 사용하는 연구도 진행되었다. 한편, 레이블이 매우 적은 상황에서는 모델이 예측한 레이블은 신뢰도가 높더라도 부정확하다는 문제가 있다. 이 논문에서는 레이블이 매우 적은 상황에서 원 핫 벡터가 아닌 모델이 예측한 확률을 레이블로 사용함으로써 분류 모델의 성능을 높일 수 있는 방법을 제시한다. 또한 이미지 분류 문제에 대한 실험을 통하여 제시된 방법이 분류 모델의 성능을 향상시킴을 보여준다. This paper proposes a semi-supervised learning method which uses data augmentation and robust loss function when labeled data are extremely sparse. Existing semi-supervised learning methods augment unlabeled data and use one-hot vector labels predicted by the current model if the confidence of the prediction is high. Since it does not use low-confidence data, a recent work has used low-confidence data in the training by utilizing robust loss function. Meanwhile, if labeled data are extremely sparse, the prediction can be incorrect even if the confidence is high. In this paper, we propose a method to improve the performance of a classification model when labeled data are extremely sparse by using predicted probability, instead of one hot vector as the label. Experiments show that the proposed method improves the performance of a classification model.