http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
이동구(Dong Gu Lee),최혜연(Hyeyeon Choi),김범준(Bum Jun Kim),장현아(Hyeonah Jang),정원석(Wonseok Jeong),김상우(Sang Woo Kim) 대한전기학회 2021 대한전기학회 학술대회 논문집 Vol.2021 No.10
MIT에서 발표한 논문에 따르면 가장 많이 인용되어 사용되는 오픈 소스 데이터 10개에서 라벨 오류가 평균 3.4%가 존재한다고 발표되었다. 전문성을 요하는 실제 산업의 라벨링 과정에서 오류는 더욱 빈번히 발생한다. 이러한 라벨 노이즈를 잡기 위한 하나의 방법으로 Label Smoothing을 사용한다. 본 논문에서 Label Smoothing (LS)이 세분화된 유사 데이터에 부적절한 영향을 끼치는 것을 수식 및 실험적으로 확인한다. 나아가 이 데이터에 적용하기 위해 개선된 Dynamic Label Smoothing (DLS)을 제안한다. DLS는 오답 라벨에 균일 분포를 할당하는 대신 가까운 클러스터에는 작은 값으로 불균일 분포를 할당한다. 이를 통해 세분화된 유사 데이터 학습에서 발생하는 LS의 단점을 개선한다. 다양한 실험을 통해 제안된 방법이 세분화된 유사 데이터에 유의미함을 검증하였다.