http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
임재봉 ( Jaebong Lim ),이종수 ( Jongsoo Lee ),조용훈 ( Yonghun Cho ),백윤주 ( Yunju Baek ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.1
최근 경량 딥러닝 기반 키워드 음성인식은 가전, 완구, 키오스크 등 다양한 응용에 음성 인터페이스를 쉽게 적용할 수 있는 기술로서 주목받고 있다. 키워드 음성인식은 일부 키워드만 인식 가능한 음성인식 기술로서 저성능 디바이스에서 활용 가능한 장점이 있다. 그러나 응용에 따라 필요한 키워드에 대하여 다시 음성데이터를 수집해야하고 이를 학습하여 모델을 새로 준비해야하는 단점이 있다. 따라서 본 연구에서는 음성데이터 수집 없이 음성합성을 통해 생성한 음성으로만 키워드 음성인식 모델을 학습하는 음성합성 기반 자동 학습 기법을 제안하였다. 생성한 음성데이터를 활용하고자 하는 시도가 활발히 이루어지고 있으나, 기존 연구에서는 정확도를 유지하기 위하여 수집한 실제 음성데이터가 필요한 한계가 있다. 제안한 자동 학습 기법은 생성한 음성데이터에 대해 복합 데이터 증대 기법을 적용하여 실제 음성데이터 없이 키워드 음성인식의 정확도를 높였다. 제안한 기법에 대하여 상용 음성합성 서비스를 기반으로 수집한 한국어 키워드 데이터세트를 활용하여 성능평가를 진행하였다. 20개 한국어 키워드에 대해 실험한 결과, 제안한 기법을 적용하여 학습시킨 키워드 음성인식 모델의 정확도는 86.44%임을 확인하였다.
다양한 환경에서의 임베디드 핵심어 검출 시스템 설계 및 구현
이종수(Jongsoo Lee),임재봉(Jaebong Lim),전용수(Yongsu Jeon),김태구(Taegu Kim),조용훈(Yonghun Cho),이상화(Sanghwa Lee),백윤주(Yunju Baek) 대한전자공학회 2021 대한전자공학회 학술대회 Vol.2021 No.6
Recently, products equipped with speech recognition technology have appeared. For these speech recognition techniques to be used more efficiently, they must also be robust in noise and echo environments. However, speech recognition in resource-constrained embedded devices is vulnerable to the effects of noise, etc. Data augmentation techniques and curriculum learning methods were used to enhance speech recognition robustness in various environments. In addition, the performance changes were compared to see the effects of the techniques used.