http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
행렬 분해 기반 변형된 멀티헤드 셀프 어텐션을 활용한 Conformer 음성인식 모델
이현규(Hyeon Kyu Lee),노태엽(Tae-Yup Roh),최영석(Young-Seok Choi) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
최근, 음성인식(Automatic Speech Recognition, ASR) 연구 분야에서 Conformer 는 다양한 딥러닝 모델들과 융합 및 응용되어 높은 인지 성능을 보여주며 많은 음성인식 연구자들에게 각광받고 있다. 하지만, 대부분의 음성인식 연구 분야는 영어 등의 언어에서 활발히 진행되고 있으며 한국어 기반의 음성인식 연구는 여전히 불모지이다. 본 연구에서는 한국어 음성인식 성능 향상을 위해 행렬 분해(Matrix Factorization, MF) 기법에서 착안하여 Conformer 모델의 구조를 재설계함으로써 한국어 음성 특징 패턴을 효율적으로 추출하는 MF-Conformer 를 제안한다. 제안된 모델은 AIHub 에서 제공되는 공용의 한국어 자유발화 음성 데이터셋인 KsponSpeech 에 의해 평가되었으며, 기존의 모델들에 비해 향상된 성능을 보임을 확인하였다.