http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
행렬 분해 기반 변형된 멀티헤드 셀프 어텐션을 활용한 Conformer 음성인식 모델
이현규(Hyeon Kyu Lee),노태엽(Tae-Yup Roh),최영석(Young-Seok Choi) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
최근, 음성인식(Automatic Speech Recognition, ASR) 연구 분야에서 Conformer 는 다양한 딥러닝 모델들과 융합 및 응용되어 높은 인지 성능을 보여주며 많은 음성인식 연구자들에게 각광받고 있다. 하지만, 대부분의 음성인식 연구 분야는 영어 등의 언어에서 활발히 진행되고 있으며 한국어 기반의 음성인식 연구는 여전히 불모지이다. 본 연구에서는 한국어 음성인식 성능 향상을 위해 행렬 분해(Matrix Factorization, MF) 기법에서 착안하여 Conformer 모델의 구조를 재설계함으로써 한국어 음성 특징 패턴을 효율적으로 추출하는 MF-Conformer 를 제안한다. 제안된 모델은 AIHub 에서 제공되는 공용의 한국어 자유발화 음성 데이터셋인 KsponSpeech 에 의해 평가되었으며, 기존의 모델들에 비해 향상된 성능을 보임을 확인하였다.
은닉 마르코프 모델 기반 손 제스처 적출을 위한 임계치 모델
이현규(Hyeon-Kyu Lee),김호연(Hoyon Kim),김진형(Jin H. Kim) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.1
본 논문에서는 실시간 제스처 인식 시스템을 위하여 연속적인 손동작으로부터 제스처 부분을 적출(spotting)하는 새로운 방법을 제안한다. 제안된 방법은 제스처의 구분문제(segmentation problem)를 해결할 수 있고 시공간적인 변이를 흡수할 수 있는 은닉 마르코프 모델에 기초를 두고 있다. 특히, 입력패턴으로부터 제스처가 아닌 패턴의 제거를 위하여, 임계치 모델(threshold model)이라는 새로운 모델을 도입하여 입력패턴의 임계 유사도를 계산하고 이를 이용하여 입력패턴이 제스처 패턴과 얼마나 유사한 지를 판정해 주도록 한다. 제안된 방법을 이용하면 연속적인 손동작으로부터 93.38%의 신뢰도로 의미있는 제스처를 추출할 수 있다. This paper proposes a new method of gesture spotting which extracts meaningful gestures from continuous hand motions for real-time gesture recognition systems. The proposed method is based on the HMM which can solve segmentation problem and can absorb spatio-temporal variability of gestures. To remove oem-gesture patterns from input patterns, we introduce a new model called a threshold model that generates threshold likelihood of an input pattern and is used to qualify an input pattern as a gesture. The proposed approach has extracted meaningful gestures from continuous hand motions with 93.38% reliability.