
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
상매 신라대학교 일반대학원 2023 국내석사
‘지구촌’의 세계 경제가 발전함에 따라 한국과 다른 나라 간의 경제, 문화 교류가 나날이 증가하고 있으며, 한국어 학습에 대한 외국인의 수요가 급격히 증가하고 있다. 그러나 외국인 한국어 학습 환경과 교육 여건의 한계로 인해 외국인 학습자는 일반적으로 말하기 학습이 어려운 상황이다. 컴퓨터 과학과 기술이 발전하고 언어 공부와 학습방법의 진보로 컴퓨터 보조 언어 학습 기술은 이러한 문제를 해결할 수 있게 되었다. 본 논문에서는 학습자의 말하기 능력과 발음 정확도를 자동으로 분석하고 평가할 수 있는 한국어 발음 평가 학습 보조 시스템을 제안하였다. 트랜스포머(Transfomer)는 긴 시퀀스 종속성을 추출하는 데 더 효과적인 반면에 컨볼루션은 로컬 기능 추출과 표현을 잘 할 수 있다. 제안하는 콘포머(Conformer) 음성 인식모델은 Transformer의 효과를 향상시키기 위해 Convolution을 사용하였다. 긴 시퀀스 및 로컬 특징 추출을 위한 모델을 개선하기 위해 Transformer의 인코더 레이어에 컨볼루션을 추가한다. 제안된 방법에서 Zeroth-korean 테스트세트에서 9.44%의 CER을 달성했다. 시스템의 성능을 분석하기 위하여 CNN-CTC을 적용한 시스템과 비교하였고, 더 좋은 결과를 보이는 것을 확인 할 수 있었다. 또한 긴 음성 인식에 대한 CNN-CTC 네트워크 모델의 한계와 낮은 인식률 문제를 해결할 수 있었다. 본 연구를 통해 한국어 음성 인식에 있어 콘포머의 성능이 우수함을 확인하였다. With the development of the global economy in the "global village" and the increase in economic and cultural exchanges between Korea and other countries, the demand for foreigners to learn Korean is rapidly increasing. However, it has been considered difficult for foreign language learners to learn to speak due to the limitations of foreign language learning environment and education. With the development of computer science, computing technology and the advancement of language learning methods, computer-assisted language learning techniques have been able to solve these problems. Therefore, in this paper, I propose a Korean pronunciation assessment system that can automatically analyze and assess learners' speaking ability and pronunciation accuracy. The transformer model is known to be more effective in extracting long sequence dependencies, while convolution is good for extracting local features. The proposed Conformer speech recognition model uses convolution to improve the effectiveness of the Transformer and added to the encoder layer of the Transformer. According to the study, Conformer achieved a CER of 9.44% on the Zeroth-korean test set. A comparison with CNN-CTC model was done and Conformer model showed better performance. And it solves the problem of CNN-CTC network’s limitations and low recognition rate for long speech recognition. In summary, it can be said that this paper presents an academic research agenda for the development of speech recognition, which can be considered effective and of practical importance.