http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
우선경,강철호 광운대학교 신기술연구소 1997 신기술연구소논문집 Vol.26 No.-
본 논문에서는 Radial Basis Function(RBF) 신경망을 이용한 새로운 화자적응 방법을 제안한다. RBF 신경망은 구조적으로 은닉층과 출력층의 두 층으로 구성되어 있는 계층형 신경망으로서 지도학습으로 원하는 입출력간의 매핑을 한다. 은닉층 내의 각 노드는 입력패턴을 대표하는 중심점(center) 벡터들로 이루어지며 활성화 함수는 시그모이드 함수대신 지수함수로 대체된다. RBF 신경망의 초기 중심점 벡터들을 각각 기준화자의 단어로 구성하고 새로운 화자의 입력단어에 대해 중심점을 갱신함으로써 화자적응을 수행한다. 인식단어는 10개의 D. D. D 지역명을 사용하였고 기준화자를 포함한 화자 5명에 대해서 중심점을 갱신하는 경우와 갱신하지 않는 경우에 대해서 실험하였다. 시험화자의 경우 적응전의 평균 인식율 63.2%에 비해 중심점 갱신없이 출력층의 선형 가중치만 갱신한 경우는 15% 인식율이 향상되었으며 선형 가중치와 함께 중심점을 갱신한 경우는 26.3% 인식율이 향상되었다. In this paper, a new speaker adaptation method using RBF(Radial Basis Function) neural network is proposed. The RBF network is one of the layered neural networks which consist of hidden and output layer. Input-output mapping is provided by supervised learning. Each node in hidden layer includes a center vector which represents input patterns. The activation function of hidden layer substitutes exponential function for sigmoidal function. Initial centers of the RBF network are made of words or reference speaker and speaker adaptation is accomplished by updating centers of input words for new speakers. Ten D. D. D city names, uttered by five speakers including one reference speaker, are used to carry out the speech recognition experiments both with center update and without center update. For test speakers, the recognition rate of 15% is improved by only adjusting linear weights and 26.3% improved by updating both linear weights and center vectors compared with the average one of 63.2% before adaptation.