http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
RPE-LTP와 VSELP 음성부호화기의 비교에 관한 연구
박대덕,김화준,심재훈,유재희,정하봉,서정하 한국통신학회 1994 韓國通信學會論文誌 Vol.19 No.9
현재 북미, 유럽, 일본 등에서는 디지털 이동 통신용 음성부호화 방식의 표준을 확정하여 세부기술을 경쟁적으로 개발하고 있으나, 아직까지 우리나라는 이를 확정하지 못하고 있는 실정이다. 본 논문에서는 유럽 표준인 RPE-LTP와 북미 표준인 VSELP 알고리즘을 소스 코팅에 중점을 두어 연구, 비교 및 검토하였다. 각 음성부호화기에 대해 종합적으로 분석 및 비교한 후, 성능 개선 방안에 대하여 논의하였다. 또한, 실시간 처리에 가장 큰 영향을 미치는 연산 횟수를 계산, 비교하였다. 아울러 각 부호화기의 알고리즘을 구체화하여 한국인 음성데이타에 대하여 모의 실험을 수행하였으며, 모의 실험 평가결과로서 구간 신호대 잡음비와 5-포인트 MOS를 비교하였다. 연산횟수는 VSELP 부호기의 곱센연산횟수가 가장 많은 것으로 나타났다. 26가지 음성 데이타에 대하여 구간 신호대 잡음비는 VSELP가 RPE-LTP에 비해 큰 것으로 계산되었고, 5-포인트 MOS 실험을 실시한 결과 VSELP가 RPE-LTP에 비해 음질이 동등하거나 보다 우수한 것으로 평가되었다. Until recently, they decided the standard of the digital mobile communication speech coding method and competively developed the more detailed techniques in North America, Europe, Japan, etc. But, we have not yet determined. In this paper, we compared the RPE-LTP speech coding algorithm, standard in Europe, with the VSELP speech coding algorith, standard in North America, with respect to the soruce coding. We described the comprehensive verification and comparison with each speech coder, and discussed the improvement plan. Next, we also compared the number of computations which affects the real time processing seriously. Moreover, we performed the simulation with the Korean speech data, concreting the algorithm of each speech coder. Finally, we compared the performance of each speech coder with segmental SNR and 5-point MOS. The number of computations was calculated, and the result was that the number of multiplication computing times of VSELP speech encoder was the largest. With 26 speech data, the segmental SNR of VSELP was calculated larger than that of RPE-LTP. The 5-point MOS test was performed, and the result was that the basic speech quality of VSELP was equivalent or better than that of RPE-LTP.
자연스러운 여성 합성음을 위한 한국어의 피치 변화 법칙
김중원,박대덕,김보현,권철홍,Kim, Chung-Won,Park, Dae-Duck,Kim, Boh-Hyun,Kwon, Cheol-Hong 한국음향학회 1996 韓國音響學會誌 Vol.15 No.6
본 논문은 자연스러운 여성 합성음을 위한 피치 변화 법칙을 세웠다. 피치 변화 법칙이 적용되는 기본 단위, 즉 억양구는 주로 어절(들)로 이것의 첫번째, 두번째, 마지막 음절의 피치값을 연결해 피치 변화 곡선을 형성하였는데, 첫번째, 두번째 음절의 피치값은 각 음절의 초성에 따라, 마지막 음절의 피치값은 기능어의 종류에 따라 결정되었다. 억양구 사이에는 '쉼(pause)이 있는 경계' 또는 '쉼이 없는 경계'가 오며, 쉼이 있는 경계에는 relaxation이 있다. 이러한 억양구의 피치 변화 곡선, 경계 현상들이 모여 한 문장의 피치 턴을 만들었다. In this paper we make a rule of pitch variation for a natural synthetic female voice. Intonation phrase, which is the basic unit the rule is applied to, mostly consists of a syllable or syllables. The pitch values of the first, second, and final syllables make up the pitch contour of the intonation phrase. Those of the first and second syllable are determined by the initial consonants of the respective syllables, and that of the final syllable by the type of the function word. There are two kinds of boundaries between intonation phrases. One is a boundary with pause, and the other is a boundary without pause. The pitch contour of the intonation phrase with the boundary phenomena determines the pitch pattern of a sentence.