http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
배명진,한기천,차진종,Bae, Myung-Jin,Han, Ki-Cheon,Cha, Jin-Jong 한국음향학회 1997 韓國音響學會誌 Vol.16 No.2
음성신호처리 분야에서 정확한 피치검출은 중요하고 필요하다. 지금까지 제안된 피치검출 알고리즘들은 음성신호의 다양성으로 인해 피치를 정확히 검출하기가 어렵다. 본 논문에서는 PCM과 같은 균일 양자화기의 잔여신호에 대해 음성신호의 기본주기를 검출하는 새로운 피치검출법을 제안하였다. 제안한 방법은 무잡음 음성에 대해 평균 0.25%의 조오율이 그리고 0dB의 SNR에 대해서는 평균 3.39%의 조오율이 나타나는 정확성을 보였다. 또한 음소의 천이영역이나 배경잡음 하에서도 피치검출의 정확도가 개선된 피치검출의 결과를 얻었다. In speech signal processing, it is necessary and important to detect exactly the pitch. The algorithms of pitch extraction which have been proposed until now are difficult exactly pitches over wide range speech signals. In this paper, thus, we proposed a new pitch detection algorithm that finds the fundamental period of speech signal in the residual signal quantized by the uniform quantizer as PCM. The proposed method shows little gross error of average 0.25% for clean speech and average 3.39% for SNR of 0dB. It also achieves results of the pitch contours, improving the accuracy of pitch detection in transient phonemes and noise environments.
An Effective Storage Method During A Sampling of Speech Signals
배명진,이인섭,안수길,Bae, Myungjin,Lee, Inseop,ANN, Souguil The Institute of Electronics and Information Engin 1987 전자공학회논문지 Vol.24 No.3
It is necessary for the speech samples to be stored in memory buffer before speech analyzers without a real time processor process them. In this paper, we propose an algorithm that uses the buffer efficiently, when the analog speech signal is converted to the digital samples by the analog to digital converter. In order to implement this method in real time, the buffer is divided into the starting buffer and the remaining buffer. Until a voiced speech is found, the converted samples are sequentially stored in the starting buffer, and then the buffer is shifted. When a voiced speech is found, the next samples are sequentally recorded in the remaining buffer.
음성응답과 기록을 통한 가정 방문객 관리 시스템의 구현 -쌍 1차 차분을 통한 음성 파형부호화용 예측기-
배명진,이미숙,임운천,Bae, Myung-Jin,Lee, Mi-Suk,Lim, Un-Chun 한국음향학회 1992 韓國音響學會誌 Vol.11 No.1
음성표본간의 자기상관관계를 살펴보면 인접한 양쪽 표본의 자기상관관계가 시간지연된 여러 차수의 것보다는 크게 나타난다. 그러므로 현재표본을 기준으로 몇 차 지연된 과거값을 이용하여 현재값을 에측하는 것보다는 바로 인접한 과거 및 미래의 표본에 의해 현재의 표본값을 예측하는 것이 더 효과적이다. 따라서 본 논문에서는 한 표본 미래값과 한 표본 과거값을 취하여 현재의 표본을 예측하는 파형부호화용 예측기를 새로이 제안하였다. 제안된 예측기는 CCITT-표준 ADPCM보다 예측이득이 최고 9dB까지 높게 얻어졌다. We can see the fact in the autocorrelation of the speech samples that the autocorrelation of adjacent past and next sample is larger than the autocorrelation of several order time delayed samples. It is more effective to use the adjacent past and next sample for prediction of present sample than only use the several order time delayed past. Thus, in this paper, we proposed a new predictor for the wave form coding that predict the present sample by using the one past and next samples. The proposed predictor has higher prediction gain up to 9dB than that of the CCITT-ADPCM.
A Study on the Energy Extraction Using G-peak from the Speech Production Model
배명진,임재열,안수길,Bae, Myungjin,Rheem, Jaeyeol,ANN, Souguil The Institute of Electronics and Information Engin 1987 전자공학회논문지 Vol.24 No.3
By the speech production model, the first positive peak in a pitch interval of the voiced speech is mainly affected by the glottis and the first formant component, known as a typical energy source of the voiced speech. From these characteristics, the energy parameter can be replaced by the area of the area of the positve peak in a pitch interval, which parameter is generally used for classification of speech signals. In this method, the changed energy parameter is independent of window length applied for analysis, and the pitch can be extracted smultaneously. Furthermore, the energy can be extracted in the pitch period unit.
배명진,이을재,안수길,Bae, Myung-Jin,Lee, Eul-jae,Ann, Sou-Guil 한국음향학회 1990 韓國音響學會誌 Vol.9 No.4
연속음 인식을 위해서는 음성신호의 음성학적 경계를 결정짓는 분할과정이 필요하다. 본 논문에서는 음성신호의 전이구간을 결정하기 위한 파라미터로 한 프레임 내의 비대칭율을 제안하였다. 제안된 그 프레임에서 음성진폭의 변화율을 대별하며, 인근 프레임의 비대칭율과 비교하면 현재의 프레임이 정상상태 혹은 전이영역에 있는지를 구별할 수 있게 해 준다. To recognize continued speech, it is necessary to segment the connected acoustic signal into phonetic units, In this paper, as a parameter to detect transition regions in continued speech, we propose a new asymmetrical rate. The suggested rate represents a change rate of magnitude of speech signals. As comparing this rate with other rate in adjacent frame, the state of the frame can be distinguished between steady state and transient state.
배경잡음하에서 주파수영역 피치검출에 관한 연구 -스펙트럼 AMDF에 의한 제 1포먼트 영향 제거법-
배명진,박찬수,안수길,Bae, Myung-Jin,Park, Chan-Sou,Ann, Sou-Guil 한국음향학회 1991 韓國音響學會誌 Vol.10 No.4
Detecting the fundamental frequency(Fo) of the speech signal is a problem in many speech applications. A problem of the pitch detection method in the frequency domain is occurred by the first formant and the background noise. Thus, in this paper, we proposed a pitch detection algorithm in the frequency domain that reduces the effects of the first formant and the background noise by the spectral AMDF function. Several computer simulation results showed that the proposed algorithm was very effective for fundamental frequency detection. 음성 신호처리 분야에서 기본주파수를 정확히 검출하는 것이 아주 중요하다. 주파수 영역에서 피치검출 방법의 문제점은 대체로 배경잡음이나 제 1 포먼트에 의하여 발생한다. 그러므로, 본 논문에서는 스펙트럼 AMDF 함수를 이용하여 잡음의 영향이나 제 1 포먼트의 영향을 줄이는 주파수영역 피치검출 앨고리즘을 제안하였다. 여러 가지 컴퓨터 시뮬레이션 결과 제안한 앨고리즘이 기본주파수 검출에 효과적으로 나타났다.
배명진,장호성 한국음향학회 1993 韓國音響學會誌 Vol.12 No.3
부호 여기된 선형예측 음성보코더들은 4800bps의 낮은 전송율에서도 좋은 음질을 제공한다. CELP 형 보코더의 피치검색법의 문제점중에 하나는 피치 검출시의 조오류에 의해 예측이득이 저하된다는 점이다. 본 논문에서 우리는 CELP 보코더의 피치 예측이득을 개선하는 한 새로운 피치검색법을 제안하였다. 제안한 방법은 예비피치들을 검출하여 이들중 피치 예측이득이 최대인 값을 선정하는 방법을 적용하였다. 이 방법을 여러 화자의 발성에 대해 적용한 결과 피치 예측이득율 6.1% 정도 개선할 수 있었다.