http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Performance Improvement of CELP Vocoder Using New Codebook Search Method
Park, Hochong 광운대학교 신기술연구소 1998 신기술연구소논문집 Vol.27 No.-
CELP 음성 압축기의 성능을 향상시키는 방법을 제안한다 각 코드북 부프레임에서 최적의 코드 벡터 후보를 다수 구하고. 연속된 두 코드북 부프레임에 대한 코드북 최적화 과정을 통하여 최종의 최적 코드벡터와 이득을 구한다. 이 방법을 이용하면 첫 코드북 부프래임의 최적 코드벡터가 두 번째 코드북 부프레임에 포함되는 미래의 입력에 영향을 받게 되어 향상된 성능을 얻게 된다. 계산량을 조절하기 위한 방법도 제공된다. 모의실험 결과 제안된 방법을 사용한 IS-96A QCELP 음성 압축기가 기존의 QCELP에 비하여 향상된 음질의 합성음을 만들어내었으며, 각 코드복 부프레임에 3개의 후보를 선택할 경우 SNRseg가 0.21dB 향상되었다. A technique to improve the performance of CELP vocoder is proposed. In each codebook subframe, candidates for the optimal codevector are selected, then optimization over two consecutive codebook subframes is conducted to determine the final optimized codevector and gain of each subframe. In this way, optimal codevector selected in the first codebook subframeis affected by the future input in the second codebook subframe without inserting additionala1 gorithmic delay, resulting in Performance improvement. A Procedure to control the computational load is also provided. The simulations show that the IS-96A QCELP vocoder adopting the proposed method produces an enhanced synthesized speech with SNRseg increase of 0.21dB when 3 candidates are used in each codebook subframe compared to the conventional QCELP
박호종 광운대학교 신기술연구소 1999 신기술연구소논문집 Vol.28 No.-
본 논문에서는 국내 CDMA, PCS 시스템의 표준 음성 압축기로 사용되고 있고 IMT-2000의 표준 음 성 압축기 후보로 추진되고 있는 EVRC 음성 압축기의 계산량감소를 위한 새로운 코드북 검색 방법을 제안한다. 제안된 방법은 두 단계 검색 과정을 가지며, 첫 단계에서는 완전 순차적 검색 방법을 통하여 매우 빠르게 대략적인 코드 벡터를 찾는다. 두 번째 단계에서는 앞에서 선택된 코드 벡터의 각 펄스의 중요도를 계산하여 역할이 적은 펄스를 제거하고 새로운 펄스로 교환하는 펄스 교환 과정을 통하여 코드 벡터의 성능을 향상시킨다. 제안된 방법은 표준에서 사용하는 코드북 검색 방법의 1/2 이하의 계산량만을 가지고 표준보다 더 우수한 성능의 코드 벡터를 찾으며, 다양한 음성 신호를 이용한 모의 실험을 통하여 이 결과를 확인하였다. This paper proposes new codebook search method with reduced complexity for EVRC speech coder which Is the standard speech coder for Korean CDMA and PCS systems and a candidate for IMT-2000. The proposed method is based on two-stage search. At the first stage, a coarse codevector is selected using a vert fast sequential search scheme. At the second stage, pulse replacement procedure is conducted, which measures the contribution of each pulse in the selected codevector and replaces the least important pulse with a new pulse, resulting in better codevector as the procedure is repeated. The proposed method requires less than half of the computaional complexity compared to the method described in the EVRC standard, but finds better codevector than the standard does, which is confirmed by the simulation using various speech data.
하모닉 구조 확장과 NMF 기반의 인공 대역 확장 기술
김기준(Kijun Kim),박호종(Hochong Park) 대한전자공학회 2013 전자공학회논문지 Vol.50 No.12
본 논문에서는 주파수 영역에서 협대역 신호를 광대역으로 확장하는 새로운 인공 대역 확장 기술을 제안한다. 제안한 기술은 협대역 신호를 여기 신호와 스펙트럼 포락선 성분으로 분리하고, 주파수 영역에서 각각 독립적인 방법으로 확장한다. 여기 신호는 저대역의 하모닉 구조가 고대역에서 유지되도록 확장하고, 스펙트럼 포락선은 부대역별 에너지를 기반으로 NMF 방법으로 확장한다. 마지막으로 시간 축에서 프레임 사이의 상관관계를 기반으로 스펙트럼 위상을 결정하여 최종 광대역 신호를 생성한다. 주관적 청취 평가를 통하여 제안한 방법으로 대역 확장된 신호가 원 협대역 신호보다 음질이 향상된 것을 확인하였다. In this paper, we propose a new method for artificial bandwidth extension of narrow-band signal in frequency domain. In the proposed method, a narrow-band signal is decomposed into excitation signal and spectral envelope, which are extended independently in frequency domain. The excitation signal is extended such that low-band harmonic structure is maintained in high band, and the spectral envelope is extended based on sub-band energy using NMF. Finally, the spectral phase is determined based on signal correlation between frames in time domain, resulting in the final wide-band signal. The subjective evaluation verified that the wide-band signal generated by the proposed method has a higher quality than the original narrow-band signal.
Implementation of a practical query-by-singing/humming (QbSH) system and its commercial applications
Chai-Jong Song,Hochong Park,Chang-Mo Yang,Sei-Jin Jang,Seok-Pil Lee IEEE 2013 IEEE TRANSACTIONS ON CONSUMER ELECTRONICS - Vol.59 No.2
<P>In this paper, a practical query-bysinging/humming (QbSH) system is proposed that uses polyphonic music tracks such as MP3 and AAC files to create the reference database (DB) unlike conventional QbSH systems. To create the reference DB, we propose a method for melody extraction from polyphonic music signals based on harmonic structure. In addition, we propose a matching engine using modified dynamic time warping (DTW) that uses chroma-scale representation and asymmetric path of DTW to reduce the influence of melody extraction error. We implemented three different prototypes for its commercial applications like smart phone, laptop and karaoke. We evaluated the performance of the proposed practical QbSH system with monophonic and polyphonic music datasets, and confirmed that it has an acceptable performance for commercial applications.</P>
이동규(Donggyu Lee),김기준(Kijun Kim),박호종(Hochong Park) 한국방송·미디어공학회 2012 한국방송공학회 학술발표대회 논문집 Vol.2012 No.7
본 논문에서는 박자 분류 방법을 사용하여 다성 음악 신호의 템포 쌍을 검출하는 방법을 제안한다. 템포를 검출하는 방법은 음의 시작점을 추출하여 음악의 주기적인 흐름을 파악한 뒤, 그 주기를 템포로 변환하는 과정으로 구성된다. 제안한 기술은 템포로 추측되는 배수 관계의 템포 후보를 추출한 뒤, 템포 후보를 박자에 따라 분류하고 곡의 빠르기를 고려하여 최종 템포 쌍을 검출한다. 제안한 방법을 사용하여 높은 정확도로 템포 쌍이 검출되는 것을 확인하였다.
한택진(Han, Taek-Jin),박호종(Park, Hochong) 한국방송·미디어공학회 2014 한국방송공학회 학술발표대회 논문집 Vol.2014 No.11
본 논문에서는 다양한 스테레오 환경에서도 정확한 음원 위치 추정이 가능한 방법을 제안한다. 기존의 음원 위치 추정 방법은 방향성을 가지고 있는 주성분 신호와 방향성이 없는 주변 성분으로 구성된 스테레오 환경에서만 음원의 위치 추정이 가능했다. 그러나 현재 제공되고 있는 스테레오 신호는 방향성을 가지는 다수의 음원으로 구성되어있고, 기존의 음원 위치 추정방법으로는 정확한 음원 위치 추정이 어렵다. 이와 같은 문제 때문에 다수의 음원을 분리한 뒤, 음원의 위치를 추정하는 방법이 제안되었다. 그러나 음원의 분리 과정에서 생기는 분리 오차가 커서 음원 위치 추정이 정확하지 않다. 이에 본 논문에서는 정확한 음원 위치 추정을 위하여 음원 분리와 음원 위치 추정이 통합된 새로운 알고리즘을 제안한다. 제안한 알고리즘은 음원위치를 기존의 방법보다 정확하게 추정하는 것을 확인할 수 있었다.