http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Performance Improvement of CELP Vocoder Using New Codebook Search Method
Park, Hochong 광운대학교 신기술연구소 1998 신기술연구소논문집 Vol.27 No.-
CELP 음성 압축기의 성능을 향상시키는 방법을 제안한다 각 코드북 부프레임에서 최적의 코드 벡터 후보를 다수 구하고. 연속된 두 코드북 부프레임에 대한 코드북 최적화 과정을 통하여 최종의 최적 코드벡터와 이득을 구한다. 이 방법을 이용하면 첫 코드북 부프래임의 최적 코드벡터가 두 번째 코드북 부프레임에 포함되는 미래의 입력에 영향을 받게 되어 향상된 성능을 얻게 된다. 계산량을 조절하기 위한 방법도 제공된다. 모의실험 결과 제안된 방법을 사용한 IS-96A QCELP 음성 압축기가 기존의 QCELP에 비하여 향상된 음질의 합성음을 만들어내었으며, 각 코드복 부프레임에 3개의 후보를 선택할 경우 SNRseg가 0.21dB 향상되었다. A technique to improve the performance of CELP vocoder is proposed. In each codebook subframe, candidates for the optimal codevector are selected, then optimization over two consecutive codebook subframes is conducted to determine the final optimized codevector and gain of each subframe. In this way, optimal codevector selected in the first codebook subframeis affected by the future input in the second codebook subframe without inserting additionala1 gorithmic delay, resulting in Performance improvement. A Procedure to control the computational load is also provided. The simulations show that the IS-96A QCELP vocoder adopting the proposed method produces an enhanced synthesized speech with SNRseg increase of 0.21dB when 3 candidates are used in each codebook subframe compared to the conventional QCELP
박호종 광운대학교 신기술연구소 1999 신기술연구소논문집 Vol.28 No.-
본 논문에서는 국내 CDMA, PCS 시스템의 표준 음성 압축기로 사용되고 있고 IMT-2000의 표준 음 성 압축기 후보로 추진되고 있는 EVRC 음성 압축기의 계산량감소를 위한 새로운 코드북 검색 방법을 제안한다. 제안된 방법은 두 단계 검색 과정을 가지며, 첫 단계에서는 완전 순차적 검색 방법을 통하여 매우 빠르게 대략적인 코드 벡터를 찾는다. 두 번째 단계에서는 앞에서 선택된 코드 벡터의 각 펄스의 중요도를 계산하여 역할이 적은 펄스를 제거하고 새로운 펄스로 교환하는 펄스 교환 과정을 통하여 코드 벡터의 성능을 향상시킨다. 제안된 방법은 표준에서 사용하는 코드북 검색 방법의 1/2 이하의 계산량만을 가지고 표준보다 더 우수한 성능의 코드 벡터를 찾으며, 다양한 음성 신호를 이용한 모의 실험을 통하여 이 결과를 확인하였다. This paper proposes new codebook search method with reduced complexity for EVRC speech coder which Is the standard speech coder for Korean CDMA and PCS systems and a candidate for IMT-2000. The proposed method is based on two-stage search. At the first stage, a coarse codevector is selected using a vert fast sequential search scheme. At the second stage, pulse replacement procedure is conducted, which measures the contribution of each pulse in the selected codevector and replaces the least important pulse with a new pulse, resulting in better codevector as the procedure is repeated. The proposed method requires less than half of the computaional complexity compared to the method described in the EVRC standard, but finds better codevector than the standard does, which is confirmed by the simulation using various speech data.
Implementation of a practical query-by-singing/humming (QbSH) system and its commercial applications
Chai-Jong Song,Hochong Park,Chang-Mo Yang,Sei-Jin Jang,Seok-Pil Lee IEEE 2013 IEEE TRANSACTIONS ON CONSUMER ELECTRONICS - Vol.59 No.2
<P>In this paper, a practical query-bysinging/humming (QbSH) system is proposed that uses polyphonic music tracks such as MP3 and AAC files to create the reference database (DB) unlike conventional QbSH systems. To create the reference DB, we propose a method for melody extraction from polyphonic music signals based on harmonic structure. In addition, we propose a matching engine using modified dynamic time warping (DTW) that uses chroma-scale representation and asymmetric path of DTW to reduce the influence of melody extraction error. We implemented three different prototypes for its commercial applications like smart phone, laptop and karaoke. We evaluated the performance of the proposed practical QbSH system with monophonic and polyphonic music datasets, and confirmed that it has an acceptable performance for commercial applications.</P>
이동규(Donggyu Lee),김기준(Kijun Kim),박호종(Hochong Park) 한국방송·미디어공학회 2012 한국방송공학회 학술발표대회 논문집 Vol.2012 No.7
본 논문에서는 박자 분류 방법을 사용하여 다성 음악 신호의 템포 쌍을 검출하는 방법을 제안한다. 템포를 검출하는 방법은 음의 시작점을 추출하여 음악의 주기적인 흐름을 파악한 뒤, 그 주기를 템포로 변환하는 과정으로 구성된다. 제안한 기술은 템포로 추측되는 배수 관계의 템포 후보를 추출한 뒤, 템포 후보를 박자에 따라 분류하고 곡의 빠르기를 고려하여 최종 템포 쌍을 검출한다. 제안한 방법을 사용하여 높은 정확도로 템포 쌍이 검출되는 것을 확인하였다.
Wave-U-Net을 이용한 오디오 부호화의 성능 향상 기법
안순호(An, Soonho),김재원(Kim, Jaewon),박호종(Park, Hochong) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
본 논문에서는 Wave-U-Net 기반의 오디오 부호화 성능 향상 기법을 제안한다. 기존의 인공지능 기반 오디오 부호화 기술은 오디오의 주파수 정보를 복원하는 방식이기 때문에 완전한 복원을 위해서 주파수의 위상 정보를 별도로 부호화하여 전송해야 한다는 문제점이 있다. 따라서 본 논문에서는 오디오 부호화의 성능 향상을 위해 음원의 주파수 분석을 필요로 하지 않은 end-to-end 모델인 Wave-U-Net을 사용할 것을 제안한다. Wave-U-Net을 사용한 음원이 사용 전의 음원보다 객관적, 주관적 평가 지표에서 우수한 성능을 보이는 것을 확인하였다.