http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
An Efficient Representation Method for ICLD with Robustness to Spectral Distortion
Seungkwon Beack,강경옥,한민수,Jeongil Seo 한국전자통신연구원 2005 ETRI Journal Vol.27 No.3
The inter-channel level difference (ICLD) is a cue parameter to estimate spectral information in binaural cue coding that has been recently in the spotlight as a multichannel audio signal compression technique. Even though the ICLD is an essential parameter, it is generally distorted by quantization. In this paper, a new modified ICLD representation method to minimize the quantization distortion is proposed by adopting a flexible determination of the reference channel and the unidirectional quantization scheme. Our experimental result confirms that the proposed method improves the multichannel audio output quality even with the reduced bit-rate.
An Efficient Time-Frequency Representation for Parametric-Based Audio Object Coding
Seungkwon Beack,Taejin Lee,Minje Kim,강경옥 한국전자통신연구원 2011 ETRI Journal Vol.33 No.6
Object-based audio coding can provide new music applications with interactivity. To efficiently compress a lot of target audio objects, a subband-based parametric coding scheme has been adopted for MPEG spatial audio object coding. In this letter, the time-frequency (T/F) subband analysis structure is investigated. A reconfigured T/F structure is also proposed to enhance the generating performance of sound scenes such as ‘karaoke’ and ‘solo’ play in interactive music scenarios. From the experimental results, it was confirmed that the proposed scheme remarkably improves the SNR and sound quality.
개선된 시간축 정보량 감축 기술 기반 오디오 부호화 기술
백승권(Seungkwon Beack),임우택(Wootaek Lim),이태진(Taejin Lee) 한국방송·미디어공학회 2021 한국방송공학회 학술발표대회 논문집 Vol.2021 No.6
본 논문에서는 시간축 정보량을 감축하여 오디오 부호화 효율을 개선하기 위한 기술을 제안한다. 시간축 정보량 감축 방법은 종전의 오디오 코덱에서도 활용되었던 대표적인 기술로 TNS(temporal noise shaping) 기술이 있다. 그러나 TNS 기술은 오디오 신호의 천이구간에서 선별적으로 유효하게 동작하며 그 효율성도 간헐적으로 나타나는데 이는 MDCT(modified discrete cosine transform)에서 예측 과정을 수행하는 구조적인 문제를 갖고 있기 때문이다. 본 논문에서는 종전의 TNS 기술의 취약점을 보완한 ITES(intensive temporal envelope shaping) 기술을 제안하였다. 제안 기술은 TNS 보다 유효한 오디오 시간영역 정보량을 예측하고 감축하였으며, 개선된 음질을 나타냄을 주관적 평가를 수행하여 검증하였다.
백승권(Seungkwon Beack),임우택(Wootaek Lim),이태진(Taejin Lee) 한국방송·미디어공학회 2020 한국방송공학회 학술발표대회 논문집 Vol.2020 No.7
본 논문은 USAC(Unified Speech and Audio Coding) 오디오 부호화 기술의 성능 개선에 관련한 것이다. USAC 은 FD(Frequency domain) 양자화 모듈과 LPD(Linear prediction domain) 양자화 모듈을 탑재하고 있다. 본 논문에서는 LPD 모드로부터 생성되는 잔차신호에 대하여 주파수 영역에서 다중밴드로 분할하고 각 밴드 별 양자화를 독립적으로 수행함으로써 USAC 의 LPD 모드의 양자화 효율을 개선하였다. 그 결과 동일 조건에서 제안방법이 기존의 LPD 모드의 성능을 음질 측면에서 향상시킴을 확인할 수 있었다.
오디오 채널 신호의 압축을 위한 공간 큐의 효율적 표현 방법
백승권(Beack Seungkwon),김민제(Kim Minje),이태진(Lee Taejin),장대영(Jang Daeyoung),강경옥(Kang Kyeongok) 한국방송·미디어공학회 2008 한국방송공학회 학술발표대회 논문집 Vol.2008 No.-
본 논문은 공간영역에서의 오디오 채널 신호의 압축 방법에 있어서, 공간 파라메터의 효율적인 표현 방법을 제안하려 한다. 대상이 되는 공간 파라메터는 인간청각의 ILD(Internaural Level Difference) 인지와 관련한 공간 파라메터에 관한 것으로 ICLD(Inter-Channel Level Difference) 파라메터의 표현방법 관한 것이다. 본 논문의 목적은, ICLD의 통계적 특성을 분석하고 이에 충실한 표현방법을 제안함으로써, 양자화 시 기존 표현 방법보다 왜곡율을 개선시킴으로써 복원된 오디오 신호의 충실도를 높이는 것을 목적으로 한다. 따라서 본 논문에서는, 새로운 ICLD 표현 방법을 소개하고 이에 대한 이론적 통계적 근거를 제시하며, 실험결과로써 기존 방법과 비교된 왜곡율 측정(distortion measure) 결과를 제시하여 제안된 방법의 우수성을 입증한다.
Improved Channel Level Difference Quantization for Spatial Audio Coding
김광기,Seungkwon Beack,서정일,Daeyoung Jang,한민수 한국전자통신연구원 2007 ETRI Journal Vol.29 No.1
The channel level difference (CLD) is a main parameter in the reference model 0 (RM0) for MPEG Surround. Nevertheless, the CLD quantization method in the RM0 has problems such as the lack of theoretical background and inappropriate quantization levels. In this letter, a new CLD quantization method is proposed based on the virtual source location information which has strength in the quantization process. From experimental results, it is confirmed that the proposed scheme greatly reduces the quantization distortions measured in dB and degrees without any additional complexity.
Adaptive TCX Windowing Technology for Unified Structure MPEG-D USAC
Taejin Lee,Seungkwon Beack,강경옥,김환우 한국전자통신연구원 2012 ETRI Journal Vol.34 No.3
The MPEG-D unified speech and audio coding (USAC)standardization process was initiated by MPEG to develop an audio codec that is able to provide consistent quality for mixed speech and music contents. The current USAC reference model structure consists of frequency domain (FD) and linear prediction domain (LPD) core modules and is controlled using a signal classifier tool. In this letter, we propose an LPD singlemode USAC structure using an adaptive widowing-based transform-coded excitation module. We tested our system using official test items for all mono-evaluation modes. The results of the experiment show that the objective and subjective performances of the proposed single-mode USAC system are better than those of the FD/LPD dual-mode USAC system.
Design and Development of T-DMB Multichannel Audio Service System Based on Spatial Audio Coding
이용주,서정일,Seungkwon Beack,Daeyoung Jang,강경옥,김진웅,홍진우 한국전자통신연구원 2009 ETRI Journal Vol.31 No.4
In this paper, a terrestrial digital multimedia broadcasting (T-DMB) multichannel audio broadcasting system based on spatial audio coding is presented. The proposed system provides realistic multichannel audio service via T-DMB with a small increase of data rate as well as backward compatibility with the conventional stereo-based T-DMB player. To reduce the data rate for additional multichannel audio signals, we compress the multichannel audio signals using the sound source location cue coding algorithm, which is an efficient parametric multichannel audio compression technique. For compatibility, we use the dependent property of an elementary stream descriptor, and this property should be ignored in a conventional T-DMB player. To verify the feasibility of the proposed system, we implement the TDMB multichannel audio encoder and a prototype player. We perform a compatibility test using the T-DMB multichannel audio encoder and conventional T-DMB players. The test demonstrates that the proposed system is compatible with a conventional T-DMB player and that it can provide a promisingly rich audio service.