http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
상대전달함수의 역필터링을 이용한 자동차 환경에서의 마이크로폰 어레이 빔형성 기법
강홍구,황영수,윤대희,한철희,Kang Hong-Goo,Hwang Youngsoo,Youn Dae-Hee,Han Chul-Hee 한국음향학회 2006 韓國音響學會誌 Vol.25 No.1
본 논문에서는 상대전달함수의 역필터링 (inverse-filtering) 전처리를 수행한 후 MVDR (Minimum-Variance Distortionless Response) 빔형성기나 GSC (Generalized Sidelobe Canceller)를 수행하는 방법을 제안하였다. 제안된 방법은 기존의 RTF-MVDR 및 TF-GSC 보다 적은 계산량을 갖으며 최적해 측면에서 동등함을 보였다. 제안된 방법의 성능을 평가하기 위하여 자동차 환경에서 녹음된 음성 데이터베이스와 HTK를 이용하여 음성인식 실험을 수행하였다. 그 결과, 제안된 방법은 기존의 방법과 대등한 성능을 갖거나 적은 성능저하를 보였다. In this paper. we Propose a frequency domain beamforming algorithm composed of inverse-filtering stages followed by a MVDR (Minimum-Variance Distortionless Response) beamformer or a GSC (Generalized Sidelobe Canceller). The proposed method is shown to require less complexity than the conventional RTF-MVDR and TF-GSC. respectively, and it is shown that the Proposed method is equivalent to the conventional RTF-MVDR and TF-GSC in optimum solution. In order to evaluate the performance of the Proposed method. speech recognition experiments are performed using the speech database recorded in a car. The Proposed method shows equal or slightly degraded Performance comparing to the conventional methods in terms of the speech recognition rate.
강홍구 ( Hong-koo Kang ),지승구 ( Seung-goo Ji ),정현철 ( Hyun-cheol Jeong ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1
최근 변종 악성코드가 크게 증가하고 하나 이상의 악성코드로 이루어진 그룹 형태의 악성코드들이 빠르게 유포되고 있다. 이러한 그룹 형태의 악성코드와 변종 악성코드에 대한 효과적인 대응을 위해서는 악성코드 그룹 및 변종을 관리하고 안티바이러스 업체와 정보를 공유할 수 있는 시스템이 필요하다. 본 논문에서는 대용량 악성코드 분석 정보로부터 악성코드 그룹 및 변종 정보를 효율적으로 관리하고 공유하는 시스템을 제안하다. 악성코드 그룹 정보는 악성코드 행위를 기반으로 연계된 악성코드 정보들로 생성되고, 악성코드 변종 정보는 CFG 분석을 통한 악성코드간 유사도 정보로 생성된다. 본 논문에서 제안하는 시스템은 악성코드 그룹 및 변종 정보를 쉽게 검색하고 공유할 수 있기 때문에 다양한 악성코드 대응 시스템과 쉽게 연계될 수 있는 장점을 가지고 있다.
G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법
이민기,강홍구,Lee, Min-Ki,Kang, Hong-Goo 한국음향학회 2013 韓國音響學會誌 Vol.32 No.2
본 논문은 패킷 손실의 영향을 이용한 비 침입적 음질 평가 방법을 제안한다. 패킷 손실은 패킷 기반의 통신 시스템에서 음질을 저하시키는 주된 요소이며 그 영향은 코덱에 내장된 패킷 손실 은닉 알고리듬에 의해 결정된다. 패킷 손실 영향을 반영한 음질평가 시스템을 위해 VoIP 에서 협대역 코덱으로 사용되는 코덱 중 하나인 G.729를 선택하였으며, 음성 특징에 따른 패킷 손실 영향을 구분하기 위해서 G.729 코덱의 음성 파라미터를 이용한 한 음성 특성 분류기를 설계하였다. 이후, 각각의 패킷 특성에 따른 음질 저하의 정도를 수치화하기 위해 원 PESQ-LQ점수와 상관계수를 최대화하는 음질 저하 가중치를 반복적으로 구하였으며, 최종 음질 저하는 가중합으로 구하였다. 그 결과 제안한 모델과 PESQ-LQ의 상관계수는 칩입 모델 에서는 0.8950를, 비 침입 모델 에서는 0.8911의 결과를 나타내었다. This paper proposes a non-intrusive speech quality estimation method considering the effects of packet loss to perceptual quality. Packet loss is a major reason of quality degradation in a packet based speech communications network, whose effects are different according to the input speech characteristics or the performance of the embedded packet loss concealment (PLC) algorithm. For the quality estimation system that involves packet loss effects, we first observe the packet loss of G.729 codec which is one of narrowband codec in VoIP system. In order to quantify the lost packet affects, we design a classification algorithm only using speech parameters of G.729 decoder. Then, the degradation values of each class are iteratively selected that maximizes the correlation with the degradation PESQ-LQ scores, and total quality degradation is modeled by the weighted sum. From analyzing the correlation measures, we obtained correlation values of 0.8950 for the intrusive model and 0.8911 for the non-intrusive method.
저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상
이창헌,강홍구,Lee, Chang-Heon,Kang, Hong-Goo 한국음향학회 2010 韓國音響學會誌 Vol.29 No.1
본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다. This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band to the average energy of each formant. More quantization noises are added to the bands that have relatively large energy, but less distortion is allowed in spectral valley regions by allocating more bits, which reflects the concept of perceptual weighting widely used in speech coding. From the results of objective speech quality measure, we verified that the proposed method improves quality for the speech input signals compared to the conventional one.
최용수,강홍구,박상욱,윤대희,Choi, Yong-Soo,Kang, Hong-Goo,Park, Sang-Wook,Youn, Dae-Hee 한국음향학회 1996 韓國音響學會誌 Vol.15 No.6
본 논문에서는 기존의 4.8 kbps VSELP에 상응하는 음질을 갖는 4 kbps PSI-VSELP(Pitch Synchrononus Innovation-Vector Sum Excited Linear Prediction) 음성 부호화기를 제안한다. 'Half-rate'는 4kbps 내외에서 지역에 따라 다소 차이가 있으므로 기존의 half-rate 부호화기를 사용하기 위해서는 비트율을 감소시킬 필요가 생긴다. 이때, 비트율 감소에 따른 성능저하를 최소화하기 위해서는 전송 변수가 부호화기의 성능에 미치는 영향을 고려하여 비트 할당을 결정하는 것이 바람직하다. 본 논문에서는 이러한 접근 방식으로 비트율 감소 연구를 수행한 후, 제안된 부호화기에 대한 4 kbps 비트 할당을 결정한다. VSELP 부호화기의 음질 향상을 위해서, 성능에 가장 중요한 영향을 미치는 기저 벡터는 반복 폐회로 훈련 과정을 통해 최적화하며, PSI 기법을 VSELP 부호화기에 도입한다. 제안된 음성 부호화기의 성능을 평가하기 위해 배경 잡음과 채널 에러가 없는 환경에서 실험을 하였다. 실험 결과, 제안된 4 kbps PSI-VSELP는 4.8 kbps VSELP에 비해 객관적 음질은 낮았지만, 주과적 음질은 더 높게 나타났다. This paper proposes a 4 kbps PSI-VSELP(Pitch Synchronous Innovation-Vector Sum Excited Linear Prediction) speech coder which produces speech equivalent to that of the conventional 4.8 kbps VSELP. Since the 'half-rate' is differently defined from country to country, there may be a need to reduce the bit rate of conventional half-rate coder. To minimize the degradation of speech quality caused by bit-rate reduction, it is desirable to perform bit-allocation based on the carefull consideration of the effect of various transmission parameters. This paper adopts this analytical approach for bit-allocation at 4 kbps. To improve the quality of the VSELP coder at 4 kbps, basis vectors which play the most important role in the performance, are optimized by an iterative closed-loop training process and the PSI technique is employed in the VSELP performance, are optimized by an iterative closed-loop training process and the PSI technique is employed in the VSELP coder. To demonstrate the performance of the proposed speech coder, we peformed experiments under the noiseless and error free conditions. From experimental results, even though the proposed 4 kbps PSI-VSELP coder showed lower scores in the objective measure, higher scores in subjective measure was obtained compared with those of the conventional 4.8 kbps VSELp.