http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
상대전달함수의 역필터링을 이용한 자동차 환경에서의 마이크로폰 어레이 빔형성 기법
강홍구,황영수,윤대희,한철희,Kang Hong-Goo,Hwang Youngsoo,Youn Dae-Hee,Han Chul-Hee 한국음향학회 2006 韓國音響學會誌 Vol.25 No.1
본 논문에서는 상대전달함수의 역필터링 (inverse-filtering) 전처리를 수행한 후 MVDR (Minimum-Variance Distortionless Response) 빔형성기나 GSC (Generalized Sidelobe Canceller)를 수행하는 방법을 제안하였다. 제안된 방법은 기존의 RTF-MVDR 및 TF-GSC 보다 적은 계산량을 갖으며 최적해 측면에서 동등함을 보였다. 제안된 방법의 성능을 평가하기 위하여 자동차 환경에서 녹음된 음성 데이터베이스와 HTK를 이용하여 음성인식 실험을 수행하였다. 그 결과, 제안된 방법은 기존의 방법과 대등한 성능을 갖거나 적은 성능저하를 보였다. In this paper. we Propose a frequency domain beamforming algorithm composed of inverse-filtering stages followed by a MVDR (Minimum-Variance Distortionless Response) beamformer or a GSC (Generalized Sidelobe Canceller). The proposed method is shown to require less complexity than the conventional RTF-MVDR and TF-GSC. respectively, and it is shown that the Proposed method is equivalent to the conventional RTF-MVDR and TF-GSC in optimum solution. In order to evaluate the performance of the Proposed method. speech recognition experiments are performed using the speech database recorded in a car. The Proposed method shows equal or slightly degraded Performance comparing to the conventional methods in terms of the speech recognition rate.
강홍구 ( Hong-koo Kang ),지승구 ( Seung-goo Ji ),정현철 ( Hyun-cheol Jeong ) 한국정보처리학회 2011 한국정보처리학회 학술대회논문집 Vol.18 No.1
최근 변종 악성코드가 크게 증가하고 하나 이상의 악성코드로 이루어진 그룹 형태의 악성코드들이 빠르게 유포되고 있다. 이러한 그룹 형태의 악성코드와 변종 악성코드에 대한 효과적인 대응을 위해서는 악성코드 그룹 및 변종을 관리하고 안티바이러스 업체와 정보를 공유할 수 있는 시스템이 필요하다. 본 논문에서는 대용량 악성코드 분석 정보로부터 악성코드 그룹 및 변종 정보를 효율적으로 관리하고 공유하는 시스템을 제안하다. 악성코드 그룹 정보는 악성코드 행위를 기반으로 연계된 악성코드 정보들로 생성되고, 악성코드 변종 정보는 CFG 분석을 통한 악성코드간 유사도 정보로 생성된다. 본 논문에서 제안하는 시스템은 악성코드 그룹 및 변종 정보를 쉽게 검색하고 공유할 수 있기 때문에 다양한 악성코드 대응 시스템과 쉽게 연계될 수 있는 장점을 가지고 있다.
최용수,강홍구,박상욱,윤대희,Choi, Yong-Soo,Kang, Hong-Goo,Park, Sang-Wook,Youn, Dae-Hee 한국음향학회 1996 韓國音響學會誌 Vol.15 No.6
본 논문에서는 기존의 4.8 kbps VSELP에 상응하는 음질을 갖는 4 kbps PSI-VSELP(Pitch Synchrononus Innovation-Vector Sum Excited Linear Prediction) 음성 부호화기를 제안한다. 'Half-rate'는 4kbps 내외에서 지역에 따라 다소 차이가 있으므로 기존의 half-rate 부호화기를 사용하기 위해서는 비트율을 감소시킬 필요가 생긴다. 이때, 비트율 감소에 따른 성능저하를 최소화하기 위해서는 전송 변수가 부호화기의 성능에 미치는 영향을 고려하여 비트 할당을 결정하는 것이 바람직하다. 본 논문에서는 이러한 접근 방식으로 비트율 감소 연구를 수행한 후, 제안된 부호화기에 대한 4 kbps 비트 할당을 결정한다. VSELP 부호화기의 음질 향상을 위해서, 성능에 가장 중요한 영향을 미치는 기저 벡터는 반복 폐회로 훈련 과정을 통해 최적화하며, PSI 기법을 VSELP 부호화기에 도입한다. 제안된 음성 부호화기의 성능을 평가하기 위해 배경 잡음과 채널 에러가 없는 환경에서 실험을 하였다. 실험 결과, 제안된 4 kbps PSI-VSELP는 4.8 kbps VSELP에 비해 객관적 음질은 낮았지만, 주과적 음질은 더 높게 나타났다. This paper proposes a 4 kbps PSI-VSELP(Pitch Synchronous Innovation-Vector Sum Excited Linear Prediction) speech coder which produces speech equivalent to that of the conventional 4.8 kbps VSELP. Since the 'half-rate' is differently defined from country to country, there may be a need to reduce the bit rate of conventional half-rate coder. To minimize the degradation of speech quality caused by bit-rate reduction, it is desirable to perform bit-allocation based on the carefull consideration of the effect of various transmission parameters. This paper adopts this analytical approach for bit-allocation at 4 kbps. To improve the quality of the VSELP coder at 4 kbps, basis vectors which play the most important role in the performance, are optimized by an iterative closed-loop training process and the PSI technique is employed in the VSELP performance, are optimized by an iterative closed-loop training process and the PSI technique is employed in the VSELP coder. To demonstrate the performance of the proposed speech coder, we peformed experiments under the noiseless and error free conditions. From experimental results, even though the proposed 4 kbps PSI-VSELP coder showed lower scores in the objective measure, higher scores in subjective measure was obtained compared with those of the conventional 4.8 kbps VSELp.
차량환경에서 음성인식 성능 향상을 위한 마이크로폰 어레이 빔형성 기법
한철희,강홍구,황영수,윤대희,Han Chul-Hee,Kang Hong-Goo,Hwang Youngsoo,Youn Dae-Hee 한국음향학회 2005 韓國音響學會誌 Vol.24 No.7
본 논문에서는 차량환경에서 잔향과 근접장 효과에 의해 발생하는 목적 음성 신호의 왜곡을 감소시킬 수 있는 마이크로폰 어레이 빔형성 기법을 제안하였다. 온라인으로 추정하기 어려운 소스와 마이크간의 전달함수 대신 상대적으로 추정이 용이한 기준 마이크와 다른 마이크간의 상대전달함수를 조향 벡터로 이용함으로써, 원격장 모델의 조향 벡터를 이용한 빔형성기에 비해 목적 음성 신호의 왜곡을 감소시킬 수 있는 준최적 빔형성 기법을 제안하였다. 제안된 방법의 성능을 검증하기 위해, 실제 차량에서 녹음된 음성 DB를 구축하고, 이를 이용하여 HTK를 통한 음성인식 실험을 수행하였다. 음성인식 실험 결과 원격장 모델을 이용한 방법보다 인식률이 최대 $15\%$까지 향상됨을 확인하였다. In this paper. a microphone array beamforming algorithm that reduces the signal distortion caused by reverberation and near-field effect in car environment is proposed. When reverberation or near-field effect is present, an optimum beamformer should be constructed with a steering vector consisting of transfer functions between source and microphones, but it is generally difficult to estimate transfer functions on-line without knowledge of the source signal. Instead, a sub-optimal beamforming algorithm that reduces signal distortion is proposed. It is constructed with steering vectors consisting of relative transfer functions between reference sensor and other sensors. In order to evaluate the performance of the proposed algorithm. we had recorded noisy speech database in a car, and performed speech recognition experiments with HMM Toolkit (HTK) released by Cambridge University. The recognition rate of the proposed algorithm was 15 percents higher than that of the conventional far-field beamformers in best case.
Decision Tree Based Context Clustering with Cross Likelihood Ratio for HMM-based TTS
정치상,강홍구,Jung, Chi-Sang,Kang, Hong-Goo The Acoustical Society of Korea 2013 韓國音響學會誌 Vol.32 No.2
본 논문은 HMM 기반의 TTS 시스템을 위하여 상호유사도 비율을 이용한 결정트리 기반의 문맥 군집화 알고리즘을 제안한다. 기존의 알고리즘들은 유사한 통계적 특성을 가지는 문맥종속 HMM을 하나로 묶고 있다. 그러나 기존의 알고리즘들은 결정트리의 나누어진 노드간의 통계적 유사도를 고려하지 않음으로 인하여 최종 노드 사이의 통계적인 차이를 보장하지 못한다. 제안한 알고리즘은 분리된 노드들 간의 통계적 유사도를 최소화하여 모델 파라미터의 신뢰도를 향상시킨다. 실험 결과를 통해 제안한 알고리즘이 기존의 알고리즘들에 비해 우수한 성능을 나타낸다는 것을 확인할 수 있다. This paper proposes a decision tree based context clustering algorithm for HMM-based speech synthesis systems using the cross likelihood ratio with a hierarchical prior (CLRHP). Conventional algorithms tie the context-dependent HMM states that have similar statistical characteristics, but they do not consider the statistical similarity of split child nodes, which does not guarantee the statistical difference between the final leaf nodes. The proposed CLRHP algorithm improves the reliability of model parameters by taking a criterion of minimizing the statistical similarity of split child nodes. Experimental results verify the superiority of the proposed approach to conventional ones.