http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Group Delay를 이용한 GMM기반의 성별 인식 알고리즘
이계환,임우형,김남수,장준혁,Lee, Kye-Hwan,Lim, Woo-Hyung,Kim, Nam-Soo,Chang, Joon-Hyuk 한국음향학회 2007 韓國音響學會誌 Vol.26 No.6
본 논문은 Group Delay(GD)를 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 일반적인 음성 인식과 관련된 시스템에서 사용되는 특징들은 위상에 관한 정보를 제거한 크기만의 정보를 이용하여 구성한다. 본 연구에서는 위상에 관한 정보를 토대로 유도되어 지는 GD의 성별에 따른 특징을 알아보고, 보다 향상된 성별인식을 위해 MFCC(Mel-frequency cepstral coefficient), LPC(linear predictive coding) 계수, 반사계수(reflection coefficient) 그리고 포만트(formant)등과 같은 크기 정보와 GD를 이용한 결합 특징 벡터를 적용하였다. 실험을 통해 성별에 따른 GD의 특징을 확인할 수 있었고, 이를 이용한 제안된 특징 벡터를 사용했을 때 우수한 인식 성능을 얻을 수 있었다. We propose an effective voice-based gender identification using group delay(GD) Generally, features for speech recognition are composed of magnitude information rather than phase information. In our approach, we address a difference between male and female for GD which is a derivative of the Fourier transform phase. Also, we propose a novel way to incorporate the features fusion scheme based on a combination of GD and magnitude information such as mel-frequency cepstral coefficients(MFCC), linear predictive coding (LPC) coefficients, reflection coefficients and formant. The experimental results indicate that GD is effective in discriminating gender and the performance is significantly improved when the proposed feature fusion technique is applied.
음성신호 기반의 성별인식을 위한 Support Vector Machines의 적용
이계환,강상익,김덕환,장준혁,Lee, Kye-Hwan,Kang, Sang-Ick,Kim, Deok-Hwan,Chang, Joon-Hyuk 한국음향학회 2007 韓國音響學會誌 Vol.26 No.2
본 논문은 SVM(Support Vector Machines)을 이용한 음성신호 기반의 효과적인 성별인식 시스템을 제안한다. 분별적 이진(binary) 패턴 분류기인 SVM은 특징 공간에서 비선형 경계를 찾아 분류하는 방법으로 우수한 성능을 보인다고 알려져 있다. 연구에서는 기존의 성별인식에서 널리 쓰이고 있는 MFCC(Mel Frequency Cepstral Coefficients)를 사용하여 SVM과 기존의 GMM(Gaussian Mixture Model) 알고리즘의 성별인식 성능을 비교하였고, 특히, 보다 향상된 SVM의 성별인식을 위해 MFCC와 Pitch를 이용한 결합 특징 벡터를 적용하였다. 실험결과 MFCC 파라미터를 사용했을 때 제안된 SVM이 GMM보다 우수한 성별인식 성능을 보였고, 제안된 결합 특징 벡터를 사용 했을 때 우수한 성능을 보였다. We propose an effective voice-based gender identification method using a support vector machine(SVM). The SVM is a binary classification algorithm that classifies two groups by finding the voluntary nonlinear boundary in a feature space and is known to yield high classification performance. In the present work, we compare the identification performance of the SVM with that of a Gaussian mixture model(GMM) using the mel frequency cepstral coefficients(MFCC). A novel means of incorporating a features fusion scheme based on a combination of the MFCC and pitch is proposed with the aim of improving the performance of gender identification using the SVM. Experiment results indicate that the gender identification performance using the SVM is significantly better than that of the GMM. Moreover, the performance is substantially improved when the proposed features fusion technique is applied.
이계환(Kye-Hwan Lee),장준혁(Joon-Hyuk Chang) 대한전자공학회 2008 電子工學會論文誌-SP (Signal processing) Vol.45 No.4
본 논문에서는 보이스 피싱 (Voice Pishing) 예방을 위한 알고리즘을 3GPP2 Selectable Mode Voceder (SMV) 코딩 파라미터를 기반으로 제안한다. 상대방 휴대폰에서 전송된 신호를 기반으로 SMV의 복호화 과정에서 자동적으로 추출되는 중요 특징벡터만을 사용하여 Gaussian Mixture Model (GMM)을 구성하고 이를 기반으로 보이스 피싱 예방을 위한 검출 알고리즘을 제안하였다. 실험 결과 제안된 코딩 파라미터 기반의 보이스 피싱 알고리즘이 전화사기 예방에 우수한 성능을 보인 것을 알 수 있었다. We propose an effective voice-pishing detection algorithm based on the 3GPP2 selectable mode vocoder (SMV). The detection of voice pishing is performed based on a Gaussian mixture model (GMM) using decoding parameters of the SMV directly extracted from the decoding process of the transmitted speech information in the mobile phone. The experimental results indicate that SMV decoding parameters are effective in discriminating between general voice and phisher's voice and the performance is significantly acceptable when the proposed technique is applied.
최소 분류 오차 기법을 이용한 보이스 피싱 검출 알고리즘
이계환(Kye-Hwan Lee),장준혁(Joon-Hyuk Chang) 대한전자공학회 2009 電子工學會論文誌-SP (Signal processing) Vol.46 No.3
본 논문에서는 보이스 피싱 (Voice Pishing) 예방을 위한 알고리즘을 최소 분류 오차 기법 (Minimum Classification Error)을 기반으로 제한하다. 휴대폰으로 전송되어진 신호를 기반으로 3GPP2 Selectable Mode Vocoder (SMV)의 복호화 과정에서 자동적으로 추출되는 중요 특징벡터를 사용하여 Gaussian Mixture Model (GMM)을 구성하고 이를 기반으로 구해지는 로그(Log) 기반의 우도 (Likelihood)를 사용한 변별적 가중치 학습을 사용하여 보이스 피싱 예방을 위한 검출 알고리즘을 제안하다. 실험 결과 제안된 보이스 피싱 알고리즘이 기존의 방법에 비해 우수한 성능을 보인 것을 알 수 있었다. We propose an effective voice-phishing detection algorithm based on discriminative weight training. The detection of voice phishing is performed based on a Gaussian mixture model (GMM) incorporaiting minimum classification error (MCE) technique. Actually, the MCE technique is based on log-likelihood from the decoding parameter of the SMV (Selectable Mode Vocoder) directly extracted from the decoding process in the mobile phone. According to the experimental result, the proposed approach is found to be effective for the voice phishing detection.
최소 분류 오차 기법과 멀티 모달 시스템을 이용한 감정 인식 알고리즘
이계환(Kye-Hwan Lee),장준혁(Joon-Hyuk Chang) 대한전자공학회 2009 電子工學會論文誌-SP (Signal processing) Vol.46 No.4
본 논문에서는 최소 분류 오차 기법 (Minimum Classification Error, MCE)에 기반한 감정 인식을 위한 알고리즘 멀티 모달(Multi-modal) 시스템을 기반으로 제안한다. 사람의 음성 신호로부터 추출한 특징벡터와 장착한 바디센서로부터 구한 피부의 전기반응도 (Galvanic Skin Response, GSR)를 기반으로 특징벡터를 구성하여 이를 Gaussian Mixture Model (GMM)으로 구성하고 이를 기반으로 구해지는 로그 기반의 우도 (Likelihood)를 사용한다. 특히, 변별적 가중치 학습을 사용하여 최적화된 가중치를 특징벡터에 인가하여 주요 감정을 식별하는 데 이용하여 성능향상을 도모한다. 실험결과 제안된 감정 인식이 기존의 방법보다 우수한 성능을 보인 것을 알 수 있었다. We propose an effective emotion recognition algorithm based on the minimum classification error (MCE) incorporating multi-modal system The emotion recognition is performed based on a Gaussian mixture model (GMM) based on MCE method employing on log-likelihood. In particular, the proposed technique is based on the fusion of feature vectors based on voice signal and galvanic skin response (GSR) from the body senser. The experimental results indicate that performance of the proposal approach based on MCE incorporating the multi-modal system outperforms the conventional approach.