RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        우도비 특징 벡터를 이용한 SVM 기반의 음성 검출기

        조규행,강상기,장준혁,Jo, Q-Haing,Kang, Sang-Ki,Chang, Joon-Hyuk 한국음향학회 2007 韓國音響學會誌 Vol.26 No.8

        본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재와 부재에 대한 가설로부터 각각의 통계적 모델을 세워 입력 데이타에 의해 결정된 각 주파수 채널별 우도비(likelihood ratio)를 단순히 기하 평균을 취하여 문턱값과 비교, 음성 검출 여부를 판단한다. 제안된 음성 검출기는 기존의 기하 평균을 이용한 결정식을 대신하여 분류 오류 확률이 최소화되도록 각 주파수 채널별 우도비를 SVM의 특징 벡터로 적용한다. 제안된 SVM 기반의 통계적 모델 음성 검출기는 기존의 LRT를 이용한 음성 검출기 및 SVM 기반의 음성 검출기들과 비교하여 다양한 잡음 환경에서 우수한 성능을 나타낸다. In this paper, we apply a support vector machine(SVM) that incorporates an optimized nonlinear decision rule over different sets of feature vectors to improve the performance of statistical model-based voice activity detection(VAD). Conventional method performs VAD through setting up statistical models for each case of speech absence and presence assumption and comparing the geometric mean of the likelihood ratio (LR) for the individual frequency band extracted from input signal with the given threshold. We propose a novel VAD technique based on SVM by treating the LRs computed in each frequency bin as the elements of feature vector to minimize classification error probability instead of the conventional decision rule using geometric mean. As a result of experiments, the performance of SVM-based VAD using the proposed feature has shown better results compared with those of reported VADs in various noise environments.

      • KCI등재

        SVM의 확률 출력을 이용한 새로운 Global Soft Decision 기반의 음성 향상 기법

        조규행,장준혁,Jo, Q-Haing,Chang, Joon-Hyuk 한국음향학회 2008 韓國音響學會誌 Vol.27 No.2

        본 논문에서는 support vector machine (SVM) 기반의 global soft decison (GSD)을 이용한 새로운 음성 향상 기법을 제시한다. 일반적으로 soft decision (SD) 이득 수정 및 잡음 전력 추정에 근거한 음성 향상 기법이 hard decision을 이용한 음성향상 기법 보다 우수한 성능을 보이는 것으로 알려져 있다. 특히, 각 프레임에서의 음성 부재에 대한 효과적인 척도인 전역음성 부재확률 (global speech absence probability, GSAP)을 SD 기반의 음성 향상 기법에 적용한 여러 연구가 진행되었다. 본 논문에서는 sigmoid 함수를 이용하여 얻어진 SVM의 확률 출력에 의해 추정된 새로운 GSAP를 음성 향상 기법에 적용한다. 제안된 알고리즘의 성능은 다양한 잡음 환경에 적용하여 PESQ 및 MOS 평가 방법을 바탕으로 기존의 GSD 기반의 스펙트럼 향상 기법과 비교하여 향상된 결과를 나타내었다. In this paper, we propose a novel speech enhancement technique using global soft decision (GSD) based on the probabilistic outputs of support vector machine (SVM). Generally, speech enhancement algorithms applied soft decision gain modification and noise power estimation have bettor performance than those employing hard decision. Especially, global speech absence probability (GSAP), which is known as an effective measure of the speech absence in each frame, has been adopted to SD-based speech enhancement methods. For this reason, we introduce a new GSAP estimated from the probabilistic output of SVM using sigmoid function. The performance of the proposed algorithm is evaluated by the PESQ and MOS test under various noise environments and yields better results compared with the conventional GSD scheme.

      • KCI등재

        Smoothed Global Soft Decision에 근거한 음성 향상 기법

        조규행(Q-Haing Jo),박윤식(Yun-Sik Park),장준혁(Joon-Hyuk Chang) 대한전자공학회 2007 電子工學會論文誌-SP (Signal processing) Vol.44 No.6

        본 논문에서는 잡음 환경에서의 음성 향상을 위해 향상된 Global Soft Decision (GSD) 기법을 제안한다. 통계적 모델을 바탕으로 한 음성 향상과 관련한 연구에서 GSD는 음성의 꼬리 부분에서 취약하다고 알려져 있으며, 이를 개선하기 위해 Smoothed Global Likelihood Ratio (SGLR)를 바탕으로 한 새로운 음성 향상 기법을 GSD에 적용한다. 제안된 방법은 다양한 잡음 환경에서 MOS 실험을 바탕으로 기존의 연구와 비교하였으며 우수한 성능을 보여주었다. In this paper, we propose an improved global soft decision for speech enhancement in noise environments. From an examination of statistical model-based speech enhancement, it is shown that the global soft decision has a fundamental drawback at the offset region of speech signals. To overcome the drawback, we apply a new speech enhancement method based on a smoothed Global likelihood ratio to the global soft decision. Performances of the proposed method are evaluated by subjective tests under various environments and yield better results compared with the reported speech enhancement method.

      • KCI등재

        통계적 모델 기반의 음성 검출기를 위한 변별적 가중치 학습

        강상익,조규행,박승섭,장준혁,Kang, Sang-Ick,Jo, Q-Haing,Park, Seung-Seop,Chang, Joon-Hyuk 한국음향학회 2007 韓國音響學會誌 Vol.26 No.5

        In this paper, we apply a discriminative weight training to a statistical model-based voice activity detection(VAD). In our approach, the VAD decision rule is expressed as the geometric mean of optimally weighted likelihood ratios(LRs) based on a minimum classification error(MCE) method which is different from the previous works in that different weights are assigned to each frequency bin which is considered more realistic. According to the experimental results, the proposed approach is found to be effective for the statistical model-based VAD using the LR test. 본 논문에서는 음성의 통계적 모델에 기반한 음성검출기의 성능향상을 위해 변별적 가중치 학습(discriminative weight training) 기반의 최적화된 우도비 테스트(Likelihood Ratio Test, LRT)를 제안한다. 먼저, 기존의 통계모델기반의 음성검출기를 분석하고, 이를 기반으로 MCE(minimum classification error)방법을 도입하여, 각 주파수 채널별로 다른 가중치를 가지는 우도비 기반의 음성검출 결정법(decision rule)을 제시한다. 제안된 알고리즘은 비정상(non-stationary)잡음환경에서 기존의 동일 가중치를 가지는 기하 평균 기반의 음성검출기와 비교하였으며, 우수한 성능을 보인다.

      • KCI등재

        복소 라플라시안 확률 밀도 함수에 기반한 음성 향상 기법

        박윤식(Yun-Sik Park),조규행(Q-Haing Jo),장준혁(Joon-Hyuk Chang) 대한전자공학회 2007 電子工學會論文誌-SP (Signal processing) Vol.44 No.6

        본 논문에서는 복소 라플라시안 확률밀도함수 (PDF, Probability Density Function)에 기반한 새로운 음성 향상 기법을 제시한다. 적용된 복소 라플라시안 PDF가 기존의 가우시안 PDF보다 오염된 음성 분포를 정확하게 표현한다는 것을 Goodness-of-Fit (GOF) 테스트로 확인하였고, 음성 향상 알고리즘의 음성부재확률을 위해 우도비 (LR, Likelihood Ratio)를 적용하였다. 제시된 알고리즘의 성능은 객관적 테스트에 의해 평가하였고 기존의 가우시안 PDF보다 개선된 음성 향상 결과를 나타내었다. This paper presents a novel approach to speech enhancement based on a complex Laplacian probability density function (pdf). With a use of goodness-of-fit (GOF) test, we show that the complex Laplacian pdf is more suitable to describe the conventional Gaussian pdf. The likelihood ratio (LR) is applied to derive the speech absence probability in the speech enhancement algorithm. The performance of the proposed algorithm is evaluated by the objective test and yields better results compared with the conventional Gaussian pdf-based scheme.

      • KCI등재

        실시간 변별적 가중치 학습에 기반한 음성 검출기

        강상익(Sang-Ick Chang),조규행(Q-Haing Jo),장준혁(Joon-Hyuk Chang) 대한전자공학회 2008 電子工學會論文誌-SP (Signal processing) Vol.45 No.4

        본 논문에서는 다양한 잡음 환경에서 음성의 통계적 모델에 기반한 음성 검출기의 성능향상을 위해 PSFM (Power Spectral Flatness Measure)을 이용하여 실시간으로 변별적 가중치 학습 (Discriminative Weight Training) 기반의 최적화된 우도비 테스트 (Likelihood Ratio Test, LRT)를 제안한다. 먼저, 기존의 통계모델기반의 음성 검출기를 분석하고, 이를 기반으로 MCE (Minimum Classification Error)방법을 도입하여 도출한 각 주파수 채널별 가중치를 PSFM 값에 기반하여 실시간 매프레임마다 다른 가중치를 적용한 우도비 기반의 음성 검출 결정법을 제시한다. 제안된 알고리즘은 다양한 잡음 환경에서 기존에 제시된 음성 검출기와 비교하였으며, 우수한 성능을 보인다. In this paper, we apply a discriminative weight training employing power spectral flatness measure (PSFM) to a statistical model-based voice activity detection (VAD) in various noise environments. In our approach, the VAD decision rule is expressed as the geometric mean of optimally weighted likelihood ratio test (LRT) based on a minimum classification error (MCE) method which is different from the previous works in th at different weights are assigned to each frequency bin and noise environments depending on PSFM. According to the experimental results, the proposed approach is found to be effective for the statistical model-based VAD using the LRT.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼