본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A101069560
조규행 ; 강상기 ; 장준혁 ; Jo, Q-Haing ; Kang, Sang-Ki ; Chang, Joon-Hyuk
2007
Korean
KCI등재,SCOPUS,ESCI
학술저널
397-402(6쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재...
본 논문에서는 기존의 통계적 모델 기반의 음성 검출기의 성능 향상을 위해 이진 분류에 우수한 support vector machine(SVM)을 도입한다. 기존의 통계적 모델 기반 음성 검출기의 경우 음성의 존재와 부재에 대한 가설로부터 각각의 통계적 모델을 세워 입력 데이타에 의해 결정된 각 주파수 채널별 우도비(likelihood ratio)를 단순히 기하 평균을 취하여 문턱값과 비교, 음성 검출 여부를 판단한다. 제안된 음성 검출기는 기존의 기하 평균을 이용한 결정식을 대신하여 분류 오류 확률이 최소화되도록 각 주파수 채널별 우도비를 SVM의 특징 벡터로 적용한다. 제안된 SVM 기반의 통계적 모델 음성 검출기는 기존의 LRT를 이용한 음성 검출기 및 SVM 기반의 음성 검출기들과 비교하여 다양한 잡음 환경에서 우수한 성능을 나타낸다.
다국어 초록 (Multilingual Abstract)
In this paper, we apply a support vector machine(SVM) that incorporates an optimized nonlinear decision rule over different sets of feature vectors to improve the performance of statistical model-based voice activity detection(VAD). Conventional metho...
In this paper, we apply a support vector machine(SVM) that incorporates an optimized nonlinear decision rule over different sets of feature vectors to improve the performance of statistical model-based voice activity detection(VAD). Conventional method performs VAD through setting up statistical models for each case of speech absence and presence assumption and comparing the geometric mean of the likelihood ratio (LR) for the individual frequency band extracted from input signal with the given threshold. We propose a novel VAD technique based on SVM by treating the LRs computed in each frequency bin as the elements of feature vector to minimize classification error probability instead of the conventional decision rule using geometric mean. As a result of experiments, the performance of SVM-based VAD using the proposed feature has shown better results compared with those of reported VADs in various noise environments.
참고문헌 (Reference)
1 "Voice activity detector e m p l o y i n g g e n e r a l i z e d g a u s i a n d i s t r i b u t i o n" 40 (40): 1561-1563, 2004.11
2 "Voice activity detection for celular networks" 85-86, oct.1993.
3 "Voice activity detection based on multiple statistical models" 54 (54): 1965-1976, 2006.06
4 "Statistical model-based VAD algorithm with Wavelet Transform" E89-A (E89-A): 1594-1600, 2006.06
5 "Spech enhancement using a minimum mean-square eror short-time spectral amplitude estimator"
6 "S p e c h / n o n - s p e c h d i s c r i m i n a t i o n based on contextual information integrated bispectrum LRT" 13 (13): 497-500, 2006.08
7 "S p e c h / N o n - s p e c h d i s c r i m i n a t i o n based on contextual information integrated bispectrum LRT" 13 (13): 497-500, 2006.08.13
8 "Applying support vector machines to voice activity detection" 2 : 1124-1127, 2002.08
9 "Analysis and improvement of a statistical model-based voice activity detector" 8 (8): 276-278, 2001.10
10 "An overview of statistical learning theory" 10 (10): 988-999, 1999.09.14
1 "Voice activity detector e m p l o y i n g g e n e r a l i z e d g a u s i a n d i s t r i b u t i o n" 40 (40): 1561-1563, 2004.11
2 "Voice activity detection for celular networks" 85-86, oct.1993.
3 "Voice activity detection based on multiple statistical models" 54 (54): 1965-1976, 2006.06
4 "Statistical model-based VAD algorithm with Wavelet Transform" E89-A (E89-A): 1594-1600, 2006.06
5 "Spech enhancement using a minimum mean-square eror short-time spectral amplitude estimator"
6 "S p e c h / n o n - s p e c h d i s c r i m i n a t i o n based on contextual information integrated bispectrum LRT" 13 (13): 497-500, 2006.08
7 "S p e c h / N o n - s p e c h d i s c r i m i n a t i o n based on contextual information integrated bispectrum LRT" 13 (13): 497-500, 2006.08.13
8 "Applying support vector machines to voice activity detection" 2 : 1124-1127, 2002.08
9 "Analysis and improvement of a statistical model-based voice activity detector" 8 (8): 276-278, 2001.10
10 "An overview of statistical learning theory" 10 (10): 988-999, 1999.09.14
11 "A statistical model- based voice activity detection" 6 (6): 1-3, 1999.01
12 "A silence compresion scheme for G.729 optimized for terminals conforming to ITU-T V.70" 1996
25 kHz 대역에서 PN 신호열을 이용한 거제 천해역 수중음향통신 채널 특성 분석
3GPP2 SMV의 실시간 음성/음악 분류 성능 향상을 위한 Gaussian Mixture Model의 적용
일본어 합성기에서 유동 Break를 이용한 합성단위 선택 방법
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 유지 (재인증) | |
2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | |
2013-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2006-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2004-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2001-07-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
1999-01-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.23 | 0.23 | 0.22 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.2 | 0.18 | 0.398 | 0.07 |