본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 ...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A102052642
이창헌 (연세대학교) ; 강홍구 (연세대학교) ; Lee, Chang-Heon ; Kang, Hong-Goo
2010
Korean
KCI등재,SCOPUS,ESCI
학술저널
62-68(7쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 ...
본 논문에서는 기존 마스킹 임계값 적응 방식을 개선하여 저전송률 오디오 부호화에서 음성 신호에 대한 성능을 향상시킨다. 포먼트 영역 검색 이후, 각 포먼트 영역의 평균 에너지와 해당 서브밴드의 에너지 비율을 이용하여 마스킹 임계값을 변화시킨다. 상대적으로 에너지가 큰 밴드에 대해서는 더 많은 양자화 노이즈가 허용되는 반면, 청각적으로 민감한 스펙트럴 밸리에서는 비트 할당을 높여 양자화 에러를 좀 더 줄인다. 이는 음성 부호화에서 널리 사용되는 지각 가중(perceptual weighting) 개념을 반영한 것이다. 객관적 음질 평가 결과, 제안한 알고리즘이 기존 방식에 비해 음성 신호에 대한 성능을 향상시킨다는 것을 확인하였다.
다국어 초록 (Multilingual Abstract)
This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band...
This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band to the average energy of each formant. More quantization noises are added to the bands that have relatively large energy, but less distortion is allowed in spectral valley regions by allocating more bits, which reflects the concept of perceptual weighting widely used in speech coding. From the results of objective speech quality measure, we verified that the proposed method improves quality for the speech input signals compared to the conventional one.
참고문헌 (Reference)
1 J. D. Johnston, "Transform coding of audio signals using perceptual noise criteria" 6 : 314-323, 1988
2 E. Zwicker, "Psychoacoustics, Facts and Models, 2nd Updated ed" Springer 1999
3 M. R. Schroeder, "Optimizing digital speech coders by exploiting masking properties of the human ear" 66 : 1647-1979, 1979
4 C. H. Lee, "On the study of noise allocation for speech signal in low bit-rate audio coding" 16 (16): 849-852, 2009
5 E. K. P. Chong, "An Introduction to Optimization, Second ed" Wiley 2001
6 M.Wolters, "A closer look into MPEG-4 High Efficiency AAC" 5871-, 2003
7 "3GPP TS 26.403 v7.0.0, Enhanced aacPlus general audio codec; Encoder specification; Advanced audio coding (AAC) part"
8 "3GPP TS 26.401 v6.2.0, Enhanced aacPlus general audio codec; General description"
1 J. D. Johnston, "Transform coding of audio signals using perceptual noise criteria" 6 : 314-323, 1988
2 E. Zwicker, "Psychoacoustics, Facts and Models, 2nd Updated ed" Springer 1999
3 M. R. Schroeder, "Optimizing digital speech coders by exploiting masking properties of the human ear" 66 : 1647-1979, 1979
4 C. H. Lee, "On the study of noise allocation for speech signal in low bit-rate audio coding" 16 (16): 849-852, 2009
5 E. K. P. Chong, "An Introduction to Optimization, Second ed" Wiley 2001
6 M.Wolters, "A closer look into MPEG-4 High Efficiency AAC" 5871-, 2003
7 "3GPP TS 26.403 v7.0.0, Enhanced aacPlus general audio codec; Encoder specification; Advanced audio coding (AAC) part"
8 "3GPP TS 26.401 v6.2.0, Enhanced aacPlus general audio codec; General description"
정규화 기법을 이용한 낮은 연산량의 가변 망각 인자 RLS 기법
연속적인 프레임 손실 상황에서의 G.729 PLC 성능개선
켑스트럼 기반 혼성영역 피치변경법의 처리시간 단축에 관한 연구
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 유지 (재인증) | ![]() |
2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | ![]() |
2013-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2006-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2004-01-01 | 평가 | 등재학술지 유지 (등재유지) | ![]() |
2001-07-01 | 평가 | 등재학술지 선정 (등재후보2차) | ![]() |
1999-01-01 | 평가 | 등재후보학술지 선정 (신규평가) | ![]() |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.23 | 0.23 | 0.22 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.2 | 0.18 | 0.398 | 0.07 |