본 논문에서는 MSVQ(Multi-Section Vector Quantization)와 시간지연 회귀 신경회로망(TDRNN)을 이용한 하이브리드 구조의 음성인식 방법을 제안한다. MSVQ는 음성의 길이를 일정한 구간 수로 정규화한 코...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
https://www.riss.kr/link?id=A101069939
김성석 (용인대학교) ; Kim, Sung-Suk
2014
Korean
KCI등재,SCOPUS,ESCI
학술저널
268-272(5쪽)
0
0
상세조회0
다운로드국문 초록 (Abstract)
본 논문에서는 MSVQ(Multi-Section Vector Quantization)와 시간지연 회귀 신경회로망(TDRNN)을 이용한 하이브리드 구조의 음성인식 방법을 제안한다. MSVQ는 음성의 길이를 일정한 구간 수로 정규화한 코...
본 논문에서는 MSVQ(Multi-Section Vector Quantization)와 시간지연 회귀 신경회로망(TDRNN)을 이용한 하이브리드 구조의 음성인식 방법을 제안한다. MSVQ는 음성의 길이를 일정한 구간 수로 정규화한 코드북을 생성하고, 시간지연 회귀 신경회로망은 이 코드북을 이용하여 음성을 인식한다. 시간지연 회귀 신경회로망은 음성의 시계열 문맥정보를 잘 학습할 수 있는 구조로 구성되었다. 음성특징으로 인지선형예측(PLP) 계수가 사용되었다. 음성인식 실험을 수행한 결과 MSVQ/TDRNN 음성인식기는 97.9 %의 화자독립 음성 인식률을 보였다.
다국어 초록 (Multilingual Abstract)
This paper presents a method for speech recognition using multi-section vector-quantization (MSVQ) and time-delay recurrent neural network (TDTNN). The MSVQ generates the codebook with normalized uniform sections of voice signal, and the TDRNN perform...
This paper presents a method for speech recognition using multi-section vector-quantization (MSVQ) and time-delay recurrent neural network (TDTNN). The MSVQ generates the codebook with normalized uniform sections of voice signal, and the TDRNN performs the speech recognition using the MSVQ codebook. The TDRNN is a time-delay recurrent neural network classifier with two different representations of dynamic context: the time-delayed input nodes represent local dynamic context, while the recursive nodes are able to represent long-term dynamic context of voice signal. The cepstral PLP coefficients were used as speech features. In the speech recognition experiments, the MSVQ/TDRNN speech recognizer shows 97.9 % word recognition rate for speaker independent recognition.
참고문헌 (Reference)
1 S. S. Kim, "Time-delay recurrent neural network for temporal correlations and prediction" 20 : 253-263, 1998
2 K. Lippmann, "Reviews of neural networks for speech recognition" 1 : 1-38, 1989
3 H. Hermansky, "Perceptual linear predictive (PLP)analysis of speech" 87 : 1738-1752, 1990
4 D. E. Rumelhart, "Parallel Distributed Processing 1" MIT Press 318-362, 1986
5 A. Waibel, "Modularity and scaling in large phoneme neural networks" 37 : 1188-1197, 1989
6 X. D. Huang, "Hidden Markov Models for Speech Recognition" Edinburgh University Press 1990
7 H. Bourlard, "Connectionist Speech Recognition - A Hybrid Approach" Kluwer 185-200, 1994
8 S. S. Kim, "Automatic recognition of pitch movements using multi-layer prceptron and time-delay recursive neural network" 11 : 645-648, 2004
9 Z. Rong, "An improved multisection vector quantization model with application to Chinese digits recognition" 1 : 749-752, 1996
10 T. Robinson, "An application of recurrent nets to phone probability estimation" 5 : 298-305, 1994
1 S. S. Kim, "Time-delay recurrent neural network for temporal correlations and prediction" 20 : 253-263, 1998
2 K. Lippmann, "Reviews of neural networks for speech recognition" 1 : 1-38, 1989
3 H. Hermansky, "Perceptual linear predictive (PLP)analysis of speech" 87 : 1738-1752, 1990
4 D. E. Rumelhart, "Parallel Distributed Processing 1" MIT Press 318-362, 1986
5 A. Waibel, "Modularity and scaling in large phoneme neural networks" 37 : 1188-1197, 1989
6 X. D. Huang, "Hidden Markov Models for Speech Recognition" Edinburgh University Press 1990
7 H. Bourlard, "Connectionist Speech Recognition - A Hybrid Approach" Kluwer 185-200, 1994
8 S. S. Kim, "Automatic recognition of pitch movements using multi-layer prceptron and time-delay recursive neural network" 11 : 645-648, 2004
9 Z. Rong, "An improved multisection vector quantization model with application to Chinese digits recognition" 1 : 749-752, 1996
10 T. Robinson, "An application of recurrent nets to phone probability estimation" 5 : 298-305, 1994
11 Y. Linde, "An algorithm for vector quantizer design" 28 : 84-95, 1980
배열 마이크로폰을 이용한 레일 방사 소음 측정에 관한 이론 해석
Bag of Words 기반 음향 상황 인지를 위한 주파수-캡스트럴 특징
학술지 이력
연월일 | 이력구분 | 이력상세 | 등재구분 |
---|---|---|---|
2026 | 평가예정 | 재인증평가 신청대상 (재인증) | |
2020-01-01 | 평가 | 등재학술지 유지 (재인증) | |
2017-01-01 | 평가 | 등재학술지 유지 (계속평가) | |
2013-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2010-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2008-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2006-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2004-01-01 | 평가 | 등재학술지 유지 (등재유지) | |
2001-07-01 | 평가 | 등재학술지 선정 (등재후보2차) | |
1999-01-01 | 평가 | 등재후보학술지 선정 (신규평가) |
학술지 인용정보
기준연도 | WOS-KCI 통합IF(2년) | KCIF(2년) | KCIF(3년) |
---|---|---|---|
2016 | 0.23 | 0.23 | 0.22 |
KCIF(4년) | KCIF(5년) | 중심성지수(3년) | 즉시성지수 |
0.2 | 0.18 | 0.398 | 0.07 |