RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재 SCOPUS

      MSVQ/TDRNN을 이용한 음성인식 = Speech Recognition Using MSVQ/TDRNN

      한글로보기

      https://www.riss.kr/link?id=A101069939

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 논문에서는 MSVQ(Multi-Section Vector Quantization)와 시간지연 회귀 신경회로망(TDRNN)을 이용한 하이브리드 구조의 음성인식 방법을 제안한다. MSVQ는 음성의 길이를 일정한 구간 수로 정규화한 코...

      본 논문에서는 MSVQ(Multi-Section Vector Quantization)와 시간지연 회귀 신경회로망(TDRNN)을 이용한 하이브리드 구조의 음성인식 방법을 제안한다. MSVQ는 음성의 길이를 일정한 구간 수로 정규화한 코드북을 생성하고, 시간지연 회귀 신경회로망은 이 코드북을 이용하여 음성을 인식한다. 시간지연 회귀 신경회로망은 음성의 시계열 문맥정보를 잘 학습할 수 있는 구조로 구성되었다. 음성특징으로 인지선형예측(PLP) 계수가 사용되었다. 음성인식 실험을 수행한 결과 MSVQ/TDRNN 음성인식기는 97.9 %의 화자독립 음성 인식률을 보였다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This paper presents a method for speech recognition using multi-section vector-quantization (MSVQ) and time-delay recurrent neural network (TDTNN). The MSVQ generates the codebook with normalized uniform sections of voice signal, and the TDRNN perform...

      This paper presents a method for speech recognition using multi-section vector-quantization (MSVQ) and time-delay recurrent neural network (TDTNN). The MSVQ generates the codebook with normalized uniform sections of voice signal, and the TDRNN performs the speech recognition using the MSVQ codebook. The TDRNN is a time-delay recurrent neural network classifier with two different representations of dynamic context: the time-delayed input nodes represent local dynamic context, while the recursive nodes are able to represent long-term dynamic context of voice signal. The cepstral PLP coefficients were used as speech features. In the speech recognition experiments, the MSVQ/TDRNN speech recognizer shows 97.9 % word recognition rate for speaker independent recognition.

      더보기

      참고문헌 (Reference)

      1 S. S. Kim, "Time-delay recurrent neural network for temporal correlations and prediction" 20 : 253-263, 1998

      2 K. Lippmann, "Reviews of neural networks for speech recognition" 1 : 1-38, 1989

      3 H. Hermansky, "Perceptual linear predictive (PLP)analysis of speech" 87 : 1738-1752, 1990

      4 D. E. Rumelhart, "Parallel Distributed Processing 1" MIT Press 318-362, 1986

      5 A. Waibel, "Modularity and scaling in large phoneme neural networks" 37 : 1188-1197, 1989

      6 X. D. Huang, "Hidden Markov Models for Speech Recognition" Edinburgh University Press 1990

      7 H. Bourlard, "Connectionist Speech Recognition - A Hybrid Approach" Kluwer 185-200, 1994

      8 S. S. Kim, "Automatic recognition of pitch movements using multi-layer prceptron and time-delay recursive neural network" 11 : 645-648, 2004

      9 Z. Rong, "An improved multisection vector quantization model with application to Chinese digits recognition" 1 : 749-752, 1996

      10 T. Robinson, "An application of recurrent nets to phone probability estimation" 5 : 298-305, 1994

      1 S. S. Kim, "Time-delay recurrent neural network for temporal correlations and prediction" 20 : 253-263, 1998

      2 K. Lippmann, "Reviews of neural networks for speech recognition" 1 : 1-38, 1989

      3 H. Hermansky, "Perceptual linear predictive (PLP)analysis of speech" 87 : 1738-1752, 1990

      4 D. E. Rumelhart, "Parallel Distributed Processing 1" MIT Press 318-362, 1986

      5 A. Waibel, "Modularity and scaling in large phoneme neural networks" 37 : 1188-1197, 1989

      6 X. D. Huang, "Hidden Markov Models for Speech Recognition" Edinburgh University Press 1990

      7 H. Bourlard, "Connectionist Speech Recognition - A Hybrid Approach" Kluwer 185-200, 1994

      8 S. S. Kim, "Automatic recognition of pitch movements using multi-layer prceptron and time-delay recursive neural network" 11 : 645-648, 2004

      9 Z. Rong, "An improved multisection vector quantization model with application to Chinese digits recognition" 1 : 749-752, 1996

      10 T. Robinson, "An application of recurrent nets to phone probability estimation" 5 : 298-305, 1994

      11 Y. Linde, "An algorithm for vector quantizer design" 28 : 84-95, 1980

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2026 평가예정 재인증평가 신청대상 (재인증)
      2020-01-01 평가 등재학술지 유지 (재인증) KCI등재
      2017-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2013-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2010-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2006-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2004-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2001-07-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      1999-01-01 평가 등재후보학술지 선정 (신규평가) KCI등재후보
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.23 0.23 0.22
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.2 0.18 0.398 0.07
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼