RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 음성 인식

        安泰玉 대한전자공학회 2003 電子工學會論文誌-SP (Signal processing) Vol.40 No.11

        본 논문은 FSVQ(first section vector quantization)와 퍼지 개념을 이용한 HMM(hidden Markov model)에 기초를 둔 음성인식을 제안한다. 제안된 연구 방법에서는 첫 번째 구간의 코드북(codebook)을 만든 후, 첫번째 구간의 코드북으로부터, 퍼지 개념을 도입하여 확률값이 큰 순서에 의해 다중 관측열을 구한다. 그 다음, 코드북으로부터 첫 번째 구간의 관측열을 학습시키고, 인식할 때에도 같은 개념으로 첫 번째 구간에서의 확률값이 가장 높은 단어를 인식된 단어로 선택한다. 인식 대상 어휘로는 전철역명을 선택하였으며, 특징 파라메타로는 LPC 켜스트럼을 사용하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 이외에도 비교를 위하여 이전에 실험한 몇 가지 방법의 인식 실험을 같은 조건하에서 같은 데이터로 수행한다. 실험 결과, 본 연구에서 제안한 FSVQ와 퍼지 개념을 이용한 HMM에 기초를 둔 방법이 다른 음성 인식 방법들보다 인식률이 우수함을 입증하였다. This paper proposes a speech recognition based on HMM(Hidden Markov Model) using FSVQ(First Section Vector Quantization) and fuzzy concept. In the proposed paper, we generate codebook of First Section, and then obtain multi-observation sequences by order of large propabilistic values based on fuzzy rule from the codebook of the first section. Thereafter, this observation sequences of first section from codebooks is trained and in case of recognition, a word that has the most highest probability of first section is selected as a recognized word by same concept. Train station names are selected as the target recognition vocabulary and LPC cepstrum coefficients are used as the feature parameters. Besides the speech recognition experiments of proposed method, we experiment the other methods under same conditions and data. Through the experiment results, it is proved that the proposed method based on HMM using FSVQ and fuzzy concept is superior to the others in recognition rate.

      • KCI등재

        DHMM을 이용한 한국어 음성 인식

        안태옥,이강성,유형근,이형준,조형제,변용규,김순협,Ann, T.O.,Lee, K.S.,Yoo, H.K.,Lee, H.J.,Cho, H.J.,Byun, Y.G.,Kim, S.H. 한국음향학회 1991 韓國音響學會誌 Vol.10 No.1

        본 연구는 스펙트럼의 동적 특징을 한 파라메타로 하는 DHMM(Dynamic Hidden Markov Model)을 이용한 단독어인식에 관한 것으로 정적 스펙트럼 특징뿐 아니라 동적 스펙트럼 특징을 평가할 수 있는 DHMM에 근거한 음성 인식 실험을 논의 한다. 정적특징으로는 LPC cepstrum 계수를 이용하였고, 동적특징으로는 LPC cepstrum 의 회귀계수를 사용하였다. 이들 두 개의 특징 벡터들을 각각 집단화하여 만든 두 VQ codebook과 입력으로 받아들인 정적 벡터및 동적벡터로 단어들을 DHMM(Dynamic Hidden Markov Model)으로 모델링 하였다. 전체적인 실험에서 기존의 HMM을 이용한 인식실험에서는 88.8%의 인식율을 얻었는데 반해, DHMM을 이용한 인식실험에서는 92.7%의 인식율을 보였다. This paper describes the study on isolated word recognition by using DHMM(Dynamic Hidden Markov Model) which has dynamic feature of spectrum as a parameter. This paper discusses speech recognition experiment basedon HMM which can evaluate not only instantaneous spectral features but also dynamic spectral features. LPC cepstrum parameters is used as a static feature and LPC cepstrum's regression coefficient is used as a dynamic feature. These two features are quantized by each VQ codebook. DHMM is modeled by receiving static vector and dynamic vector by input. In the whole experiment, as recognition experiment using DHMM shows 92.7% of recognition rate while the experiment using conventional HMM shows 88.8% of recognition rate, DHMM proved to be a useful model.

      • KCI등재

        구문 분석과 Level Building을 이용한 한국어 연속음 인식

        안태옥,변용규,김순협 한국음향학회 1986 韓國音響學會誌 Vol.5 No.4

        본 논문은 특정 화자에 대한 하국어 연속음의 효율적인 인식을 위하여, 구문분석과 OGS기법으 로 변형시킨 Level Building을 이용한 인식시스템에 대해서 제안하고 있다. 본 시스템에서 사용하는 template는 연속음을 분할시킨 단독음이며 소구간 경로 및 본 논문에서 제안한 전체 경로 제약에 의해 거리 계산값이 최소인 super reference를 구함으로써 인식된다. 본 연구에서 사용한 연속음은 단독음 11 자로 구성된 13개의 전철역명으로서 2인의 남성과 1인의 여성화자에 의해 10번씩 발음한 130단어를 테 스트하였는데 97.7%의 단어인식을 보였다.

      • KCI등재

        VQ와 Multi-layer perceptron을 이용한 단모음 인식에 관한 연구

        안태옥,이상훈,김순협 한국음향학회 1993 韓國音響學會誌 Vol.12 No.1

        본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, VQ(Vectro Quantization)와 MLP(multi-layer perceptron)에 의한 음성 인식 방법을 제안한다. 이 방법은 VQ codebook을 구하고 이를 이용해서 관측열(observation sequence)을 구해각 codeword가 데이터로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상으로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 것으로 시스템의 효율성을 알아보기 위해 VQ/HMM(hidden markov model)에 의한 인식과 비교 실험한다. 실험 결과에 의하면, 시스템의 단순성에도 불구하고 학습능력애 뛰어난 관계로 VQ/HMM보다 VQ와 MLP에 의한 음성 인식률이 향상됨을 보여준다.

      • KCI등재

        Fuzzy를 이용한 VQ/NN에 기초를 둔 음성 인식

        안태옥,Ann, Tae-Ock 한국음향학회 1996 韓國音響學會誌 Vol.15 No.6

        본 논문은 불특정 화자의 단모음 인식에 관한 연구로써, fuzzy개념를 이용한 VQ(Vector Quantization)/NN(Neural Network)에 의한 음성 인식 방법을 제안한다. 이 방법은 fuzzy를 이용하여 VQ codebook에 의해 다중 관측열(multi-observation sequence)을 구해 각 symbol이 데이타로부터 가질 수 있는 확률값을 계산하여 이 값을 신경 회로망의 입력으로 사용하는 방법이다. 인식 대상어로는 한국어 단모음을 선정하였으며 10명의 남성 화자가 8개의 단모음을 10번씩 발음한 음성 데이터베이스를 이용하여 fuzzy를 이용하지 않은 VQ/NN과 fuzzy를 이용한 VQ/HMM(hidden Markov model)에 의한 인식률과 비교 실험한다. 실험 결과에 의하며, VQ/NN에 의한 인식률은 92.3%이며, fuzzy를 이용한 VQ/HMM에 의한 인식률은 93.8%이고, fuzzy를 이용한 VQ/Nn에 의한 인식률은 95.7%이다. 그러므로, 본 연구의 fuzzy를 이용한 VQ/NN이 학습 능력이 뛰어난 관계로 fuzzy를 이용한 VQ/HMM과 일반적인 VQ/NN 보다 인식률이 향상됨을 보여준다. This paper is the study for recognizing single vowels of speaker-independent, and we suppose a method of speech recognition using VQ(Vector Quantization)/NN(Neural Network). This method makes a VQ codebook, which is used for obtaining the observation sequence, and then claculates the probability value by comparing each codeword with the data, finally uses these probability values for the input value of the neural network. Korean signle vowels are selected for our recognition experiment, and ten male speakers pronounced eight single vowels ten times. We compare the performance of our method with those of fuzzy VQ/HMM and conventional VQ/NN According to the experiment result, the recognition rate by VQ/NN is 92.3%, by VQ/HMM using fuzzy is 93.8% and by VQ/NN using fuzzy is 95.7%. Therefore, it is shown that recognition rate of speech recognition by fuzzy VQ/NN is better than those of fuzzy VQ/HMM and conventional VQ/HMM because of its excellent learning ability.

      • KCI등재

        DMS 모델을 이용한 음성인식에 관한 연구

        안태옥,변용규,An, Tae-Ock,Byun, Yong-Kyu 한국음향학회 1994 韓國音響學會誌 Vol.13 No.e2

        본 연구는 단어 패턴 중 유사한 특성의 정보에 기초를 둔 DMS(Dynamic Multi-Section) 모델을 제안한다. 이 모델은 각각의 단어를 몇 개의 구간(Section)의 시계열로 분할하고, 각각의 구간 모두에 지속 시간 정보와 구간을 대표하는 특징 벡터를 구간의 정보로 등록해 둔 것이다. 단어 패턴에서 모델을 작성하는 절차는 대표 특징 벡터와 지속 시간의 정보를 거리에 따라 반영하면서 단어 패턴과 모델과의 매칭을 반복하여 매칭에 의한 누적 거리가 최소로 되도록 하는 것이다. 제안된 음성 인식 실험을 수행하는 것 이외에도 비교를 위해 DP 방법, HMM 방법 및 MSVQ 방법에 의한 음성 인식 실험을 같은 조건하에서 같은 데이터로 수행하였다. 또한 제안된 DMS 모델을 이용한 음성 인식시에도 DMS/DP 방법에 의한 인식 및 DMS/VQ에 의한 인식률은 89.3%이다. 또한 DMS 모델을 이용한 DMS/DP에 의한 인식률은 95.8%이고, DMS/VQ에 의한 인식률은 96.8%이다. 그러므로, DMS 모델을 이용한 DMS/VQ 방법에 의한 인식이 일반적으로 많이 이용되고 잇는 DP 방법이나 HMM 방법 및 MSVQ 방법과 비교해 볼 때 인식률도 우수하며, 기억 용량 및 계산량도 감소되어, 본 연구에서 제안하는 DMS 모델의 유용성이 입증되었다. This paper proposes a DMS(Dynamic Multi-Section) model based on the information of the similar features in word pattern. This model represents each word as a time series of several sections and each section implies duration time information and typical feature vectors. The procedure to make a model in the word pattern is that typical feature vector and duration time information are reflected in the distance, when matching between word pattern and model is repeated. As the result of it, the accumulated distance by matching is to be minimized.

      • 혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화

        안태옥,Ann, Tae-Ock 대한전자공학회 2005 電子工學會論文誌-SP (Signal processing) Vol.42 No.6

        본 논문은 음성인식에 쓰이는 음향모델의 모델링 방법 중 결정트리 상태공유 모델링(DTST)을 기반으로 출력 확률 분포의 혼합 가우시안 수를 줄여 모델을 최적화하는 방법을 제안한다. DTST는 음성학적 지식을 포함할 수 있는 질의어 집합과 유사도를 기반으로 한 결정 방법을 이용하는 것이다. 이때 상태들의 출력 확률 분포의 혼합 가우시안 수를 늘려 인식률을 증가시킬 수 있게 된다. 본 논문에서는 인식률이 최대가 되는 지점에서 혼합 가우시안들을 군집화 하여 그 수를 줄이고자 한다. 군집화 시에 필요한 거리 측정 방법은 유클리드(Euclidean)와 바타챠랴(Bhattacharyya) 방법을 이용하였고, 새로운 가우시안은 거리가 최소가 되는 두 가우시안으로부터 평균과 분산을 다시 계산하여 생성하였다. 증권상장 회사명(STOCKNAME) 1,680개의 단어 데이터베이스를 구성하여 실험한 결과 바타챠랴 방법은 $97.2\%$의 인식률을 유지하면서 전체 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켰고, 유클리드 방법은 $96.9\%$의 인식률을 유지하면서 혼합 가우시안 수의 비율을 $1.0\%$로 감소시켜 모델을 최적화할 수 있었다. This paper describes how the state tying model based on the decision tree which is one of Acoustic models used for speech recognition optimizes the model by reducing the number of mixture Gaussians of the output probability distribution. The state tying modeling uses a finite set of questions which is possible to include the phonological knowledge and the likelihood based decision criteria. And the recognition rate can be improved by increasing the number of mixture Gaussians of the output probability distribution. In this paper, we'll reduce the number of mixture Gaussians at the highest point of recognition rate by clustering the Gaussians. Bhattacharyya and Euclidean method will be used for the distance measure needed when clustering. And after calculating the mean and variance between the pair of lowest distance, the new Gaussians are created. The parameters for the new Gaussians are derived from the parameters of the Gaussians from which it is born. Experiments have been performed using the STOCKNAME (1,680) databases. And the test results show that the proposed method using Bhattacharyya distance measure maintains their recognition rate at $97.2\%$ and reduces the ratio of the number of mixture Gaussians by $1.0\%$. And the method using Euclidean distance measure shows that it maintains the recognition rate at $96.9\%$ and reduces the ratio of the number of mixture Gaussians by $1.0\%$. Then the methods can optimize the state tying model.

      • 구문 분석과 One-Stage DMS/DP를 이용한 연속음 인식

        안태옥 대한전자공학회 2004 電子工學會論文誌-SP (Signal processing) Vol.43 No.1

        본 논문은 연속음 인식에 관한 연구로써, 구문 분석을 이용한 One-Stage DMS/DP에 의한 음성 인식 방법을 사용한다. 인식 실험을 위해 우선 구간 구분화 알고리즘을 이용하여 DMS(dynamic Multi-Section) 모델을 만들며, 구문 분석을 이용한 One-Stage DMS/DP 방법으로 연속음 데이터를 인식하게 하였다. 제안된 방법에 의한 인식 실험을 수행하는 것 외에도 비교를 위해 전통적인 One-Stage DP 방법을 같은 조건 같은 데이터를 가지고 수행하였다. 인식 실험 결과, 기존의 방법보다 구문분석을 이용한 One-Stage DMS/DP 방법이 우수한 것으로 나타났다. This paper is a study on the recognition of continuous speech and uses a method of speech recognition using syntactic analysis and one-stage DMS/DP. In order to perform the speech recognition, first of all, we make DMS model by section division algorithm and let continuous speech data be recognized through One-stage DMS/DP method using syntactic analysis. Besides the speech recognition experiments of proposed method, we experiment the conventional one-stage DP method under the equivalent environment of data and conditions. From the recognition experiments, it is shown that Ole-stage DMS/DP using syntactic analysis is superior to conventional method.

      • KCI등재

        음성 인식을 위한 소구간 경로 제약

        안태옥,김순협,Ann, Tae-Ock,Kim, Soon-Hyob 한국음향학회 1989 韓國音響學會誌 Vol.8 No.4

        본 논문에서는 인식율을 증진시키기 위해 새로운 소구간 경로 제약을 제안하였다. 파라메타로써 자동 상관 및 LPC 계수를 사용함으로써 입력 음성 신호를 분석하였다 제안된 형의 소구간 경로제약이 기존의 5가지 형과 비교되었다. 본 연구에서 사용된 음성은 전철역명이고, 두명의 남성화자와 1명의 여성화자에 의한 서로 다른 13개의 단어를 10번 발음한 130개의 단어를 시험하였다. 그 결과로서 본 논문에서 제안한 형이 가장 좋은 형이라는 것을 알게 되었고 또한 이에 따른 인식율은 $94.6\%$를 얻었다. In this paper, an local path constraint Is proposed in order to increase the speech recognition rate. An input speech signal is analyzed by autocorrelation and LPC coefficient as parameters. The local path constraint of the proposed type was compared with the conventional five types. The speechs used in this search are the subway stops, and the 130 words pronounced 10 times for the different 13 words consisting of 11 characters of syllable by 2 male and 1 female are tested. As a result, we proved that this proposed type is the most optimal type and the recognition rate of $94.6\%$ is obtained .

      • KCI등재

        개선된 MSVQ 인식 시스템을 이용한 단독어 인식에 관한 연구

        안태옥,김남중,송철,김순협,An, Tae-Ok,Kim, Nam-Joong,Song, Chul,Kim, Soon-Hyeob 한국통신학회 1991 韓國通信學會論文誌 Vol.16 No.2

        본 논문은 화자 독립의 단독이 언직에 관한 연구로 기존의 MSVQ(multisection vector quantization) 일질시스템을 개선한 새로운 MSVQ 시스템을 제안한다. 제안된 내용은 기존의 시스템과는 달리 인식시 시험패턴의 구간 수를 표준패턴의 구간 수보다 한 구간 더 늘리는 것이다. 이 방법에 의한 실험시 인식 대상으로는 146개의 DDD 지역망을 선택했으며, 특징 파라베타로는 12사 LPC 스트럼(cepstrum) 계수를 사용했고 코드북 지정석 중심점 구하는 방법으로 MINSUM과 MINIMAX기법을 사용하였다. 실험 결과에 의하면 DTW(dynamic time warping) 패턴 매칭 방법, VQ(vector quantization)에 의한 방법은 물론 기존의 MSVQ 방법보다 계산량이 감소함과 동시에 더 높은 인식율을 얻을 수 있었다. 수 있었다. This paper is a study on the isolated word recognition of speaker independent which proposes to newly improved MSVQ(multisection vector quantization) recognition system which improve the classical MSVQ recognition system. It is a difference that test pattern has on more section than reference pattern in recognition system 146 DDD area names are selected as recognition vocabulary. 12th LPC cepstral coefficients is used as feature parameter. and when codebook is generated, MINSUM and MINMAX are used in finding the centroid. According to the experiment result. it is proved that this method is better than VQ(vector quantization) recognition methods, DTW(dynamic time warping) pattern matching methods and classical MSVQ methods for recognition rate and recognition time.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼