RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        Diphone 단위 의 hidden Markov model을 이용한 한국어 단어 인식

        박현상,은종관,박용규,권오욱,Park, Hyun-Sang,Un, Chong-Kwan,Park, Yong-Kyu,Kwon, Oh-Wook 한국음향학회 1994 韓國音響學會誌 Vol.13 No.1

        본 논문에서는 한국어 음성인식에 적합한 음성 인식 단위에 대해서 연구하였다. 좋은 음성 인식 시스템을 구현하기 위해서는 발음된 음성내의 조음화현상을 처리할 수 있는 인식단위를 선택해야만 한다. 따라서 음소보다 개념적으로 확대된 인식단위가 필요하게 되는데, diphone은 음소간의 전이영역을 modeling하기때문에 좋은 인식 단위가 될 수 있다. Diphone을 인식 단위로 할 경우에 안정적인 음소영역을 diphone사이에 삽입할 수도 있다. 7명의 남성화자가 발음한 74단어로 구성된 고립단어 인식 실험결과 diphone을 2-state HMM으로, 터짐소리 `ㅂ',`ㄷ','ㄱ'와 묵음을 제외한 음소에 대해서 1-state HMM으로 나타냈을 때 가장 높은 인식률을 보였다. 이때 드물게 발생하는 diphone들을 하나의 단위로 merging했을 때 인식률이 $93.98\%$에서 $96.29\%$로 향상되었다. 또한 merging된 diphone과 제안한 국소보간법 (local interpolation technique)을 사용함으로써 $97.22\%$까지 인식률이 향상되었다. In this paper, speech units appropriate for recognition of Korean language have been studied. For better speech recognition, co-articulatory effects within an utterance should be considered in the selection of a recognition unit. One way to model such effects is to use larger units of speech. It has been found that diphone is a good recognition unit because it can model transitional legions explicitly. When diphone is used, stationary phoneme models may be inserted between diphones. Computer simulation for isolated word recognition was done with 7 word database spoken by seven male speakers. Best performance was obtained when transition regions between phonemes were modeled by two-state HMM's and stationary phoneme regions by one-state HMM's excluding /b/, /d/, and /g/. By merging rarely occurring diphone units, the recognition rate was increased from $93.98\%$ to $96.29\%$. In addition, a local interpolation technique was used to smooth a poorly-modeled HMM with a well-trained HMM. With this technique we could get the recognition rate of $97.22\%$ after merging some diphone units.

      • KCI등재

        전화음성의 격리단어인식 개선에 관한 연구

        도삼주,은종관,Do, Sam-Joo,Un, Chong-Kwan 한국음향학회 1990 韓國音響學會誌 Vol.9 No.4

        본 논문에서는 잡음과 전화선로의 왜곡이 음성인식에 미치는 영향을 알아보고, 전처리 과정을 추가하여 이를 개선하는 방법을 제안하였다. 컴퓨터 모의실험은 음소적으로 고르게 분포되어있는 한국어 격리단어 100단어를 각각 10회 발음한 1000개 데이타를 대상으로하고, 화자종속으로 수행하였다. 먼저 잡음에 대한 개선방법으로 spectral subtraction을 제안하였는데, 이것은 매우 간단하면서도 좋은 성능을 보였다. 다음으로 대역폭제한과 전송로왜곡의 영향을 실험하였는데, 대역폭의 제한과 진폭왜곡은 인식율을 크게 떨어뜨렸으나 위상왜곡은 별로 영향이 없었다. 또, 전송로의 영향을 개선하기 위하여 training data를 사용하여 기준패턴을 변화시키는 방법을 제안하였다. 잡음과 전송로의 왜곡이 동시에 있는 경우에 인식율이 7.7~26.4% 밖에 되지 않았는데, 위에서 제안한 방법을 이용하여 76.2~92.3%로 개선되었다. In this work, the effect of noise and distortion of a telephone channel on the speech recognition is studied, and methods to improve the recognition rate are proposed. Computer simulation is done using the 100-word test data whichwere made by pronouncing ten times 100-phonetically balanced Korean isolated words in a speaker dependent mode. First, a spectral subtraction method is suggested to improve the noisy speech recognition. Then, the effect of bandwidth limiting and channel distortion is studied. It has been found that bandwidth limiting and amplitude distortion lower the recognition rate significantly, but phase distortion affects little. To reduce the channel effect, we modify the reference pattern according to some training data. When both channel noise and distortion exist, the recognition rate without the proposed method is merely 7.7~26.4%, but the recognition rate with the proposed method is drastically increased to 76.2~92.3%.

      • KCI등재

        음성과 데이터가 집적된 패킷통신망을 위한 시뮬레이터 개발

        박순,은종관,Park, Soon,Un, Chong-Kwan 한국통신학회 1986 韓國通信學會論文誌 Vol.11 No.2

        音聲과 데이터가 集積된 패킷 通信網의 性能을 豫測하고 시스템 파라메터를 最適化하기 위한 시뮬레이터의 개발에 관하여 記述하였다. 具現된 시뮬레이터는 CCITT의 勸告事項에 따라 運用되는 데이터 터미널이나 host는 물론 패킷 音聲터미널도 연결가능한 音聲 및 데이터集積通信網의 性能을 여러 상황에서 豫測할 수 있다. 시뮬레이션 技法으로는 지금까지 알려진 세가지 discrete event 시뮬레이션 技法 중 process interaction 方法이 사용되었는데 이 方法을 사용하면 실제 시스템과 가장 비슷한 시뮬레이터를 具現할 수 있다. 시뮬레이터는 약 4,000line의 GPSS 시뮬레이션 언어와 PL/I으로 具現되었다. 시뮬레이터의 컴퓨터 run time을 줄이기 위하여 GPSS의 LINK block을 사용함으로써 條件的 event의 數를 줄이는 方法을 사용하였다. 구현된 시뮬레이터를 사용하여 7-node 通信網의 性能을 豫測하였다. 또 개발된 시뮬레이터의 妥當性을 檢證하기 위하여 간단한 音聲과 데이터 multiplexer를 시뮬레이션 모델로 구성한 뒤 그 시뮬레이션 결과를 解釋的 방법에 依한 결과와 比較하였다. In this paper, the development of a simulator for the performance estimation and parameter optimization of an integrates voice/data packet communication network is described. The simulator implemented is capable of simulating the integrated voice/data network that handles packet voice terminals as well as data terminals and hosts operating under standard CCITT protocols. Of the three descrete event simulation approaches presently known, the process interaction method has been chose. With this approach one can implement a simulator that is related most Closely with the real system. The simulator has been implemented in PL/I and GPSS simulation languages, resulting in a software package of about 4,000 lines. To reduce the computer run time of the simulator, we have used a method of reducing conditional events based on a GPSS LINK block. We describe various aspects of the simulation model developed. We then investigate the performance of a 7-node network using the simulator, and present the results. For validation of the simulator developed, we construct a simulation model for a simple voice/ data multiplexer, and compare the results of simulation with those of an analytical model.

      • KCI등재

        한국어 연속음성 인식을 위한 단어 결합 모델링에 관한 연구

        최인정,은종관,Choi, In-Jeong,Un, Chong-Kwan 한국음향학회 1994 韓國音響學會誌 Vol.13 No.5

        본 논문에서는 단어 조음결합의 음성학적 모델을 이용한 한국어 연속음성 인식에 관해 연구한다. 조음결합 현상에 의한 성능 감소를 줄이기 위해 단어내에서의 전이뿐만 아니라 단어간의 전이를 모델링하는 context-dependent (CD)단위를 사용한다. 모든 경우에서 각 단어의 첫 음소는 앞에 올 수 있는 모든 단어의 마지막 음소에 의해 지정되며, 각 단어의 마지막 음소도 유사한 방법으로 지정된다. Hidden Markov model (HMM) 파라미터들의 강인성을 개선하기 위해 공분산 행렬을 평활화한다. 또한 음성 단위들 사이의 분별력을 높이기 위해 position-dependent 단위를 사용한다. 실험 결과들은 개선된 조음결합 모델을 사용함으로서 intra-word 단위만을 사용하는 기본 인식 시스템에 비해 성능을 상당히 개선할 수 있음을 보여 주었다. In this paper, we study continuous speech recognition of Korean language using acoustic models of word juncture coarticulation. To alleviate the performance degradation due to coarticulation problems, we use context-dependent units that model inter-word transitions in addition to intra-word transitions. In all cases the initial phone of each word has to be specified for each possible final phone of the previous word similarly for the final phone of each word. To improve the robustness of the HMM parameters, the covariance matrix is smoothed. We also use position-dependent units to improve the discriminative power between units. Simulation results show that when the improved models of word juncture coarticulation are used. the recognition performance is considerably improved compared to the baseline system using only intra-word units.

      • KCI등재

        시간영역 및 주파수영역 블럭적응 여파기에 관한 연구 : 제 2 부- 성능분석

        이재천,은종관,Lee, Jae-Chon,Un, Chong-Kwan 한국음향학회 1988 韓國音響學會誌 Vol.7 No.4

        본 연구의 제 1 부에서는 통일된 행렬표현 기법을 통하여 여러가지 블럭적응 여파기 구현방법들을 도출할 수 있음을 보였다. 제 2 부에서는 여러 주파수영역 블럭적응 여파기들 중에서도 수렴속도가 매우 빠른 self-orthogonalizing 알고리즘과 계산량이 대폭 감소되는 비제약 알고리즘의 수렴특성들을 overlap-save 및 overlap-add 블럭데이타 분할방법에 대해서 분석한다. 먼저, 수렴인자가 상수일 때와는 달리, 앞에서 언급한 두 주파수영역 여파기들이 공통의 자기상관행렬의 지배를 받기 때문에 수렴특성 분석에 있어서 서로 밀접한 관련이 있음을 보인다. 다음으로 여파기 계수의 수효가 충분히 클 때, 주파수영역 블럭적응 여파기는 계수적응 알고리즘에서 제약의 유무에 관계없이 동일한 최적해를 가짐을 보인다. 그리고 나서 비제약 알고리즘의 계수들은 적절한 조건하에서 원래의 제약알고리즘과 같이 동일한 최적해에 수렴함을 증명한다. 이에 반하여, 최소자승오차 관점에서의 성능분석 결과는 제약을 풀었을 경우에 정상상태에서 약간의 성능저하가 있음을 밝혀낸다. 한편으로 계수의 수효가 작을 때는 원래의 제약 알고리즘은 심한 성능저하를 초래하는 반면에 비제약 알고리즘은 제약의 제거를 통해 상대적으로 계수의 수효가 증가한 효과 대문에 훨씬 좋은 수렴특성을 가짐을 보인다. 또한 self-orthogonalizing 주파수영역 블럭적응 여파기의 자기상관행렬이 주파수 영역에서 대각행렬로 됨을 보여 줌으로써 효율적으로 수렴시간을 단축시키는 구현방법임을 뒷받침한다. In Part Ⅰ of the paper, we have developed various block least mean-square (BLMS) adaptive digital filters (ADF's) based on a unified matrix treatment. In Part Ⅱ we analyze the convergence behaviors of the self-orthogonalizing frequency-domain BLMS (FBLMS) ADF and the unconstrained FBLMS (UFBLMS) ADF both for the overlap-save and overlap-add sectioning methods. We first show that, unlike the FBLMS ADF with a constant convergence factor, the convergence behavior of the self-orthogonalizing FBLMS ADF is governed by the same autocorrelation matrix as that of the UFBLMS ADF. We then show that the optimum solution of the UFBLMS ADF is the same as that of the constrained FBLMS ADF when the filter length is sufficiently long. The mean of the weight vector of the UFBLMS ADF is also shown to converge to the optimum Wiener weight vector under a proper condition. However, the steady-state mean-squared error(MSE) of the UFBLMS ADF turns out to be slightly worse than that of the constrained algorithm if the same convergence constant is used in both cases. On the other hand, when the filter length is not sufficiently long, while the constrained FBLMS ADF yields poor performance, the performance of the UFBLMS ADF can be improved to some extent by utilizing its extended filter-length capability. As for the self-orthogonalizing FBLMS ADF, we study how we can approximate the autocorrelation matrix by a diagonal matrix in the frequency domain. We also analyze the steady-state MSE's of the self-orthogonalizing FBLMS ADF's with and without the constant. Finally, we present various simulation results to verify our analytical results.

      • KCI등재

        시간영역 및 주파수영역 블럭적응 여파기에 관한 연구 : 제1부- 구현방법

        이재천,은종관,Lee, Jae-Chon,Un, Chong-Kwan 한국음향학회 1988 韓國音響學會誌 Vol.7 No.4

        블럭적응 여파기는 구현시에 고속푸리에변환 기법을 이용하면 계산량을 대폭 줄일 수 있음이 밝혀져서 연구자들의 관심을 끌어 왔다. 본 논문은 2편으로 구성되어 있는데, 제 1 부에서는 블럭적응 여파기의 여러가지 구현방법을 연구하고 제 2 부에서는 성능분석의 결과들을 논의하고 있다. 블럭적응 여파기의 계수가 최적해를 추적하도록 하는 적응알고리즘은 시간영역 또는 주파수영역에서 동작하게 할 수 있는데 이를 각각 시간영역 및 주파수영역 블럭적응 여파기로 부른다. 특히 제 1 부에서는 이들 두 구조 사이의 공통점 및 대비 관계를 명확하게 할 것이다. 구체적으로 제 1 부에서는 먼저 overlap-add 방식에 의한 고속 구현방법과 정수론적 변환 기법에 의한 효율적인 구현방법에 관한 새로운 결과들을 발표한다. 그리고 나서 계수 설계시에 주파수영역의 정보를 주파수대역마다 차등으로 적용하는 방법과 여파기 계수의 최적해 추정에 있어서 수렴시간 단축을 위한 self-orthogonalization방법을 주파수영역은 물론 시간영역 블럭적응 여파기들에도 적응할 수 있음을 보인다. 다음으로 계수의 블럭적응을 위한 입출력데이터 블럭분할 방법의 특질에 근거해서 고속푸리에변환 연산을 (부분적으로) 생략할 수 있는 비제약 주파수영역 블럭적응 여파기에 관해서 논의한다. 제 1 부의 마지막으로 여러가지 여파기 상수값들과 서로 다른 알고리즘들이 여파기 수렴특성에 미치는 영향을 컴퓨터 시뮬레이션을 통해서 조사한 결과를 발표한다. In this work we study extensively the structures and performance characteristics of the block least mean-square (BLMS) adaptive digital filters (ADF's) that can be realized efficiently using the fast Fourier transform (FFT). The weights of a BLMS ADF realized using the FFT can be adjusted either in the time domain or in the frequency domain, leading to the time-domain BLMS(TBLMS) algorithm or the frequency-domain BLMS (FBLMS) algorithm, respectively. In Part Ⅰof the paper, we first present new results on the overlap-add realization and the number-theoretic transform realization of the FBLMS ADF's. Then, we study how we can incorporate the concept of different frequency-weighting on the error signals and the self-orthogonalization of weight adjustment in the FBLMS ADF's , and also in the TBLMS ADF's. As a result, we show that the TBLMS ADF can also be made to have the same fast convergence speed as that of the self-orthogonalizing FBLMS ADF. Next, based on the properties of the sectioning operations in weight adjustment, we discuss unconstrained FBLMS algorithms that can reduce two FFT operations both for the overlap-save and overlap-add realizations. Finally, we investigate by computer simulation the effects of different parameter values and different algorithms on the convergence behaviors of the FBLMS and TBLMS ADF's. In Part Ⅱ of the paper, we will analyze the convergence characteristics of the TBLMS and FBLMS ADF's.

      • KCI등재

        A Comparative Study of Speaker Adaptation Methods for HMM-Based Speech Recognition

        구명완,은종관,이황수,Koo, Myoung-Wan,Un, Chong-Kwan,Lee, Hwang-Soo The Acoustical Society of Korea 1991 韓國音響學會誌 Vol.10 No.3

        본 논문에서는 HMM을 이용한 음성인식 시스템에서 2단계로 이루어지는 화자적응 알고리즘의 성능비교를 수행하였다. 첫단계는 새로운 화자와의 거리차이를 줄여주는 VQ 적응방식들로 구성되는 이 방식들 중에서 lable prototype 적응, 적응음성으로부터 구성된 VQ코우드 북을 사용한 적응 및 사상 코우드 북을 사용한 적응등의 알고리즘 성능비교를 하였다. 두 번째 단계는 새로운 화자를 위해서 HMM 파라미터를 변환시켜주는 HMM 피라미터 적응방식들로 이루어지는데 이 방법들 중에서 Viterbi 알고리즘, DTW 알고리즘, iterative alignment 알고리즘 및 fuzzy histogram 알고리즘의 성능을 비교하였다. 성능비교 결과 fuzzy histogram 알고림즘에 의한 화자적응 방식이 최고의 인식율을 나타내었다. In this paper, we compare the performances of speaker adaptation which consist of two stages of processing for an HMM-based speech recognition system. We compare three kinds of VQ adaptation methods which may be used in the first stage to reduce the distortion error for a new speaker : label prototype adaptation, adaptation with a codebook from adaptation speech itself, and adaptation with a mapped codebook. We then compare the performance of four kinds of HMM parameter adaptation methods which may be used in the second stage to transform HMM parameters for a new speaker : adaptation by the Viterbi algorithm, that by the DTW algorithm, that by the iterative alignment algorithm. The results show that adaptation based on the fuzzy histogram algorithm yields the highest accuracy in an HMM-based speech recognition system.

      • KCI등재

        연속분포 HMM에서 평행분기 음성단위를 사용한 단어인식율 향상연구

        박용규,은종관,Park, Yong-Kyuo,Un, Chong-Kwan The Acoustical Society of Korea 1995 韓國音響學會誌 Vol.14 No.e2

        단어인식의 성능향상을 위하여 평행분기 음성단위(subunit) 모델의 사용을 제안하였으며 연속 분포 HMM에서 이 모델은 각 음성단위를 확률분포함수 (mixture components)를 이용하여 분기시킴에 의해 얻어진다. 제안된 방법을 사용한 결과에 따르면 기존에 제안된 평행분기 [1] 음성단위 모델이나 단일분기 모델보다 높은 인식률을 얻을 수 있었다. 본 연구에서는 각 음성단위에 대해 활률분포함수나 분기수의 적절한 결합을 통해 높은 인식률을 얻는데 이 1036 한국어 결리단어가 인시실험에 사용되었다. In this paper, we propose to use a parallel-branch subunit model for improved word recognition. The model is obtained by splitting off each subunit branch based on mixture component in continuous hidden Markov model(continuous HMM). According to simulation results, the proposed model yields higher recognition rate than the single-branch subunit model or the parallel-branch subunit model proposed by Rabiner et al[1]. We show that a proper combination of the number of mixture components and the number of branches for each subunit results in increased recognition rate. To study the recognition performance of the proposed algorithms, the speech material used in this work was a vocabulary with 1036 Korean words.

      • KCI등재

        X. 25와 SDLC간 Protocol Converter의 성능 분석에 관한 연구

        청해,은종관,Chung, Hae,Un, Chong-Kwan 한국통신학회 1991 韓國通信學會論文誌 Vol.16 No.9

        본 논문에서는 CCITT에서 채택된 X.2.5 network과 IBM이 채택한 System network architecture(SNA)의 synchronous data link control(SDLC)간의 protocol converter의 성능 분석을 한다. 여기서 protocol converter의 link level map-ping method를 사용하여 구현 되었다고 가정한다. 성능 분석을 통하여 각종 parameter에 대한 throughput과 mean waiting time을 구하며, 다양한 paramerter에 대하여 최적의 값을 조사한다. 특히 converter가 추정한 SDLC frame이 X.25. network packetizing과 규정한 최대 data packet size 보다 더 클 경우에 frame을 분할하게 되는데. 분할방식에 있어서 full and remainder packetzing과 equal packetizing 도입하여 서로간의 성능을 비교한다. message를 분할 할 때 조격으로 나누는 것이 frame의 오류를 줄일 수 있기 때문에 전자보다 후자가 성능면에서 우수함을 알 수 있다.

      • KCI등재

        이산분포 HMM을 이용한 음성인식에서의 코드워드 Tying 알고리즘

        김도영,김남수,은종관,Kim, Do-Yeong,Kim, Nam-Soo,Un, Chong-Kwan 한국음향학회 1994 韓國音響學會誌 Vol.13 No.3

        본 논문에서는 수형구조 분류기를 이 용한 코드워드 tying 알고리즘을 제안한다. 코드워드와 상태간의 통계적 특성을 이용한 일종의 soft decision 방식이라고도 볼 수 있는 제안된 알고리즘은 빠른 트리 구성과 유일한 최적의 해를 제공하는 특징이 있다. 또한, 이산분포 hidden Markov model(HMM)을 이용한 인식 시스템에 쉽게 적용이 가능하다는 장점을 가진다. 제안된 알고리즘의 성능 평가를 위한 화자독립 격리단어 인식실험에서 코드북 크기가 256과 512일 경우에 대해 각각 $6\%$, $9\%$의 오차를 감소시켰으며, HMM 파라미터도 $20\%$ 정도 줄임을 확인하였다. In this Paper, we propose a new codeword tying algorithm based on a tree structured classfier. The proposed algorithm which can be viewed as a kind of soft decision using statistical properties between codewords and states has an advantage of fast construction, and guarantees a unique optimal solution. Also, it can easily be applied to any speech recognition system based on discrete hidden Markov model (HMM). Experimental results on speaker-independent isolated word recognition show error reduction of $6\%$ for the codebook of size 256 and $9\%$ for 512 size and also HMM parameter reduction of about $20\%$.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼