RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재
      • KCI등재

        Gauss-Markov 추정기를 이용한 비트 동기화를 위한 파라미터 추정에 관한 연구

        유흥균,안수길,Ryu, Heung-Gyoon,Ann, Sou-Guil 대한전자공학회 1989 전자공학회논문지 Vol. No.

        부가성 가우시안 잡음 상황하에서, 미지의 확률 분포를 갖는 양극성 2진 불규칙 수형파 신호의 중요한 파라미터인, 진폭과 위상을 Gauss-Markov 추정기를 사용하여 동시에 추정하므로써 전송된 디지탈 데이타를 복원하였다. 그러나, Gauss-Markov 추정기가 이용되기 위해서는 승산기와 적분기로 구성된 상관기를 사용하여, 수신 신호를 표본화 급수로 변환하고 관측된 데이타 벡타를 얻기 위한 사전 처리단계가 필요하게 됨을 알게 되었다. The parameters of bipolar random square-wave signal process, amplitude and phase with unknown probability distribution are shown to be simultaneously estimated by using Gauss-Markov estimator so that transmitted digital data can be recovered under the additive Gaussinan noise environment. However, we see that the preprocessing stage using the correlator composed of the multiplier and the running integrator is needed to convert the received process into the sampled sequences and to obtain the observed data vectors, which can be used for Gauss-Markov estimation.

      • KCI등재

        음성 에너지계산에서 창함수-길이 변화영향의 개선에 관한 연구

        배명진,안수길,Bae, Myung-Jin,Ann, Sou-Guil 한국음향학회 1990 韓國音響學會誌 Vol.9 No.2

        음성신호의 전처리과정에서 에너지 퍼래미터는 음소의 변화특성을 나타내기 때문에 많이 사용하고 있다. 그렇지만 추출과정에서 창함수를 적용하기 때문에 창함수길이에 따른 영향을 받게된다. 본논문에서는 창함수길이에 따른 영향을 측정하고 그 영향을 최소화시키는 에너지추출법을 새로이 제안하였다. 이방법으로 추출된 에너지변화도는 창함수길이의 영향을 제거시켰기 때문에 음소의 변화특성을 잘나타낸다. 또한 계산시간은 샘플당 한번의 뺄셈과 덧셈, 그리고 두 번의 비교연산만 있으면 된다. The energy parameter is widely used in pre-processing of speech signals, because it represent the phoneme characteristics of well But, the energy parameter is affected by the window length during the extracting. Thus, in this paper, the window length effects are studied in detail, and we proposed a new energy extraction algorithm that reduces the length effects. The energy contours with this algorithm are well representing for the characteristics of speech phonemes. And the computations to implement the algorithm are only required one subtraction, one addition, and two comparison aperation per speech sample.

      • KCI등재

        Discriminative Training of Predictive Neural Network Models

        나경민,임재열,안수길,Na, Kyung-Min,Rheem, Jae-Yeol,Ann, Sou-Guil The Acoustical Society of Korea 1994 韓國音響學會誌 Vol.13 No.e1

        예측신경회로망 모델은 패턴 예측에 의한 매우 효과적인 음성인식 모델이다. 그러나, 그러한 모델은 유사한 어휘간에서 변별력이 떨어지는 단점이 있다. 이 논문에서는 그러한 단점을 극복하기 위한 변별력있는 학습 알고리즘을 제안한다. 이 알고리즘은 최소 분류 오차 수식화와 GPD 알고리즘으로부터 유도외면 그에 따라서 인식 오차의 수를 직접 최소화하는 것이 가능하다. 한국어 숫자음에 대한 인식 실험결과, 기존의 알고리즘에서 발생하는 오인식의 30%를 줄일 수 있었다. Predictive neural network models are powerful speech recognition models based on a nonlinear pattern prediction. But those models suffer from poor discrimination between acoustically similar words. In this paper we propose an discriminative training algorithm for predictive neural network models. This algorithm is derived from GPD (Generalized Probabilistic Descent) algorithm coupled with MCEF(Minimum Classification Error Formulation). It allows direct minimization of a recognition error rate. Evaluation of our training algoritym on ten Korean digits shows its effectiveness by 30% reduction of recognition error.

      • KCI등재

        배경잡음하에서 주파수영역 피치검출에 관한 연구 -스펙트럼 AMDF에 의한 제 1포먼트 영향 제거법-

        배명진,박찬수,안수길,Bae, Myung-Jin,Park, Chan-Sou,Ann, Sou-Guil 한국음향학회 1991 韓國音響學會誌 Vol.10 No.4

        Detecting the fundamental frequency(Fo) of the speech signal is a problem in many speech applications. A problem of the pitch detection method in the frequency domain is occurred by the first formant and the background noise. Thus, in this paper, we proposed a pitch detection algorithm in the frequency domain that reduces the effects of the first formant and the background noise by the spectral AMDF function. Several computer simulation results showed that the proposed algorithm was very effective for fundamental frequency detection. 음성 신호처리 분야에서 기본주파수를 정확히 검출하는 것이 아주 중요하다. 주파수 영역에서 피치검출 방법의 문제점은 대체로 배경잡음이나 제 1 포먼트에 의하여 발생한다. 그러므로, 본 논문에서는 스펙트럼 AMDF 함수를 이용하여 잡음의 영향이나 제 1 포먼트의 영향을 줄이는 주파수영역 피치검출 앨고리즘을 제안하였다. 여러 가지 컴퓨터 시뮬레이션 결과 제안한 앨고리즘이 기본주파수 검출에 효과적으로 나타났다.

      • KCI등재

        상관관계 특성을 용한 CELP 보코더의 고속 피치검색 알고리듬

        이주헌,배명진,안수길,Lee, Joo-Hun,Bae, Myung-Jin,Ann, Sou-Guil 한국음향학회 1994 韓國音響學會誌 Vol.13 No.e2

        CELP 타입의 보코더에서 가장 큰 단점은 계산량이 상당히 커서 실시간 구현에 어려움이 많다는데 있다. 이러한 계산량의 부담을 줄이기 위해서 본 논문에서는 음질의 저하없이 피치검색시간을 단축하는 간단한 방법을 제안한다. 음성신호의 상관함수에서 발견되는 몇 가지의 특성으로부터 피치검색은 상관함수의 양의 구간만으로 한정될 수 있다. 이러한 피치검색구간의 한정은 상관함수에서 음의 진폭구간을 앞선 양의 진폭 구간의 폭만큼으로 추정하여 건너뜀으로서 구현할 수 있다. 또한 검색되는 피치래그의 개수를 일정한 수로 제한할 수도 있는데 실험적으로 약 58로 제한된다. 따라서 제안된 수의 피치래그에서만 피치검색이 수행된다. 제안된 방법으로 피치검색을 수행한 결과 기존의 방법에 비하여 음질의 저하없이 약 51%의 시간단축이 되었다. The major drawback to the Code Excited Linear Prediction(CELP) type vocoders is their large computational requirements. In this paper, a simple method is proposed to reduce the pitch searching time in the pitch filter almost without degradation of quality. Bease upon the observational regularity of the correlation function of speech, the searching range can be restricted to the positive side in pitch search. This is done by skipping the negative side with the width which is estimated from the previous positive envelope. In addition to that, the maximum number of available lags can be limited by the threshold, $L_T$, which is set on 58 empirically. So, only the limited numbers of lags are considered in pitch search, which is less than a half of that of the full search method. By using the proposed method in pitch search, its required computations are greatly reduced. Experimental result shows 51% time reduction almost without lowering the speech quality in segmental SNR measure.

      • KCI등재

        배경 잡음하에서 스펙트럼 누설현상을 이용한 음성신호의 중심 피치 검출

        강동규,배명진,안수길,Kang, Dong-Kyu,Bae, Myung-Jin,Ann, Sou-Guil 한국음향학회 1991 韓國音響學會誌 Vol.10 No.1

        지금까지 제안된 피치 수정 앨고리즘들은 남녀노소에 무관하게 폭넓은 피치범위를 검출하기가 어렵다. 조음기관의 물리적 한계성 때문에 피치의 분포도는 일반적으로 중심 피치에 몰려있는 형태가 된다. 이 중심 피치를 본격적인 피치검출 과정에 적용한다면 그 처리과정이 간단해지고 정확도가 개선될 수 있다. 본 논문에서는 스펙트럼 누설현상을 이용하여 중심피치를 정확하게 검출하는 앨고리즘을 제안한다. The pitch estimation algorithms witch have proposed until now are difficult to detect wide range pitches regardless of age or sex. A little deviation are observed with reference to the center pitch in the distribution diagram of pitches, since pitches are characterized by a physical limitation of the coarticulation mechanism. If the center pitches are refered to the accurate pitch extraction procedure, the algorithms will be not only simplified in procedure but also improved in accuracy. In this paper, we proposed an algorithm that the center pitches are accurately detected by using the spectrum leakage phenomenon for the noise speech signals.

      • KCI등재

        극대 및 극소점에서의 비균일 표본화에 의한 음성압축

        임재열,백성준,안수길,김범훈,Rheem, Jae-Yeol,Baek, Sung-Joon,Ann, Sou-Guil,Kim, Bum-Hoon 한국음향학회 1992 韓國音響學會誌 Vol.11 No.4

        리던던시(redundancy)가 존재하는 신호의 데이타 압축을 위한 한 방법으로 비균일 표본화 방법이 연구되어져 왔다. 그런데 많은 리던던시가 존재한다고 알려진 음성신호에 기존의 비균일 표본화 방법을 그대로 적용하며, 데이타량이 PCM과 같은 균일 표본화에 의한 것에 필적하게 되거나 오히려 많아지게 된다. 이 문제를 해결하기 위하여 본 논문에서는 음성의 인지측면에서 리던던트한 샘플을 제거하는, 극대점과 극소점에서 비균일 표본화하는 방법을 제안한다. 그리고 본 논문에서는 제안된 방법의 성능을 분석하고자, 실험적인 방법으로 압축비관계를 살펴보며, 아울러 묶음구간 처리에 의하여 압축비를 크게 향상 시킬 수 있음을 보인다. 실험결과로써는 8kHz 8-bit PCM신호에 대하여 1.54배, 묶음처리를 한 경우에는 2.88배의 압축비를 얻었다. To reduce the redundancy within samples that resulted from uniform sampling method, nonuniform sampling or nonredundant-sample coding methods can be considered. But it is well-known that when conventional nonuniform sampling methods are applied directly to speech signal, the amount of data required is comparable to or more than that required by uniform sampling method like PCM. To overcome this problem, we consider properties of speech signal in the sense of perception, and suggest a nonuniform sampling method at the maxima and minima of speech wave. To analyze the performance of the suggested method, compression ratio is considered. We show that compression ratio can be improved by silence detection, which can't be implemented by conventional methods based on uniform sampling. As experimental results, compression ratios of 1.54 without silence detection and 2.88 with silence detection for 8kHz 8-bit PCM signals are obtained.

      • KCI등재

        A New Speech Recognition Model : Dynamically Localized Self-organizing Map Model

        나경민,임재열,안수길,Na, Kyung-Min,Rheem, Jae-Yeol,Ann, Sou-Guil The Acoustical Society of Korea 1994 韓國音響學會誌 Vol.13 No.e1

        A new speech recognition model, DLSMM(Dynamically Localized Self-organizing Map Model) and its effective training algorithm are proposed in this paper. In DLSMM, temporal and spatial distortions of speech are efficiently normalized by dynamic programming technique and localized self-organizing maps, respectively. Experiments on Korean digits recognition have been carried out. DLSMM has smaller Experiments on Korean digits recognition have been carried out. DLSMM has smaller connections than predictive neural network models, but it has scored a little high recognition rate. 이 논문에서는 새로운 음성 인식 모델인 동적 국부 자기 조직 지도 모델과 그 학습 알고리즘을 제안한다. 동적 국부 자기 조직 지도 모델은 음성의 시간적, 공간적 왜곡을 프로그래밍 기법과 국부 자기 조직 지도로 각각 정규화 시킨다. 한국어 숫자음에 대한 실험 결과로 제안하는 모델이 예측 신경회로망 모델보다 적은 수의 연결을 갖고서도 약간 높은 인식률을 보여 효과적임을 알 수 있었다.

      • KCI등재

        프레임간 에너지 차를 이용한 음성신호의 종성 폐쇄음 구간 검출에 관한 연구

        배명진,최정아,안수길,Bae, Myung-Jin,Choi, Jung-Ah,Ann, Sou-Guil 대한전자공학회 1989 전자공학회논문지 Vol. No.

        음성 신호의 인식 시스템에서 분류 인식과정은 최종 인식과정에 필요한 복잡한 처리 과정을 줄여주기 때문에 유용하다. 본 논문에서는 종성 폐쇄음의 구간을 검출하는 분류인식 아고리듬을 제안하였다. 한국어의 종성 폐쇄음은 항상 모음 뒤에 발음되며, 그 특징은 모음 구간 내에 포함된다. 종성 폐쇄음 발음시에 연구개가 급히 닫히므로 에너지의 급격한 감소가 일어나고, 폐쇄 구간은 50~150msec간 지속된다. 이러한 성질을 나타내는 파라미터로 프레임간 에너지 차를 제안한다. Preprocessing in speech recognition system is useful, for it reduces some of the complicated procedures required for the final recognition. In this paper, we suggest a new preprocessing algorithm for detecting the intervals of implosive stop sounds. Implosive stop sounds follow vowels in Korean language, and its characteristic is included in the region of vowels. When an implosive stop is pronounced, the velum is quickly colsed, thus its energy decays abruptly and the closure lasts for about 50 to 150 msec. The enegy difference between adjacent frames is chosen as a parameter which represents well the above features.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼