RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
          펼치기
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재
      • 카오스를 위한 유사 음성 화자의 잡음제거

        서정파,권영헌,이건상 한양대학교 이학기술연구소 2002 이학기술연구지 Vol.4 No.-

        We proposed correlation exponent as feature vector of speaker recognition system aming the persons whose voices are much the same with each other. The ambiguity of speech utterance can be regarded as a chaotic property. For speakers whose voices appear to be nearly identical, with their vowel /i/ that is more chaotic than /a/,/e/,/o/, or /u/ was tested. since chaos which is sensitive to a noise, a reduction is necessary. We eliminate the noise by local projective noise reduction method and compare the behavior of the attractors of original speech and noise reduced speech. 본 논문에서는 발음이 매우 유사한 사람들 간의 화자 인식 시스템 구현을 위한 feature vector로써 correlation exponent의 사용을 제안하였다. 음성의 발성적 모호함을 chaos적인 특성으로 간주하고 formant 특성이 거의 동일하게 나타나는 화자들에 대해 모음 /i/ 발음을 채집하였다. 잡음에 민감한 카오스의 correlation exponent를 구하기 위해서는 선행적으로 잡음제거가 필수적이다. 이를 위해서 비선형 방법으로 잡음을 제거하고 잡음제거전의 각 화자들의 attractor를 비교하였다.

      • 대용량 어휘를 기반으로 한 화자의 적용 알고리즘

        홍승준,권영헌,이건상 한양대학교 이학기술연구소 2001 이학기술연구지 Vol.3 No.-

        화자독립인식기의 평균적인 성능은 좋더라도 사용하는 화자에 따라 인식률이 많이 차이가 난다. 이러한 문제점을 해결하기 위한 방법으로 본 논문에서는 기존의 codebook을 사용하여 사용자의 적은 어휘로써 높은 인식률을 가질 수 있는 화자 적응 방법을 제안한다. 본 논문에서는 대용량 어휘인식을 위해 음소인식에 뛰어난 성능을 지닌 CHMM(continuous hidden Markov model)을 사용하였고, 적응 알고리즘인 MAP(maximum a posterior)를 사용하여 HMM의 파라미터를 적응시키는 방법으로 대용량 어휘 인식률을 계산하였다. 화자 적응 알고리즘을 적용하기 이전과 화자 적응 알고리즘을 적용했을 때 인식률을 비교하였을 경우 음소 인식률이 40%이상 좋아짐을 알 수 있었다. In this paper. we propose a speaker adaptation algorithm. We make an experiment using CHMM which shows good performance for phoneme recognition. MAP formulation is developed to adapt the characteristics of speaker with the estimation of the HMM parameter from the training data. The proposed adaptation algorithm is evaluated in large vocabulary continuous speech recognition. In the experiment. we compare the recognition accuracy of the adapting acoustic model with that of common speaker. At the experimental results. MAP algorithm achieve up to about 40% additional reduction of error in phoneme recognition.

      • 화자 적응을 위한 알고리즘 개선

        함동훈,박정재,권영헌,이건상 한양대학교 이학기술연구소 2004 이학기술연구지 Vol.7 No.

        본 논문에서는 MAP(Maximum a Posterior re-estimation)와 MLLR(Maximal Likelihood Linear Regression) 그리고 이것의 결합 형태에 대하여 인식률을 비교하였다. MLLR은 확장 형태인 RCT(Regression Class Tree)를 적용하였다. Database는 한국어 4 연속 숫자음을 사용하였으며, 훈련 데이터는 남성 음성 4410개와 여성 음성 3610개 그리고 테스트 데이터는 각각 980, 910개를 사용하였다. 그 결과 결합된 형태의 적응 기술의 인식률이 더 좋은 결과를 보였다. 또한 적절한 tree depth와 mixture와 class node의 중가로 보다 좋은 인식률을 가져왔다. This paper studies the performances of MAP(Maximum a Posterior re-estimation), MLLR(Maximal Likelihood Lineal Regression) and the combined method of each basic schemes. RCT(Regression Class Tree) is extended to MLLR. Database of korean 4 continuous digit numbers is used. Trained data are 4410 of man's voice and 3610 woman's one. We use test data of 980 of man's voice and 910 of woman's one. As a result, we obtain better recognition rate for system that combines each basic schemes than one that has a basic scheme. Also we get better recognition rate as class node, mixture number and the suitable tree depth increase.

      • DSP를 이용한 음성인식기의 구현

        진흥석,권영헌,이건상,양성일 한양대학교 이학기술연구소 2002 이학기술연구지 Vol.4 No.-

        본 논문에서는 데스크탑 컴퓨터와는 독립적으로 제작된 음성인식기를 이용하여 실행활에 음성인식을 적용코자 홈 자동화 인식 실험과 자동차 명령어 인식 실험을 하였다. 일반적으로 제한된 PC상에서 이루어졌던 음성인식과정을 DSP로 구성된 작은 machine에서 이루어지도록 하였다. 인식 알고리즘은 HMM을 사용하였고, 10차의 cepstrum계수와 log scale energy를 음성의 특징파라미터로 사용하였다. 실험 결과, 홈 자동화를 위한 10개의 단어들에 대해서는 94%의 인식률을 얻었고, 자동차 명령어 인식을 위한 20개의 단어들에 대해서는 85%의 인식률을 획득할 수 있었다. In this paper, we made an speech recognition test for "home automation" and "car command" in real life using an independent speech recognition system. Genrtally, speech recognition test have done by desktop computer. However, we implement the speech recognition system in a small machine using Digital Signal Processor (DSP). In experiment, we use 10th order cepstrum coefficients and log-scaled energy as the feature vectors and Hidden Markov Model (HMM) as recognition tool. As a result, recognition rate is shown to be 94% for "home automation" and to be 85% for "car command".

      • 항공 예약을 위한 실시간 음성 인식기 구현

        이주헌,함동훈,권영헌,이건상 한양대학교 이학기술연구소 2002 이학기술연구지 Vol.5 No.-

        현재 항공기 예약 시스템을 사용하기 위해서 사용자는 전화, 인터넷 들을 이용하고 있다. 이러한 시스템은 상호 인터페이상의 제약에 따른 불편함이 있다. 본 논문은 음성 인식 기술을 바탕으로 보다 쉽고, 편리하게 항공기 예약 시스템을 사용할수 잇도록 실시간 인식기를 구현하였다. 음성 DB(database)는 인터넷상 예약 모델 시나리오에 기초하여 70여개의 단어에 대하여 5명의 화자에 대하여 20번씩 발음한 것을 이용하였다. code-book은 tri-phone을 기반으로 작성 하였으며,인식 속도의 향상을 위하여 인식 어휘에 따라 4종류로 code-book을 분리하여 5명의 훈련화자에 대해서는 선택 출발 도착지별 99.41%, 예매 인원수별 90.13%, 월별 74.17%, 일별 86.21%의 인식률을 얻었으며,테스트 화자(2명의 화자가 70여개의 단어에 대하여 5번씩 발음)에 대해서는 선택 출발 도착지별 97.47%, 예매 인원수별 90.00%, 월별 48.33%, 일별 75.48%의 인식률을 얻었다. Usually a user makes a reservation of airplane, through phone or internet etc. This brings some inconvenience such as restriction of mutual interface. This paper studies a realtime speech recognizer by which user conveniently makes use of aircraft It reservation system. We construct a speech database, which is based on the scenario of the reservation model in the Internet service, by recording 70 words pronounced by 5 speakers 20 times. Also for improving the recognition speed, we compose the code-book with four parts(departure and arrival, head count, month, and day). Then the recognition rates of 5 trained speakers are99.41% for departure and arrival section, 90.13% for the head count in advance purchase,74.17% for a month, and 86.21% for a day, and ones of 2 test speakers are 97.47%, 90.00%,48.33%, and 75.48%, respectively.

      • 적응 웨이블렛 기반 스펙트럼 차감법을 이용한 음성신호 개선에 관한 연구

        김진호,양성일,권영헌 한양대학교 이학기술연구소 2004 이학기술연구지 Vol.7 No.

        본 논문에서는 최근에 제안된 음성신호 개선을 위한 적응 웨이블렛 패킷 기반의 스펙트 럼 차감법을 이용하여 다양한 측면에서의 성능평가 결과를 제시한다. 사용된 음성신호 개선 방식은 적응 웨이블렛 패킨의 불균둥 주파수 해상도와 높은 에너지 집중도로 인해 발생하는 극대, 극소 값의 영향을 피하기 위해 기하평균을 이용하는 스펙트럼 추정법을 사용하였다. 다양한 측면의 성능평가를 위해 주관적 평가 척도인 MOS(Mean Opinion Score) 와 높은 상관도를 갖는 것으로 알려진 Log Likelihood Ratio, Segmental SNR, Weighted Spectral 지ope 둥을 평가 척도로 사용 하였다. Fourier 기저를 사용한 방식과의 비교에서 적응 웨이블렛 패킷 방식은 Segmental SNR 과 음성의 명료도를 비교적 잘 반영하는 Weighted Spectral Slope 측면에서 우수한 성능을 보였다. In this paper, we present the result using adaptive wavelet packet based spectral subtraction for speech enhancement. To avoid effects caused by inequal frequency resolution and high energy concentration of the adaptive wavelet packet, we use the speech enhancement method using with spectrum estimation with geometric mean. We choose test measures such as Log Likelihood Ratio, Log Area Ratio, Segmental SNR, and Weighted Spectral Slope. Comparing the wavelet basis with Fourier basis, we find that the adaptive wavelet basis shows better performance than Fourier basis in Weighted Spectral Slope.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼