http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
최형기,박기영,김종교,Choi, Hyung-Ki,Park, Ki-Young,Kim, Chong-Kyo 대한전자공학회 2002 電子工學會論文誌 IE (Industry electronics) Vol.39 No.2
본 논문에서는, 음성 인식률 향상을 위하여 청각 특성을 기반으로 한 GFCC(gammatone filter frequency cepstrum coefficients) 파라미터를 음성 특징 파라미터로 제안한다. 그리고 전화망을 통해 얻은 고립단어를 대상으로 인식실험을 수행하였다. 성능비교를 위하여 MFCC(mel frequency cepstrum coefficients)와 LPCC(linear predictive cepstrum coefficient)를 사용하여 인식 실험을 하였다. 또한, 각 파라미터에 대하여 전화망의 채널 왜곡 보상기법으로 CMS(cepstral mean subtraction)를 도입한 방법과 적용시키지 않은 방법으로 인식실험을 하였다. 실험 결과로서, GFCC를 사용하여 인식을 수행한 방법이 다른 파라미터를 사용한 방법에 비해 향상된 결과를 얻었다. In this paper, we propose GFCC(gammatone filter frequency cepstrum coefficient) parameter which was based on the auditory characteristic for accomplishing better speech recognition rate. And it is performed the experiment of speech recognition for isolated word acquired from telephone network. For the purpose of comparing GFCC parameter with other parameter, the experiment of speech recognition are carried out using MFCC and LPCC parameter. Also, for each parameter, we are implemented CMS(cepstral mean subtraction)which was applied or not in order to compensate channel distortion in telephone network. Accordingly, we found that the recognition rate using GFCC parameter is better than other parameter in the experimental result.
최대림,김봉완,김종교,이용주,Choi, Dae-Lim,Kim, Bong-Wan,Kim, Chong-Kyo,Lee, Yong-Ju 대한음성학회 2007 말소리 Vol.62 No.-
In this paper, we introduce a phone vector discrete HMM(PVDHMM) that decodes a phone sequence string, and demonstrates the applicability to spoken document retrieval. The PVDHMM treats a phone recognizer or large vocabulary continuous speech recognizer (LVCSR) as a vector quantizer whose codebook size is equal to the size of its phone set. We apply the PVDHMM to decode the phone sequence strings and compare the outputs with those of a continuous speech recognizer(CSR). Also we carry out spoken document retrieval experiment through PVDHMM word spotter on the phone sequence strings which are generated by phone recognizer or LVCSR and compare its results with those of retrieval through the phone-based vector space model.
박기영,신유식,김종교,Park, Kee-Young,Shin, You-Shik,Kim, Chong-Kyo 대한전자공학회 1999 電子工學會論文誌-T Vol.t36 No.2
본 논문은 음성으로 다이얼링하는 시스템으로써, 화자종속 한국어 숫자음을 인식을 하기 위한 하드웨어를 구성한 논문이다. 음성 다이얼링 시스템은 충격계수를 이용하여 한국어 숫자음을 인식하도록 하였다. 여기서 제안한 음성 다이얼링 시스템은 적분기, 레벨분별회로 그리고 인식프로그램으로 구성하였다. 아날로그 음성 신호는 차단 주파수 4.5(kHz)를 지닌 저주파 필터를 통해 음성 다이얼링 시스템에 입력하였다. 화자 종속 한국어 숫자음 인식은 하드웨어 시스템에 의해 확실하게 인식 되었음을 확인하였다. 실험결과는 한국어 숫자음 음성인식에 대해 평균 64(%)의 인식율이 나왔고, 숫자음 /사/, /오/, /육/, /칠/, /구/, /영/에 대해서는 100(%)의 인식율을 나타내었다. This paper described a voice dialing system(VDS) and its hardware implementation for a speaker-dependent recognition of Korean digit speech using duty cycle. The proposed VDS consist of integrator, leveling divider circuit and recognition program. The analog speech signal is applied to the VDS through the low-pass filter cutoff frequency is 4.5(kHz). It is thoroughly confirmed that the speaker-dependent recognition of Korean digit speech is well behaved by the hardware system. Experimental results show that the recognition rate is 64% in average for Korean digit speech. Moreover, a high recognition rate of 100% is obtained for digits; /4/, /5/, /6/, /7/, /9/, /0/.
신유식,박기영,김종교,Shin, You-Shik,Park, Kee-Young,Kim, Chong-Kyo 대한전자공학회 1999 電子工學會論文誌-T Vol.t36 No.4
본 연구는 문맥 독립형 화자 인식 알고리즘을 이용하여 보안시스템을 소프트웨어와 하드웨어로 구성한 논문이다. 화자인식을 이용한 보안시스템은 윈도우상에서 사운드카드를 이용하여 음성을 입력받고, 성도 모델링을 이용한 음성 파라미터를 추출하였으며, k-means 클러스터링 알고리즘을 기반으로 하여 화자를 모델링하였다. 등록된 화자에 대한 인식된 결과는 PIC16F84 마이크로 프로세서를 이용하여 자물쇠를 개${\cdot}$폐하도록 구성하였다. OFF-LINE의 실험은 TIMIT데이터를 이용하였으며, 5명의 화자에 대하여 ON-LINE으로 인식한 결과 학습시킨 데이터에 대해서는 100%의 인식률을 얻었으며 학습을 시키지 않은 데이터에 대해서는 99%의 인식률을 얻었다. 그리고 사용자 거부율 1%, 사칭자 허용률 0%, 검증평균오류는 0.5%를 보였다. This paper described a security system using text-independent speaker recognition algorithm. Security system is based on PIC16F84 and sound card. Speaker recognition algorithm applied a k-means based model and weighted cepstrum for speech features. As the experimental results, recognition rate of the training data is 100%, non-training data is 99%. Also false rejection rate is 1%, false acceptance rate is 0% and verification mean error rate is 0.5% for registered 5 persons.
문인섭,최형기,이철희,박기영,김종교,Moon In-Seob,Choi Hyoung-Ki,Lee Chul-Hee,Park Ki-Young,Kim Chong-Kyo 대한음성학회 2004 말소리 Vol.49 No.-
In this paper, we make a study of classification normal from abnormal - normal, asthma through analysis of thoracic sound to take use thoracic sound detection system. Thoracic sound detection system has a function to store thoracic sound and analyze the data. The wave shape of thoracic sound is similar to noise and is systematically generated by inhalation and exhalation breathing, therefore, in this paper, to classify asthma sound in thoracic sound, we could discriminate between normal and abnormal case using level crossing rate(LCR) and spectrogram energy rate.
이철희 ( Chul Hee Lee ),김종교 ( Chong Kyo Kim ) 전북대학교 공학연구원 (구 전북대학교 공업기술연구소) 2005 工學硏究 Vol.36 No.-
In this paper we proposed a method which can improve speech intelligibility and naturalness under a low bit rate speech coder. Here we use an adaptive time scale modification based on waveform similarity overlap add algorithm. We applied the method as a pre-processor in MELP speech coder using different scale factors determined by three kind of speech regions : voiced, unvoiced sound and silence. The energy and ZCR(Zero Crossing Rate) parameters are used to determine scale factors.