http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
잡음환경에서의 Noise Cancel DTW를 이용한 음성인식에 관한 연구
안종영,김성수,김수훈,고시영,허강인 한국인터넷방송통신학회 2011 한국인터넷방송통신학회 논문지 Vol.11 No.4
본 논문에서는 잡음 환경에서의 음성인식 개선에 관한 내용으로 기존의 DTW에서 일종의 특징보상기법을 적용한 방식으로 예측잡음이 아닌 실생활에서의 음성잡음 데이터를 적용하여 인식모델을 잡음상황에 맞도록 적응시키는 방법으로 제안하는 Noise Cancel DTW를 사용하였다. 음성인식 시 주변노이즈를 고려한 참조패턴을 생성하여 특징 보상으로 인식률을 향상 시키는 방법으로 잡음 환경에서 음성 인식률을 향상 시켰다. In this paper, we propose the Noise Cancel DTW that to use a kind of feature compensation. This method is not to use estimated noise but we use real life environment noise data for Voice Recognition. And we applied this contaminated data for recognition reference model that suitable for noise environment. NCDTW is combined with surround noise when generating reference patten. We improved voice recognition rate at mobile environment to use NCDTW.
비 접촉식 차량용 Transmitter Switch에 관한 연구
안종영,김영섭,김성수,허강인 한국인터넷방송통신학회 2010 한국인터넷방송통신학회 논문지 Vol.10 No.5
현재 차량에서 일반적으로 많이 쓰이고 있는 변속 스위치의 방법은 전위차를 신호로하는 접촉식이다. 접촉식은 신호전달에 있어서 정확한 방식의 하나이지만 장시간 사용 시 접촉면의 노후화로 인하여 수명이 짧아진다. 비 접촉 방식으로 사용될 수 있는 자기센서를 사용 한다면 접촉면의 노후화를 해결 할 수 있다. 본 논문에서는 자기센서의 특징을 살려서 비 접촉식 방법으로 차량용 변속스위치에 적용 하여 기존 접촉식 방법의 문제를 해결하였다. 센서 출력 전압은 가변적인 전위차를 가지는데 스위치의 각동에 따라 통상 0mV에서 150mV의 값을 가진다. 본 연구에서는 5개의 상태 신호에 대한 두 개의 사인 신호를 사용 하였다. Now normally using a contact method of vehicle Inhibitor Switch that is use direct voltage level signal. This method is good solution for signal deliverly. but The contacted method have a short lifetime because of deterioration of contact surface. so we suggest to non-contacted method using magnetic sensor. The magnetic sensor is used to non-contacted method that is solution for problem of contacted method. In this paper using that of magnetic sensor feature, so we applied to Vehicle Transmitter switch that of non-contacting method. Sensor voltage outputs have variable electric potential that normally 0 mV to 150 mV, and it is depend on Switch Angle. we used two differential sin wave for switching of 5 state signal.
안종영,박창호,김상범,김주성,김수훈,허강인 동아대학교 공과대학 부설 한국자원개발연구소 1995 硏究報告 Vol.19 No.2
A feed forward neural network has been used for the pattern classification. It has the capability of representing a desired input-output mapping through the training of a given set of teaching patterns. In this paper, we proposed recognition by GPFN and PNN a kind of RBFN. The neural network can approximate a posteriori probability through Bay's theorm, by training it with binary vectors as target pattern corresponding to the categroies of input pattern. In the phoneme recognition, we compared the recognition rate of GPFN, PNN with Hybrid(VQ, LVQ) Algorithm. We found that recognition rate of LVQ-PNN, VQ-PNN had higher then that of them.
모델적응 HMM을 이용한 모바일환경에서의 음성인식에 관한 연구
안종영,김상범,김수훈,허강인,Ahn, Jong-Young,Kim, Sang-Bum,Kim, Su-Hoon,Hur, Kang-In 한국인터넷방송통신학회 2011 한국인터넷방송통신학회 논문지 Vol.11 No.3
본 논문에서는 모바일 환경에서의 음성인식 개선에 관한 내용으로 기존의 HMM에서 특징보상기법을을 적용한 방식으로 예측잡음이 아닌 실제 오염된 데이터를 적용하여 인식모델을 잡음상황에 맞도록 적응시키는 모델적응 HMM을 사용하였다. 음성인식 시 기존의 방법에서는 주변노이즈를 고려하지 않은 참조패턴을 사용하였으나 본 연구에서는 주변노이즈를 고려한 참조패턴을 생성하여 인식률을 향상 시키는 방법으로 모바일 환경에서의 음성 인식률을 향상 시켰다. In this paper, we propose the MA(Model Adaption) HMM that to use speech enhancement and feature compensation. Normally voice reference data is not consider for real noise data. This method is not to use estimated noise but we use real life environment noise data. And we applied this contaminated data for recognition reference model that suitable for noise environment. MAHMM is combined with surround noise when generating reference patten. We improved voice recognition rate at mobile environment to use MAHMM.
심장엽,안종영,김상범,허강인 東亞大學校 附設 情報通信硏究所 1995 情報通信硏究所論文誌 Vol.3 No.1
본 논문에서는 포-만트 vocoder를 구성하여 한국어 음성 합성을 연구하였다. 포-만트 vocoder의 구성에 필요한 합성파라메터로서는 스펙트럼 모멘트법에 의한 포-만트 주파수, 최적 Comb법에 의한 피치 주파수, 단시간 평균에너지와 단시간 평균진폭, 대역폭, 음원파형, 가우시안 백색잡음이다. 합성실험은 남성 화자가 발성한 음절, 단어, 문장 등의 음성데이터를 이용하였다. 청취결과, 유무성음에 대해 각각 Rosenberg의 음원파형과 삼각파를 음원으로 적용한 경우가 우수하였다. This paper studies on a method of Korean speech synthesis by composing formant VOCODER. The parameters of speech synthesis are formant frequencies by spectrum moment method, pitch frequencies by optimum Comb method, short time average energy, short time average amplitude, bandwidth, excitation wave and gaussian white noise. In this paper, synthesis is performed using speech data which are syllable, word and sentence spoken by man. Synthesis results are good in case of using Rosenberg & Triangle wave respectively as voice source.
박창호,안종영,김주성,김수훈,이영재,허강인 동아대학교 공과대학 부설 한국자원개발연구소 1995 硏究報告 Vol.19 No.2
A conventional CHMM is unable to express time transient variation well. In this paper, we formed segments to combine several frames and made up a vector for each segment to reflect a dynamic variation speech. If we used as they were, the number of parameter's dimensions increased. Therefore we could not estimate aptly when the train date was insufficient. So we compressed the parameter's dimensions and decreased the number of parameter's dimensions. At the exteriment, we compared the result of using vectors compressing mel-cepstrum by the K-L transformation with the result of using mel-cepstrum and mel-cepstrum coefficients. At the result, we got higher recognition rates of using mel-cepstrum and mel-cepstrum + regressive coefficients than that of using vectors compressing mel-cepstrum by the K-L transformation.