http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Adaptive Band Selection for Robust Speech Detection In Noisy Environments
Ji Mikyong,Suh Youngjoo,Kim Hoirin The Korean Society Of Phonetic Sciences And Speech 2004 말소리 Vol.50 No.-
One of the important problems in speech recognition is to accurately detect the existence of speech in adverse environments. The speech detection problem becomes severer when recognition systems are used over the telephone network, especially in a wireless network and a noisy environment. In this paper, we propose a robust speech detection algorithm, which detects speech boundaries accurately by selecting useful bands adaptively to noisy environments. The bands where noises are mainly distributed, so called, noise-centric bands are introduced. In this paper, we compare two different speech detection algorithms with the proposed algorithm, and evaluate them on noisy environments. The experimental results show the excellence of the proposed speech detection algorithm.
Probabilistic Class Histogram Equalization for Robust Speech Recognition
Youngjoo Suh,Mikyong Ji,Hoirin Kim IEEE Signal Processing Society 2007 IEEE signal processing letters Vol.14 No.4
<P>In this letter, a probabilistic class histogram equalization method is proposed to compensate for an acoustic mismatch in noise robust speech recognition. The proposed method aims not only to compensate for the acoustic mismatch between training and test environments but also to reduce the limitations of the conventional histogram equalization. It utilizes multiple class-specific reference and test cumulative distribution functions, classifies noisy test features into their corresponding classes by means of soft classification with a Gaussian mixture model, and equalizes the features by using their corresponding class-specific distributions. Experiments on the Aurora 2 task confirm the superiority of the proposed approach in acoustic feature compensation</P>
Noise-Robust Speaker Recognition Using Subband Likelihoods and Reliable-Feature Selection
Sungtak Kim,Mikyong Ji,김회린 한국전자통신연구원 2008 ETRI Journal Vol.30 No.1
We consider the feature recombination technique in a multiband approach to speaker identification and verification. To overcome the ineffectiveness of conventional feature recombination in broadband noisy environments, we propose a new subband feature recombination which uses subband likelihoods and a subband reliable-feature selection technique with an adaptive noise model. In the decision step of speaker recognition, a few very low unreliable feature likelihood scores can cause a speaker recognition system to make an incorrect decision. To overcome this problem, reliable-feature selection adjusts the likelihood scores of an unreliable feature by comparison with those of an adaptive noise model, which is estimated by the maximum a posteriori adaptation technique using noise features directly obtained from noisy test speech. To evaluate the effectiveness of the proposed methods in noisy environments, we use the TIMIT database and the NTIMIT database, which is the corresponding telephone version of TIMIT database. The proposed subband feature recombination with subband reliable-feature selection achieves better performance than the conventional feature recombination system with reliablefeature selection.
AURORA 잡음 처리 알고리즘을 이용한 전화망 환경에서의 강인한 음성 검출
서영주,지미경,김회린,Suh Youngjoo,Ji Mikyong,Kim Hoi-Rin 대한음성학회 2003 말소리 Vol.48 No.-
This paper proposes a noise reduction-based speech detection method under telephone channel environments. We adopt the AURORA front-end noise reduction algorithm based on the two-stage mel-warped Wiener filter approach as a preprocessor for the frequency domain speech detector. The speech detector utilizes mel filter-bank based useful band energies as its feature parameters. The preprocessor firstly removes the adverse noise components on the incoming noisy speech signals and the speech detector at the next stage detects proper speech regions for the noise-reduced speech signals. Experimental results show that the proposed noise reduction-based speech detection method is very effective in improving not only the performance of the speech detector but also that of the subsequent speech recognizer.
Full HD H.264 카메라를 이용한 감시 시스템의 다채널 Client Viewer 구현
김규석(Kyu-Seok Kim),지미경(Mikyong Ji),김천석(Cheonseog Kim) 한국방송·미디어공학회 2010 한국방송공학회 학술발표대회 논문집 Vol.2010 No.7
CCTV(closed-circuit television) 시스템은 현재 도로 교통감시, 아파트 방범, 차량 번호판 인식 등 많은 분야에서 사용되고 있다. 사용되는 여러 분야에서 실제 물체와 감시 영상의 오차를 줄이기 위해 좀 더 향상된 화질의 영상을 필요로 하고 있다. 디지털 카메라가 보편화 되고 또한 급속한 영상 압축 기술의 발전으로 인해 고화질의 영상을 지원하는 카메라가 빠르게 출시 되고 있다. 현재 보편화된 영상 압축 기술 중 가장 뛰어난 성능을 발휘하는 H.264를 지원 하는 카메라를 사용한 CCTV 감시 시스템이 늘고 있는 것이 현실이다. 본 논문에서는 H.264를 이용하여 고화질의 영상을 지원하는 여러 카메라를 동시에 원격으로 감시할 수 있는 Client Viewer 를 구현 하였다. 구현한 Client Viewer 는 실시간 재생 기능 및 녹화 기능을 지원 하며 녹화된 영상을 검색하고 재생하는 DVR 기능도 지원한다.
김규석(Kyuseok Kim),윤정현(Jeong Hyun Yoon),김천석(Cheonseog Kim),지미경(Mikyong Ji) 한국방송·미디어공학회 2009 한국방송공학회 학술발표대회 논문집 Vol.2009 No.11
VOD(Video On Demand) 서비스는 통?방 융합 환경에서의 킬러서비스로, 지상파 방송사에서는 인터넷을 통해 ‘다시 보기’, ‘TV VOD’ 등의 서비스를 제공하고 있다. 이러한 기존의 방송 VOD 서비스는 콘텐트를 실제 재생하기 전에는 사용자가 원하는 장면을 찾기가 쉽지 않으며, 또한 콘텐트를 실제 재생하더라도 대사 내용이 텍스트로 제공되지 않으므로 청각 장애자의 경우 내용을 파악하기가 어렵다. 본 논문에서는 이와 같은 기존의 방송 VOD 서비스의 단점을 보완하기 위해 디지털 방송 프로그램으로부터 자막 데이터를 추출하고 이를 기반으로 방송 콘텐트의 구간 정보를 생성하기 위한 연구 내용과 이를 적용하여 웹사이트를 통해 제공되고 있는 ‘주요장면 보기’ 서비스의 실 구축 사례를 소개한다.