http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
위상 일치와 가변 지수 감쇄 가중치 방법이 적용된 가상 저음 시스템
문현기(Hyeongi Moon),박영철(Yeong-cheol Park),윤대희(Dae Hee Youn) 한국방송·미디어공학회 2016 한국방송공학회 학술발표대회 논문집 Vol.2016 No.6
본 논문은 스피커의 저역 재생 대역을 확장하기 위한 가상 저음 시스템의 성능을 향상시키기 위한 방법을 제안하였다. 제안 방법은 생성하는 신호의 위상을 기존 신호의 위상과 맞추어 강화 과정에서 발생하는 상쇄간섭의 가능성을 제거한다. 또한 생성한 배음의 상대적 크기를 기본 주파수에 맞추어 가변적으로 적용하여 저역감을 효과적으로 강화하면서 음색의 열화를 줄이는 방법을 제시한다. 제안한 알고리즘은 기존 가상 저음시스템보다 더 높은 성능을 가지는 것을 확인하였으며, 스피커 환경에서 저역 재생 성능의 향상을 확인하였다.
Deep neural network 기반 오디오 표식을 위한 데이터 증강 방법 연구
김범준,문현기,박성욱,박영철,Kim, Bum-Jun,Moon, Hyeongi,Park, Sung-Wook,Park, Young cheol 한국음향학회 2018 韓國音響學會誌 Vol.37 No.6
본 논문에서는 DNN(Deep Neural Network) 기반 오디오 표식을 위한 데이터 증강 방법을 연구한다. 본 시스템에서는 오디오 신호를 멜-스펙트로그램으로 변환하여 오디오 표식을 위한 심층신경망의 입력으로 사용한다. 적은 수의 훈련 데이터를 사용하는 경우 발생하는 문제를 해결하기 위해, 타임 스트레칭, 피치 변화, 동적 영역 압축, 블록 혼합 등의 방법을 사용하여 훈련 데이터를 증강시켰다. 사용된 데이터 증강 기법의 최적 파라미터와 최적 조합을 오디오 표식 시뮬레이션을 통해 확인하였다. In this paper, we present a study on data augmentation methods for DNN (Deep Neural Network)-based audio tagging. In this system, an audio signal is converted into a mel-spectrogram and used as an input to the DNN for audio tagging. To cope with the problem associated with a small number of training data, we augment the training samples using time stretching, pitch shifting, dynamic range compression, and block mixing. In this paper, we derive optimal parameters and combinations for the augmentation methods through audio tagging simulations.
변준(Joon Byun),김범준(Bum-Jun Kim),전신혁(Shin-Hyuk Jeon),문현기(Hyeongi Moon),박영철(Young-cheol Park),박성욱(Sung-wook Park) 대한전자공학회 2018 대한전자공학회 학술대회 Vol.2018 No.6
This paper reviews the system that was submitted to the DCASE challenge. Unlike conventional methods, DNN-based methods shows a remarkable performance improvement in sound event detection for a short time. We analyze the recent research trend of DNN-based audio tagging and acoustic event detection.