http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
음향 혼합 데이터 증강 기법을 이용한 SincNet 기반의 음향 사건 감지
우범준(Beom Jun Woo),김형용(Hyung Yong Kim),윤지원(Ji Won Yoon),김정훈(Jeung Hun Kim),김남수(Nam Soo Kim) 한국통신학회 2021 한국통신학회 학술대회논문집 Vol.2021 No.2
본 논문은 주어진 음향 신호가 상황을 감지하는 모델을 데이터 증강 기법을 통해 성능 고도화하는 연구이다. 기존 음성 및 음향 데이터 증강기법으로 speed perturbation pitch shifting 그리고 noise adding과 같은 방법을 활용하였다. 음향 신호 2개를 임의로 뽑아서 mixup을 응용한 수식으로 섞어준 형태로 데이터 개수를 증강시켜주면 심층 신경망이 학습하는 과정에서 훈련 데이터를 과적합하는 것을 막을 뿐 더러 테스트 데이터셋의 실험 성능 향상이 있음을 보인다.
비자기 회귀 음성합성 시스템의 음정 및 길이 예측기 Finetuning 기법
안성환(Sung Hwan Ahn),김정훈(Jeong Hun Kim),우범준(Beom Jun Woo),김남수(Nam Soo Kim) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
본 논문은 딥러닝 기반 비자기 회귀 음성합성 시스템 학습시 음정 예측기 및 길이 예측기를 원하는 방향으로 finetuning 하는 기법에 관한 연구이다. 한 문장 단위로 구성된 데이터셋에 대해 음정 및 길이 예측기를 포함하는 음성합성 시스템을 학습한 후, 음정 및 길이 예측기를 2 분 동안 finetuning 하여 여러 문장을 한 번에 합성할 때도 자연스러운 음정과 길이를 가지도록 음성합성 시스템을 구축하였다.