http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
육동석,서형진,고봉구,유인철,Yook, Dongsuk,Seo, HyungJin,Ko, Bonggu,Yoo, In-Chul 한국음향학회 2022 韓國音響學會誌 Vol.41 No.3
Recently, Generative Adversarial Networks (GAN) and Variational AutoEncoders (VAE) have been applied to voice conversion that can make use of non-parallel training data. Especially, Conditional Cycle-Consistent Generative Adversarial Networks (CC-GAN) and Cycle-Consistent Variational AutoEncoders (CycleVAE) show promising results in many-to-many voice conversion among multiple speakers. However, the number of speakers has been relatively small in the conventional voice conversion studies using the CC-GANs and the CycleVAEs. In this paper, we extend the number of speakers to 100, and analyze the performances of the many-to-many voice conversion methods experimentally. It has been found through the experiments that the CC-GAN shows 4.5 % less Mel-Cepstral Distortion (MCD) for a small number of speakers, whereas the CycleVAE shows 12.7 % less MCD in a limited training time for a large number of speakers.
이선형(Sunhyung Lee),육동석(Dongsuk Yook) 한국멀티미디어학회 2010 한국멀티미디어학회 학술발표논문집 Vol.2010 No.2
본 논문에서는 음악을 기반으로 한 다양한 서비스를 제공하기 위한 음악 인식 시스템을 구축하기 위해 필립스 음악 검색 기법에 대한 실험을 수행하였다. 추출된 원본 음악과 신호가 변조된 음악과의 핑거프린트 유사도를 측정하고, look-up table 기반의 핑거프린트 데이터베이스 검색 정확도를 평가하였다. 그리고 비교 대상 음악의 길이를 다양화하여 검색 시스템의 효율성을 측정하였다.
이협우(Hyeopwoo Lee),육동석(Dongsuk Yook) 한국음성학회 2008 음성과학 Vol.15 No.3
In many practical applications of robots, finding the location of an incoming sound is an important issue for the development of efficient human robot interface. Most sound source localization algorithms make use of only those microphones that are acoustically visible from the sound source or do not take into account the effect of sound diffraction, thereby degrading the sound source localization performance. This paper proposes a new sound source localization method that can utilize those microphones that are acoustically shadowed from the sound source. The experiment results show that use of the acoustically shadowed microphones, which receive higher signal-to-noise ratio signals than the others and are closer to the sound source, improves the performance of sound source localization.
음절 기반 인식 단위를 사용한 한국어 연속 숫자음 인식
백향순(Hyang-Soon Baek),조선호(Sun-Ho Cho),육동석(Dongsuk Yook) 한국멀티미디어학회 2010 한국멀티미디어학회 학술발표논문집 Vol.2010 No.2
본 논문에서는 문맥 종속적인 음절인 trisyllable 을 이용한 한국어 숫자음 인식 방법을 제안한다. 한국어 연결 숫자음 인식 실험 결과 기존의 문맥 종속 음소 (triphone)를 이용한 방법보다 약 8.2% 오인식률이 감소하는 것을 관찰하였다.