RISS 검색 - 국내학술지논문 상세보기

다국어 입력

あぁかがさざただなはばぱまやゃらわゎんいぃきぎしじちぢにひびぴみりうぅくぐすずつづっぬふぶぷむゆゅるえぇけげせぜてでねへべぺめれおぉこごそぞとどのほぼぽもよょろを

アァカサザタダナハバパマヤャラワヮンイィキギシジチヂニヒビピミリウゥクグスズツヅッヌフブプムユュルエェケゲセゼテデヘベペメレオォコゴソゾトドノホボポモヨョロヲ ―

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)

中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.

ㅥ ㅦ ㅧ ㅨ ㅩ ㅪ ㅫ ㅬ ㅭ ㅮ ㅯ ㅰ ㅱ ㅲ ㅳ ㅴ ㅵ ㅶ ㅷ ㅸ ㅹ ㅺ ㅻ ㅼ ㅽ ㅾ ㅿ ㆀ ㆁ ㆂ ㆃ ㆄ ㆅ ㆆ ㆇ ㆈ ㆉ ㆊ ㆋ ㆌ ㆍ ㆎ

Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω

á à Á À é è É È ç Ç ê

Ä Ö Ü ä ö ü ß

ְ ֳ ֲ ֱ ָ ַ ֵ ֶ ִ ֹ ּ ֻ ׂ ׁ ּ פ ם ן ו ט א ר ק ף ך ל ח י ע כ ג ד ש ץ ת צ מ נ ה ב

‘ ’ “ ” 〔〕〈〉「」『』【】＂（）［］｛｝

± × ÷ ≠ ≤ ≥ ∞ ∴ ♂ ♀ ∠ ⊥ ⌒ ∂ ∇ ≡ ≒ ≪ ≫ √ ∽ ∝ ∵ ∫ ∬ ∈ ∋ ⊆ ⊇ ⊂ ⊃ ∪ ∩ ∧ ∨ ￢ ⇒ ⇔ ∀ ∃ ∮ ∑ ∏ ＋－＜＝＞

、。 · ‥ … ¨ 〃 ― ∥ ＼ ∼ ´ ～ ˇ ˘ ˝ ˚ ˙ ¸ ˛ ¡ ¿ ː ！＇，．／：；？＾＿｀｜

½ ⅓ ⅔ ¼ ¾ ⅛ ⅜ ⅝ ⅞ ¹ ² ³ ⁴ ⁿ ₁ ₂ ₃ ₄

Æ Ð Ħ Ĳ Ł Ø Œ Þ Ŧ Ŋ æ đ ð ħ ı ĳ ĸ ŀ ł ø œ ß þ ŧ ŋ ŉ

А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

′ ″ ℃ Å ￠￡￥ ¤ ℉ ‰ ＄％Ｆ￦㎕㎖㎗ ℓ ㎘㏄㎣㎤㎥㎦㎙㎚㎛㎜㎝㎞㎟㎠㎡㎢㏊㎍㎎㎏㏏㎈㎉㏈㎧㎨㎰㎱㎲㎳㎴㎵㎶㎷㎸㎹㎀㎁㎂㎃㎄㎺㎻㎽㎾㎿㎐㎑㎒㎓㎔ Ω ㏀㏁㎊㎋㎌㏖㏅㎭㎮㎯㏛㎩㎪㎫㎬㏝㏐㏓㏃㏉㏜㏆

§ ※ ☆ ★ ○ ● ◎ ◇ ◆ □ ■ △ ▽ → ← ↑ ↓ ↔ 〓 ◁ ◀ ▷ ▶ ♤ ♠ ♡ ♥ ♧ ♣ ⊙ ◈ ▣ ◐ ◑ ▒ ▤ ▥ ▨ ▧ ▦ ▩ ♨ ☏ ☎ ☜ ☞ ¶ † ‡ ↕ ↗ ↙ ↖ ↘ ♭ ♩ ♪ ♬ ㉿㈜ № ㏇ ™ ㏂㏘ ℡ ＃＆＊＠ ª º

ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ

ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ک ل م ن ه و ی

최근 검색 목록
전체삭제 닫기

RISS 인기검색어

잡음 환경에서의 음성인식을 위한 온라인 빔포밍과 스펙트럼 감산의 결합 = Combining deep learning-based online beamforming with spectral subtraction for speech recognition in noisy environments

한글로보기

https://www.riss.kr/link?id=A107876223

저자

윤성욱 (충북대학교) ; 권오욱 (충북대학교) ; Yoon, Sung-Wook ; Kwon, Oh-Wook
발행기관
한국음향학회
학술지명
韓國音響學會誌(The Journal of the Acoustical Society of Korea)
권호사항

Vol.40 No.5 [2021]
발행연도
2021
작성언어
Korean
등재정보
KCI등재,SCOPUS,ESCI
자료형태
학술저널
발행기관 URL
http://www.ask.or.kr
수록면

439-451(13쪽)
KCI 피인용횟수
0
DOI식별코드
10.7776/ASK.2021.40.5.439
제공처
ScienceON
소장기관
- 경북대학교 중앙도서관
- 서울대학교 중앙도서관

0
상세조회
0
다운로드
0
내보내기

서지정보 열기

부가정보

국문 초록 (Abstract)

본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음...

본 논문에서는 실제 환경에서의 연속 음성 강화를 위한 딥러닝 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합한 빔포머를 제안한다. 기존 빔포밍 시스템은 컴퓨터에서 음성과 잡음을 완전히 겹친 방식으로 혼합하여 생성된 사전 분할 오디오 신호를 사용하여 대부분 평가되었다. 하지만 실제 환경에서는 시간 축으로 음성 발화가 띄엄띄엄 발성되기 때문에, 음성이 없는 잡음 신호가 시스템에 입력되면 기존 빔포밍 알고리듬의 성능이 저하된다. 이러한 효과를 경감하기 위하여, 심층 학습 기반 온라인 빔포밍 알고리듬과 스펙트럼 감산을 결합하였다. 잡음 환경에서 온라인 빔포밍 알고리듬을 평가하기 위해 연속 음성 강화 세트를 구성하였다. 평가 세트는 CHiME3 평가 세트에서 추출한 음성 발화와 CHiME3 배경 잡음 및 MUSDB에서 추출한 연속 재생되는 배경음악을 혼합하여 구성되었다. 음성인식기로는 Kaldi 기반 툴킷 및 구글 웹 음성인식기를 사용하였다. 제안한 온라인 빔포밍 알고리듬 과 스펙트럼 감산이 베이스라인 빔포밍 알고리듬에 비해 성능 향상을 보임을 확인하였다.

더보기

참고문헌 (Reference)

1 J. Barker, "The third ‘CHiME’speech separation and recognition challenge: Dataset, task and baselines" 504-511, 2015

2 E. A. Habets, "The MVDR beamformer for speech enhancement" 225-254, 2010

3 Y. Takahashi, "Structure selection algorithm for less musical-noise generation in integration systems of beamforming and spectral subtraction" 701-704, 2009

4 T. V. d. Bogaert, "Speech enhancement with multichannel Wiener filter techniques in multimicrophone binaural hearing aids" 125 : 360-371, 2009

5 S. Gannot, "Speech enhancement based on the general transfer function GSC and postfiltering" 12 : 561-571, 2004

6 D. Gala, "Speech en-hancement combining spectral subtraction and beam-orming techniques for microphone array" 163-166, 2010

7 S. Zhao, "Robust speech recognition using beamforming with adaptive microphone gains and multichannel noise reduction" 460-467, 2015

8 N. Shankar, "Real-time dual-channel speech enhancement by VAD assisted MVDR beamformer for hearing aid applications using smartphone" 952-955, 2020

9 T. Higuchi, "Online MVDR beamformer based on complex Gaussian mixture model with spatial prior for noise robust ASR" 25 : 780-793, 2017

10 Y. Liu, "Neural network based time-frequency masking and steering vector estimation for two-channel MVDR beamforming" 6717-6721, 2018

1 J. Barker, "The third ‘CHiME’speech separation and recognition challenge: Dataset, task and baselines" 504-511, 2015

2 E. A. Habets, "The MVDR beamformer for speech enhancement" 225-254, 2010

3 Y. Takahashi, "Structure selection algorithm for less musical-noise generation in integration systems of beamforming and spectral subtraction" 701-704, 2009

4 T. V. d. Bogaert, "Speech enhancement with multichannel Wiener filter techniques in multimicrophone binaural hearing aids" 125 : 360-371, 2009

5 S. Gannot, "Speech enhancement based on the general transfer function GSC and postfiltering" 12 : 561-571, 2004

6 D. Gala, "Speech en-hancement combining spectral subtraction and beam-orming techniques for microphone array" 163-166, 2010

7 S. Zhao, "Robust speech recognition using beamforming with adaptive microphone gains and multichannel noise reduction" 460-467, 2015

8 N. Shankar, "Real-time dual-channel speech enhancement by VAD assisted MVDR beamformer for hearing aid applications using smartphone" 952-955, 2020

9 T. Higuchi, "Online MVDR beamformer based on complex Gaussian mixture model with spatial prior for noise robust ASR" 25 : 780-793, 2017

10 Y. Liu, "Neural network based time-frequency masking and steering vector estimation for two-channel MVDR beamforming" 6717-6721, 2018

11 J. Heymann, "Neural network based spectral mask estimation for acoustic beamforming" 196-200, 2016

12 S. Karimian-Azari, "Modulation spectrum based beamforming for speech enhancement" 91-95, 2017

13 Z. Rafii, "MUSDB18 - a corpus for music separation"

14 "Google WebRTC"

15 "Google Web Speech API"

16 J. S. Lim, "Enhancement and bandwidth compression of noisy speech" 1586-1604, 1979

17 D. Kitamura, "Determined blind source separation unifying independent vector analysis and nonnegative matrix factorization" 24 : 1626-1641, 2016

18 C. Deng, "DNN-based mask estimation integrating spectral and spatial features for robust beamforming" 4647-4651, 2020

19 H. Saruwatari, "Blind source separation combining independent component analysis and beam-forming" 2003 : 569270-, 2003

20 E. Warsitz, "Blind acoustic beamforming based on generalized eigenvalue de-composition" 15 : 1529-1539, 2007

21 E. Warsitz, "Blind acoustic beam forming based on generalized eigenvalue decomposition" 15 : 1529-1539, 2007

22 J. Heymann, "BLSTM supported GEV beamformer front end for the 3rd CHiME challenge" 444-451, 2015

23 Y. Zhou, "A real-time dual-microphone speech enhancement algorithm assisted by bone conduction sensor" 20 : 5050-, 2020

24 Y. Tachioka, "2Coupled Initialization of multi-channel non negative matrix factorization based on spatial and spectral information" 2461-2465, 2017

동일학술지(권/호) 다른 논문

문장 독립 화자 검증을 위한 그룹기반 화자 임베딩
- 한국음향학회
- 정영문
- 2021
- KCI등재,SCOPUS,ESCI
GSFM 펄스의 상관도에 기반한 연속 송수신 소나의 신호처리 구간 설정 방법
- 한국음향학회
- 김현수
- 2021
- KCI등재,SCOPUS,ESCI
능동소나를 위한 가중 딕션너리를 사용한 두 수신기 간 신호 지연 추정 방법
- 한국음향학회
- 임준석
- 2021
- KCI등재,SCOPUS,ESCI
다음색 감정 음성합성 응용을 위한 감정 SSML 처리기
- 한국음향학회
- 유세희
- 2021
- KCI등재,SCOPUS,ESCI

동일학술지 더보기

더보기

분석정보

View

상세정보조회

0

Usage

원문다운로드

0

대출신청

0

복사신청

0

EDDS신청

0

동일 주제 내 활용도 TOP

주제

연도별 연구동향

연도별 활용동향

연관논문

연구자 네트워크맵

공동연구자 (7)

더보기

유사연구자 (20) 활용도상위20명

더보기

인용정보 인용지수 설명보기

학술지 이력

학술지 이력
연월일	이력구분	이력상세	등재구분
2026	평가예정	재인증평가 신청대상 (재인증)
2020-01-01	평가	등재학술지 유지 (재인증)
2017-01-01	평가	등재학술지 유지 (계속평가)
2013-01-01	평가	등재학술지 유지 (등재유지)
2010-01-01	평가	등재학술지 유지 (등재유지)
2008-01-01	평가	등재학술지 유지 (등재유지)
2006-01-01	평가	등재학술지 유지 (등재유지)
2004-01-01	평가	등재학술지 유지 (등재유지)
2001-07-01	평가	등재학술지 선정 (등재후보2차)
1999-01-01	평가	등재후보학술지 선정 (신규평가)

학술지 인용정보

학술지 인용정보
기준연도	WOS-KCI 통합IF(2년)	KCIF(2년)	KCIF(3년)
2016	0.23	0.23	0.22
KCIF(4년)	KCIF(5년)	중심성지수(3년)	즉시성지수
0.2	0.18	0.398	0.07

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료

서지정보
부가정보
동일학술지(권/호) 다른 논문
분석정보
인용정보

해외이동버튼