RISS 검색 - 국내학술지논문 상세보기

다국어 입력

あぁかがさざただなはばぱまやゃらわゎんいぃきぎしじちぢにひびぴみりうぅくぐすずつづっぬふぶぷむゆゅるえぇけげせぜてでねへべぺめれおぉこごそぞとどのほぼぽもよょろを

アァカサザタダナハバパマヤャラワヮンイィキギシジチヂニヒビピミリウゥクグスズツヅッヌフブプムユュルエェケゲセゼテデヘベペメレオォコゴソゾトドノホボポモヨョロヲ ―

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)

中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.

ㅥ ㅦ ㅧ ㅨ ㅩ ㅪ ㅫ ㅬ ㅭ ㅮ ㅯ ㅰ ㅱ ㅲ ㅳ ㅴ ㅵ ㅶ ㅷ ㅸ ㅹ ㅺ ㅻ ㅼ ㅽ ㅾ ㅿ ㆀ ㆁ ㆂ ㆃ ㆄ ㆅ ㆆ ㆇ ㆈ ㆉ ㆊ ㆋ ㆌ ㆍ ㆎ

Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω α β γ δ ε ζ η θ ι κ λ μ ν ξ ο π ρ σ τ υ φ χ ψ ω

á à Á À é è É È ç Ç ê

Ä Ö Ü ä ö ü ß

ְ ֳ ֲ ֱ ָ ַ ֵ ֶ ִ ֹ ּ ֻ ׂ ׁ ּ פ ם ן ו ט א ר ק ף ך ל ח י ע כ ג ד ש ץ ת צ מ נ ה ב

‘ ’ “ ” 〔〕〈〉「」『』【】＂（）［］｛｝

± × ÷ ≠ ≤ ≥ ∞ ∴ ♂ ♀ ∠ ⊥ ⌒ ∂ ∇ ≡ ≒ ≪ ≫ √ ∽ ∝ ∵ ∫ ∬ ∈ ∋ ⊆ ⊇ ⊂ ⊃ ∪ ∩ ∧ ∨ ￢ ⇒ ⇔ ∀ ∃ ∮ ∑ ∏ ＋－＜＝＞

、。 · ‥ … ¨ 〃 ― ∥ ＼ ∼ ´ ～ ˇ ˘ ˝ ˚ ˙ ¸ ˛ ¡ ¿ ː ！＇，．／：；？＾＿｀｜

½ ⅓ ⅔ ¼ ¾ ⅛ ⅜ ⅝ ⅞ ¹ ² ³ ⁴ ⁿ ₁ ₂ ₃ ₄

Æ Ð Ħ Ĳ Ł Ø Œ Þ Ŧ Ŋ æ đ ð ħ ı ĳ ĸ ŀ ł ø œ ß þ ŧ ŋ ŉ

А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я

′ ″ ℃ Å ￠￡￥ ¤ ℉ ‰ ＄％Ｆ￦㎕㎖㎗ ℓ ㎘㏄㎣㎤㎥㎦㎙㎚㎛㎜㎝㎞㎟㎠㎡㎢㏊㎍㎎㎏㏏㎈㎉㏈㎧㎨㎰㎱㎲㎳㎴㎵㎶㎷㎸㎹㎀㎁㎂㎃㎄㎺㎻㎽㎾㎿㎐㎑㎒㎓㎔ Ω ㏀㏁㎊㎋㎌㏖㏅㎭㎮㎯㏛㎩㎪㎫㎬㏝㏐㏓㏃㏉㏜㏆

§ ※ ☆ ★ ○ ● ◎ ◇ ◆ □ ■ △ ▽ → ← ↑ ↓ ↔ 〓 ◁ ◀ ▷ ▶ ♤ ♠ ♡ ♥ ♧ ♣ ⊙ ◈ ▣ ◐ ◑ ▒ ▤ ▥ ▨ ▧ ▦ ▩ ♨ ☏ ☎ ☜ ☞ ¶ † ‡ ↕ ↗ ↙ ↖ ↘ ♭ ♩ ♪ ♬ ㉿㈜ № ㏇ ™ ㏂㏘ ℡ ＃＆＊＠ ª º

ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ

ا ب ت ث ج ح خ د ذ ر ز س ش ص ض ط ظ ع غ ف ق ک ل م ن ه و ی

최근 검색 목록
전체삭제 닫기

RISS 인기검색어

Proposal of speaker change detection system considering speaker overlap = 화자 겹침을 고려한 화자 전환 검출 시스템 제안

한글로보기

https://www.riss.kr/link?id=A107876172

저자

박지수 (한남대학교) ; 윤영선 (한남대학교) ; 차신 (한남대학교) ; 박전규 (한국전자통신연구원) ; Park, Jisu ; Yun, Young-Sun ; Cha, Shin ; Park, Jeon Gue
발행기관
The Acoustical Society of Korea
학술지명
韓國音響學會誌(The Journal of the Acoustical Society of Korea)
권호사항

Vol.40 No.5 [2021]
발행연도
2021
작성언어
English
등재정보
KCI등재,SCOPUS,ESCI
자료형태
학술저널
발행기관 URL
http://www.ask.or.kr
수록면

466-472(7쪽)
KCI 피인용횟수
0
제공처
ScienceON
소장기관
- 경북대학교 중앙도서관
- 서울대학교 중앙도서관

0
상세조회
0
다운로드
0
내보내기

서지정보 열기

부가정보

다국어 초록 (Multilingual Abstract)

Speaker Change Detection (SCD) refers to finding the moment when the main speaker changes from one person to the next in a speech conversation. In speaker change detection, difficulties arise due to overlapping speakers, inaccuracy in the information ...

Speaker Change Detection (SCD) refers to finding the moment when the main speaker changes from one person to the next in a speech conversation. In speaker change detection, difficulties arise due to overlapping speakers, inaccuracy in the information labeling, and data imbalance. To solve these problems, TIMIT corpus widely used in speech recognition have been concatenated artificially to obtain a sufficient amount of training data, and the detection of changing speaker has performed after identifying overlapping speakers. In this paper, we propose an speaker change detection system that considers the speaker overlapping. We evaluated and verified the performance using various approaches. As a result, a detection system similar to the X-Vector structure was proposed to remove the speaker overlapping region, while the Bi-LSTM method was selected to model the speaker change system. The experimental results show a relative performance improvement of 4.6 % and 13.8 % respectively, compared to the baseline system. Additionally, we determined that a robust speaker change detection system can be built by conducting related studies based on the experimental results, taking into consideration text and speaker information.

더보기

참고문헌 (Reference)

1 R. Yin, "peaker change detection in broadcast tv using bidirectional long short term memory networks" 3827-3831, 2017

2 "WebRTC Homepage"

3 S. C. Levinson, "Turn-taking in human communication - Origins and implications for language processing" 20 : 6-14, 2016

4 H. Bredin, "TristouNet: Triplet loss for speaker turn embedding" 5430-5434, 2017

5 V. Zue, "Speech database development at MIT: TIMIT and beyond" 9 : 351-356, 1990

6 Z. Ge, "Speaker change detection using features through a neural network speaker classier" 1111-1116, 2017

7 L. Bullock, "Overlap aware diarization: Resegmentation using neural end to-end overlapped speech detection" 7114-7118, 2020

8 N. Sajjan, "Leveraging lstm models for overlap detection in multi party meetings" 5249-5253, 2018

9 H. Kim, "Framework switching of speaker overlap de tection system" 17 : 101-113, 2021

10 M. Kunesova, "Detection of overlapping speech for the purposes of speaker diarization" 247-257, 2019

1 R. Yin, "peaker change detection in broadcast tv using bidirectional long short term memory networks" 3827-3831, 2017

2 "WebRTC Homepage"

3 S. C. Levinson, "Turn-taking in human communication - Origins and implications for language processing" 20 : 6-14, 2016

4 H. Bredin, "TristouNet: Triplet loss for speaker turn embedding" 5430-5434, 2017

5 V. Zue, "Speech database development at MIT: TIMIT and beyond" 9 : 351-356, 1990

6 Z. Ge, "Speaker change detection using features through a neural network speaker classier" 1111-1116, 2017

7 L. Bullock, "Overlap aware diarization: Resegmentation using neural end to-end overlapped speech detection" 7114-7118, 2020

8 N. Sajjan, "Leveraging lstm models for overlap detection in multi party meetings" 5249-5253, 2018

9 H. Kim, "Framework switching of speaker overlap de tection system" 17 : 101-113, 2021

10 M. Kunesova, "Detection of overlapping speech for the purposes of speaker diarization" 247-257, 2019

11 V. Andrei, "Detecting over-lapped speech on short time frames using deep learning" 1198-1202, 2017

12 J. Park, "Data augmentation and d-vector representation methods for speaker change detection" 67-71, 2020

13 E. Kazimirova, "Automatic detection of multi speaker fragments with high time resolution" 1338-1392, 2018

14 A. G. Adam, "A new speaker change detection method for two-speaker segmentation" 3908-3911, 2002

15 D. Snyder, "2X-vectors: Robust DNN embeddings for speaker recognition" 5329-5333, 2018

동일학술지(권/호) 다른 논문

문장 독립 화자 검증을 위한 그룹기반 화자 임베딩
- 한국음향학회
- 정영문
- 2021
- KCI등재,SCOPUS,ESCI
GSFM 펄스의 상관도에 기반한 연속 송수신 소나의 신호처리 구간 설정 방법
- 한국음향학회
- 김현수
- 2021
- KCI등재,SCOPUS,ESCI
능동소나를 위한 가중 딕션너리를 사용한 두 수신기 간 신호 지연 추정 방법
- 한국음향학회
- 임준석
- 2021
- KCI등재,SCOPUS,ESCI
다음색 감정 음성합성 응용을 위한 감정 SSML 처리기
- 한국음향학회
- 유세희
- 2021
- KCI등재,SCOPUS,ESCI

동일학술지 더보기

더보기

분석정보

View

상세정보조회

0

Usage

원문다운로드

0

대출신청

0

복사신청

0

EDDS신청

0

동일 주제 내 활용도 TOP

주제

연도별 연구동향

연도별 활용동향

연관논문

연구자 네트워크맵

공동연구자 (7)

더보기

유사연구자 (20) 활용도상위20명

더보기

인용정보 인용지수 설명보기

학술지 이력

학술지 이력
연월일	이력구분	이력상세	등재구분
2026	평가예정	재인증평가 신청대상 (재인증)
2020-01-01	평가	등재학술지 유지 (재인증)
2017-01-01	평가	등재학술지 유지 (계속평가)
2013-01-01	평가	등재학술지 유지 (등재유지)
2010-01-01	평가	등재학술지 유지 (등재유지)
2008-01-01	평가	등재학술지 유지 (등재유지)
2006-01-01	평가	등재학술지 유지 (등재유지)
2004-01-01	평가	등재학술지 유지 (등재유지)
2001-07-01	평가	등재학술지 선정 (등재후보2차)
1999-01-01	평가	등재후보학술지 선정 (신규평가)

학술지 인용정보

학술지 인용정보
기준연도	WOS-KCI 통합IF(2년)	KCIF(2년)	KCIF(3년)
2016	0.23	0.23	0.22
KCIF(4년)	KCIF(5년)	중심성지수(3년)	즉시성지수
0.2	0.18	0.398	0.07

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료

서지정보
부가정보
동일학술지(권/호) 다른 논문
분석정보
인용정보

해외이동버튼