RISS 검색 - 국내학술지논문

1
Lexicon transducer를 적용한 conformer 기반 한국어 end-to-end 음성인식

손현수,박호성,김규진,조은수,김지환,Son, Hyunsoo,Park, Hosung,Kim, Gyujin,Cho, Eunsoo,Kim, Ji-Hwan 한국음향학회 2021 韓國音響學會誌 Vol.40 No.5
- 원문보기
최근 들어 딥러닝의 발달로 인해 Hidden Markov Model(HMM)을 사용하지 않고 음성 신화와 단어를 직접 매핑하여 학습하는 end-to-end 음성인식 방법이 각광을 받고 있으며 그 중에서도 conformer가 가장 좋은 성능을 보이고 있다. 하지만 end-to-end 음성인식 방법은 현재 시점에서 어떤 자소 또는 단어가 나타날지에 대한 확률에 대해서만 초점을 두고 있다. 그 이후의 디코딩 과정은 현재 시점에서 가장 높은 확률을 가지는 자소를 출력하거나 빔 탐색을 사용하며 이러한 방식은 모델이 출력하는 확률 분포에 따라 최종 결과에 큰 영향을 받게 된다. 또한 end-to-end 음성인식방식은 전통적인 음성인식 방법과 비교 했을 때 구조적인 문제로 인해 외부 발음열 정보와 언어 모델의 정보를 사용하지 못한다. 따라서 학습 자료에 없는 발음열 변환 규칙에 대한 대응이 쉽지 않다. 따라서 본 논문에서는 발음열 정보를 담고 있는 Lexicon transducer(L transducer)를 이용한 conformer의 디코딩 방법을 제안한다. 한국어 데이터 셋 270 h에 대해 자소 기반 conformer의 빔 탐색 결과와 음소 기반 conformer에 L transducer를 적용한 결과를 비교 평가하였다. 학습자료에 등장하지 않는 단어가 포함된 테스트 셋에 대해 자소 기반 conformer는 3.8 %의 음절 오류율을 보였으며 음소 기반 conformer는 3.4 %의 음절 오류율을 보였다.
2
공연용 수상드론의 대형 변형중 위치 좌표 산출 방법

손현수(Hyunsoo Son),박보은(Bo Eun Park),오훈(Hoon Oh) 한국통신학회 2023 한국통신학회 학술대회논문집 Vol.2023 No.2
- 원문보기
3
Convolution Augmented Transformer 기반 한국어 End-to-end 음성인식

손현수(Hyunsoo Son),박호성(Hosung Park),김규진(Gyujin Kim),이동현(Donghyun Lee),서순신(Soonshin Seo),조은수(Eunsoo Cho),김지환 (Jihwan Kim) 한국정보과학회 2021 한국정보과학회 학술발표논문집 Vol.2021 No.6
- 원문보기
4
Lookahead Composition 기반 Weighted Finite State Transducer를 이용한 한국어 음성 인식 시스템

김규진(Gyujin Kim),손현수(Hyunsoo Son),박호성(Hosung Park),서순신(Soonshin Seo),조은수(Eunsoo Cho),이동현(Donghyun Lee),김지환(Ji-Hwan Kim) 한국정보과학회 2021 한국정보과학회 학술발표논문집 Vol.2021 No.6
- 원문보기
5
공연용 수상드론의 대형 변형에 대한 이동 좌표 계산

박보은(Bo Eun Park),손현수(Hyunsoo Son),오훈(Hoon Oh) 한국통신학회 2023 한국통신학회 학술대회논문집 Vol.2023 No.2
- 원문보기
6
Low-resource 음성인식에서의 Discriminative Vector 학습을 위한 Self-attentive Layer

박호성(Hosung Park),서순신(Soonshin Seo),손현수(Hyunsoo Son),김창민(Changmin Kim),김지환(Ji-Hwan Kim) 한국정보과학회 2020 한국정보과학회 학술발표논문집 Vol.2020 No.7
- 원문보기

상세검색

RISS 보유자료

상세검색

해외전자자료

연관 검색어 추천