http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
박규봉(Park Gyu-Bong),박전규(Park Jeon-Gue),황두성(Hwang Doosung),한문성(Han Mun-Sung) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
널리 알려진 N-best 후보 추정 알고리즘들 중에 AT&T에서 나온 2-best 탐색 기법과 N-best 탐색 기법이 있다. 전자에는 전방향 탐색만 있고 탐색시 문법을 적용한다. 후자에는 전후방향 탐색이 모두 존재하고 문법은 후처리 과정에서 적용된다. 그러나 본 논문에서는 전방향 탐색 도중 문법을 적용하는 데 따른 잘못을 지적하고 이에 대한 대안으로 후방향 문법 적용 방안을 소개한다. 새 안은 후처리에서 문법을 고려하는 것보다 훨씬 효율적이다. 실험에 따르면 효율이 50% 정도 높아졌다.
희소 데이터 영역 음성 인식을 위한 전이학습 방법 연구
강병옥(Kang Byung Ok),전형배(Jeon Hyeong Bae),박전규(Park Jeon Gyu) 한국통신학회 2021 한국통신학회 학술대회논문집 Vol.2021 No.11
본 논문은 희소 데이터 영역을 대상으로 한 음성 인식을 목적으로 데이터 증강형 전이 항습 방법을 제안하고 관련 실험 결과를 기술한다. 제안된 방법은 대용량 음성수집이 어려운 희소 데이터 영역을 인식 대상으로 하는 도메인에서의 음성 인식을 위해, 상대적으로 수집이 쉬운 대용량의 타 영역 음성 코퍼스를 이용하여 희소 데이터 영역과 비슷한 화자 및 채널/잡음 등의 음향적 특성을 갖는 음성데이터를 증강하고, 증강된 데이터와 대용량 음성 코퍼스를 입력으로 교사-학습 기반 전이학습을 수행한다. 검증을 위해 AMI 코퍼스를 대상으로 실험을 수행하였고, 기존의 교사/학생 기반 전이학습과 비교한 실험 결과 개선된 성능을 확인할 수 있었다.
강병옥(Kang Byung Ok),전형배(Jeon Hyeong Bae),박전규(Park Jeon Gyu) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
본 논문은 녹취 데이터를 대상으로 한 음성 인식을 위해 종단형 음성 인식을 적용하여 수행한 연구 및 실험결과를 기술한다. 녹취 데이터는 콜센터 고객 상담 및 여러 형태의 회의 중 발화된 화자의 음성을 녹음하여 기록한 저장데이터로서, 음성 인식 서비스를 명시적으로 의식하여 발화된 음성에 비해 발화 반복, 간투어 등 다양한 자연어 발화현상, 부정확한 발음 및 빠른 발화 속도 등 음성 인식 성능 저하의 요인이 되는 다양한 특성을 가지고 있다. 이에, 최근 학계와 산업계에서 많은 연구가 수행 되고 있는 종단형 음성인식 기술을 녹취 데이터 인식에 적용하여 기존 LSTM-RNN기반 하이브리드 구조 모델과의 비교 실험을 수행하고 여러 학습 조건에서의 성능 분석 및 개선 사항을 도출하였다.