http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
프리엠퍼시스를 이용한 CPSP 기반의 도달시간차이 추정 성능 개선
권홍석,배건성,Kwon, Hong-Seok,Bae, Keun-Sung 한국음향학회 2009 韓國音響學會誌 Vol.28 No.5
본 연구에서는 CPSP (Cross Power Spectrum Phase) 함수를 이용한 프레임 기반의 TDOA (Time Difference of Arrival) 추정시 나타나는 문제점들을 분석하고 연구하였다. 구형 윈도우함수를 이용해서 음성신호의 프레임을 추출할 때 나타나는 스펙트럼 누설현상은 CPSP 스펙트럼의 추정을 부정확하게 한다. 또한 스펙트럼 누설을 줄이기 위하여 구형이 아닌 다른 윈도우함수를 사용하여 프레임을 추출하면 프레임의 끝부분에서 발생하는 윈도우함수 가중치의 불일치 때문에 신호를 왜곡시킨다. 이 문제점들은 CPSP 기반의 TDOA 추정성능을 감소시킨다. 본 논문에서는 음성신호의 프리엠퍼시스를 이용하여 이러한 문제점들을 완화시키는 방법을 제안한다. 프리엠퍼시스된 음성신호의 다이나믹 레인지를 줄여줌으로써 스펙트럼 누설을 감소 시킨다. 제안한 프리엠퍼시스 방법을 검증하기 위하여, 다양한 잡음 및 잔향환경에서 TDOA 추정실험을 수행하였다. 실험결과 프라엠퍼시스된 마이크 출력에 구형 윈도우함수를 적용시켜 CPSP를 구할 경우 프리엠퍼시스를 하지 않거나 다른 윈도우를 사용하는 경우에 비해 TDOA 추정성능이 향상됨을 확인하였다. We investigate and analyze the problems encountered in frame-based estimation of TDOA (Time Difference of Arrival) using CPSP function. Spectral leakage occurring in framing of a speech signal by a rectangular window could make estimation of CPSP spectrum inaccurate. Framing with other windows to reduce the spectral leakage distorts the signal due to the asynchronous weighting around the frame specifically both ends of the frame. These problems degrade the performance of the CPSP-based TDOA estimation. In this paper, we propose a method to alleviate those problems by pre-emphasis of the speech signal. It reduces the influence of the spectral leakage by reducing dynamic range of the spectrum of a speech signal with pre-emphasis. To validate the proposed method of pre-emphasis, we carry out TDOA estimation experiments in various noise and reverberation conditions, Experimental results have shown that the framing of pre-emphasized microphone output by a rectangular window achieves higher success rate of TDOA estimation than any other framing methods.
중간언어 문맥벡터의 정제를 통한 이중언어 사전 구축의 성능개선
권홍석(Hong-seok Kwon),서형원(Hyung-Won Seo),김재훈(Jae-Hoon Kim) 한국정보과학회 2014 정보과학회논문지 : 소프트웨어 및 응용 Vol.41 No.7
본 논문은 중간언어 기반 이중언어 사전 구축 방법에서 문맥벡터의 정제 방법을 제안한다. 중간언어 기반 이중언어 사전 구축 방법은 두 언어 간의 사전이나 병렬말뭉치 등 언어 자원이 부족한 언어쌍에 매우 효과적인 방법이다. 본 논문은 두 가지 정제 방법을 통해서 성능을 개선한다. 첫 번째 방법은 양방향 번역확률을 통하여 문맥벡터를 정제하였고 두 번째 방법은 품사 정보를 이용하여 문맥벡터를 정제하였다. 본 논문은 두 개의 서로 다른 언어 쌍으로 한국어-스페인어 그리고 한국어-프랑스어 양방향에 대해서 각각 이중언어 사전을 추출하는 실험을 하였다. 높은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 48.5%를, 상위 20에서 최대 88.5%의 정확도를 얻었고, 낮은 빈도수를 가지는 어휘에 대한 번역 정확도는 최상위에서 최소 26.5%를, 상위 20에서 최대 66.5%의 성능을 보였다. This paper presents the performance enhancement of automatic bilingual lexicon extraction by using refinement of pivot-context vectors under the standard pivot-based approach, which is very effective method for less-resource language pairs. In this paper, we gradually improve the performance through two different refinements of pivot-context vectors: One is to filter out unhelpful elements of the pivot-context vectors and to revise the values of the vectors through bidirectional translation probabilities estimated by Anymalign and another one is to remove non-noun elements from the original vectors. In this paper, experiments have been conducted on two different language pairs that are bi-directional Korean-Spanish and Korean-French, respectively. The experimental results have demonstrated that our method for high-frequency words shows at least 48.5% at the top 1 and up to 88.5% at the top 20 and for the low-frequency words at least 43.3% at the top 1 and up to 48.9% at the top 20.
Encoder-Decoder 기반 한국어 문법 오류 교정을 위한 Encoder에서의 신경망 언어 모델 도입
조승우(Seung Woo Cho),권홍석(Hong-seok Kwon),정헌영(Hun-young Jung),이종혁(Jong-Hyeok Lee) 한국정보과학회 2018 정보과학회 컴퓨팅의 실제 논문지 Vol.24 No.6
문법 오류 교정은 주어진 문장에서 나타난 문법적인 오류들을 탐지하고 이를 올바르게 교정하는 것으로, 특정 언어를 배우고자 하는 L2 학습자들을 돕거나 시스템의 잘못된 입출력 수정 등 다양한 응용 분야에 활용 가능하다. 본 논문에서는 한국어 문법 오류 교정 학습에 필수적인 교정 병렬 데이터가 부족한 문제를 보완하기 위하여 단일 말뭉치를 활용하는 기법을 제안한다. 단일 말뭉치로 학습시킨 신경망 언어 모델을 Encoder에 도입하여, 신경망 기계 번역 기반 교정 모델이 올바르게 사용된 음절과 문법적으로 잘못 사용된 음절을 보다 명확하게 구분할 수 있게 한다. 이를 토대로, 올바르게 사용된 음절의 복사량을 증가시키면서 기존 Encoder-Decoder 모델의 잘못된 교정을 방지하는 것을 확인할 수 있었다. Grammatical Error Correction (GEC) is intended to detect and correct all grammatical errors in given sentences. GEC is used to help L2 learners, who can obtain useful feedback from the corrections to improve their writing. GEC can also be applied to specific systems as an independent processor that corrects erroneous input/output data. In this paper, we propose a practical method that uses monolingual corpora to mitigate the lack of parallel data, which is essential to train a GEC model. We train a neural language model and apply it to the encoder of a neural machine translation (NMT) model to identify erroneous syllables clearly. The NMT model identifies more of the copied syllables that are correctly written, thus preventing the model from generating unnecessary corrections.
이국어 병렬말뭉치와 중간언어를 활용한 이국어 사전 자동구축
서형원 ( Hyeong-won Seo ),권홍석 ( Hong-seok Kwon ),김재훈 ( Jae-hoon Kim ) 한국정보처리학회 2013 한국정보처리학회 학술대회논문집 Vol.20 No.1
본 논문은 한국어-스페인어와 한국어-불어 간의 양방향 이국어 사전(Bi-directional bilingual lexicon)을 자동으로 구축하기 위한 새로운 방법을 제안한다. 일반적으로 한국어와 스페인어/불어 간의 병렬 말뭉치를 직접적으로 구축하기에는 어려움에 따르기 때문에, 영어를 중심언어로 하는 영어(EN)-한국어(KR)/스페인어(ES)/불어(FR) 병렬 말뭉치를 이용하여 문맥 벡터를 만들고 그들 간의 유사도를 계산하는 변형된 문맥 벡터 방법을 제안한다. 영어는 다른 언어와의 이국어 병렬 말뭉치가 비교적 많이 공개되어 있기 때문에 이 방법을 이용하면 비교적 쉽게 KR-ES와 KR-FR 양방향 이국어 사전을 구축할 수 있다. 본 논문에서 제안한 방법으로 실험해본 결과 최고 85%(ES→KR)의 정확도를 얻을 수 있었다.