http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
원 - 패스 전략을 사용하는 미분절언어를 위한 다중 - 경로 LR 파싱
이기오(Gi-O Lee),이용석(Yong-Seok Lee) 한국정보과학회 1995 정보과학회논문지 Vol.22 No.2
한국어는 단어들 사이에 공백이 없는 미분절어이기 때문에, 한국어를 분석하기 위해서는 단어의 경계를 식별하는 분절이 선행되어야 한다. 분절은 쉽지 않은 과정이고 잘못된 분절은 구문 분석, 의미 분석 단계에서 심각한 오류를 유발하기 때문에 형태소 분석의 중요한 작업중의 하나가 되어왔다. 기존의 한국어 분석 시스템들은 분절의 어려움으로 인하여 입력 문자열의 끝까지 읽은 후, 우에서 좌로 분석하는 two-pass 전략이나 단어들 사이에 공백을 삽입하여 처리하는 방법을 사용하였다. 또한 이 시스템들은 형태소 분석이 완결된 후, 파서에게 결과를 전달하는 순차적인 전략을 사용하였다. 본 논문은 영어의 분석과 같이 형태소 분석 동안에 파싱을 할 수 있는 one-pass 전략을 사용하여 한국어를 효율적으로 처리하는 모델을 제안한다. 이를 위해 형태소 분석 방법으로써 확장된 최장일치법을 제시하며, 위 방법에서 생성되는 문제점인 다중-범주 구를 처리하기 위하여 다중-경로 LR 파싱을 제시한다. In order to analyze Korean, segmentation must be preceeded to identify boundaries of words because Korean is nonsegmental words which have no spaces between words. It is not easy to be processed and because wrong segmentation causes fatal error in syntactic and semantic analysis, it has been, one of the important work of morphological analysis. On account of the difficulty of segmentation, previous Korean analysis system used two-pass strategy which analyzes input string by right-left strategy after scanning up to the end of input string or used method which processes input string by inserting spaces between words. Moreover, it used sequential strategy which transfers the result to the parser after completing morphological analysis. Therefore, this paper proposes the model which processes Korean efficiently using by one-pass strategy which can parse the input string like analysis of English during morphological analysis. For this we present the extended longest match strategy as morphological analysis method. Owing to processing multi-categories phrase which was generated problem using by above method, we suggest the multi-path LR parsing.
이근용(Keun Yong Lee),이기오(Gi O Lee),안동언(Dong Un An),이용석(Yong Seok Lee) 한국정보과학회 1996 한국정보과학회 학술발표논문집 Vol.23 No.1A
한국어 음성 인식은 많은 조음현상을 포함하고 있어서, 음성언어에 대한 신호처리만으로는 인식의 효율을 높이기는 어렵다. 따라서 자연어처리와 함께 음성인식이 이루어질 때 인식의 효율은 높아질 것이다. 그러나 음성언어에 많은 조음현상으로 인한 음운변이현상이 포함되어 있어, 음성언어 자체를 바로 자연어 처리와 연결하기는 용이한 일이 아니다. 본 논문은 한국어 음성언어를 문서기반의 자연어처리 기법을 이용하여 쉽게 처리할 수 있는 방법을 제시하기 위하여 음운변이현상을 형태소 단계에서 처리하기 위해서 사전 검색 알고리즘을 이용한 자소단위 형태소 분석기의 원형복원 규칙을 확장하고, 문서 기반 형태소 분석기에 쓰이는 이중배열에 트라이를 구현한 자소단위 사전을 이용할 수 있음을 보인다.
김기철(Ki-Cheoui Kim),이기오(Gi-O Lee),이용석(Yong-Seok Lee) 한국정보과학회 1995 정보과학회논문지(B) Vol.22 No.9
복합동사의 처리는 기계번역이나 자연어 이해 시스템의 질에 상당한 영향을 주기 때문에 복합동사의 정확한 분석과 처리는 중요하다. 기존의 분석 시스템에서 복합동사는 형태소 분석 단계에서 복합동사를 나눈후 구문분석 단계에서 문법 규칙을 이용하여 처리하였다. 이는 다음과 같은 문제가 있다. 첫째, 복합동사와 관련된 어휘의 모호성이 구문 모호성을 야기시킨다. 둘째, 이 시스템으로는 복합동사의 정확한 의미를 분석하기가 매우 어렵다. 그러므로 새롭고 체계적인 복합동사 처리 방안이 요구된다. 본 논문에서는 한국어 복합동사를 체계적이고 효율적으로 처리하는 형태소 분석 주도의 복합동사 처리 방법을 제안한다. 이 방법은 복합동사를 먼저 형태소 분석단계에서 처리한 후 여기에서 처리가 곤란한 것들은 사전을 이용하거나 구문 분석단계에서 처리한다. It is important to analyze and process compound verbals accurately because they have much influence on the qualities of the machine translation(MT) system and the natural language understanding(NLU) system. In the previous analysis systems, the compound verbal was processed by using grammar rules at the stage of the syntactic analysis after decomposing a compound verbal at the stage of the morphological analysis It has some problems as follows: First, lexical ambiguities related to a compound verbal cause syntactic ambiguities. Second, it is very difficult to analyze the correct meaning of a compound verbal with this system. Therefore. we need a new and systematic strategy for processing of the compound verbal. In this paper, we propose a morphological analysis~driven processing method that processes the Korean compound verbal systematically and effectively With the this method, we try to process the compound verbals in the morphological analysis for first step and otherwise we use lexicon or process them in the syntactic analysis step.