http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
한국어 담화 특성에 기반한 영역독립 생략 및 대용 처리
노현철(Hyuncheol Rho),이근배(Geunbae Lee),이종혁(Jong-Hyeok Lee),박재득(Jaeduk Park) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.12
기존 한국어 자연어 처리 기술에서 생략, 대용을 중심으로 한 담화 처리 기술은 그 실용성 문제로 인해 도메인지식에 상당히 의존적인 면을 보이고 있다. 이로 인해 각 응용 도메인마다 각기 다른 담화 분석기를 필요로 하게 되어 상당한 비효율성을 초래할 뿐더러 담화 분석 기술 자체의 일반성을 확보하는데 있어서도 한계가 있었다. 본 연구에서는 실제 한국어 국소 담화 분석기를 개발함에 있어 영역 독립적인 입장을 취했으며, 여러 응용 도메인에서도 쉽게 이용될 수 있는 상향식(bottom-up) 한국어 국소 담화 분석기를 개발하고자 한다. 먼저 이러한 한국어 국소 담화 분석기를 개발하기 위해 한국어 담화 현상의 특징을 고찰해 보고, 실제 한국어에서의 생략과 대용 현상 처리에 대한 구체적인 방법론을 제시한다. 또한 본 한국어 국소 담화 분석기를 자연어 정보 검색 시스템에서 응용해 본 실제 예를 소개하고 본 담화 분석기의 성능을 정량적으로 검증해 보기 위해 3개의 응용 도메인의 코퍼스를 대상으로 한 실험결과를 소개한다. Previous discourse analysis techniques for ellipsis and anaphora resolution heavily utilized domain-dependent knowledge due to their practical usabilities. Therefore, each domain needs different discourse analyzer, which is not only inefficient but also limits the development of general discourse analysis techniques. In this paper, we propose a domain-independent bottom-up technique to develope a Korean local discourse analyzer which can be useful in various application domains. We examine some of the characteristics of Korean discourse phenomena and develope a bottom-up methodology to resolve ellipses and anaphora in Korean discourse. We also apply our Korean local discourse analyzer to a natural language information retrieval application and present some experiment results to verify the performance using the corpus of three practical application domains.
권혜진(HyeJin Kwon),이근배(Geunbae Lee),이종혁(Jong-Hyeok Lee),박재득(Jaeduk Park) 한국정보과학회 1997 정보과학회논문지(B) Vol.24 No.7
본 논문에서는 구문-의미 동시 분석을 위해 범주 문법과 QLF(quasi logical form)에 기반한 상호보완(synergistic) 구조를 제시한다. 범주 문법을 이용하여 부분 자유 어순, 복잡한 조사, 어미 등의 특성을 갖는 한국어 문법을 모델링하고, 논리 구조(logical form)는 각 형태소의 의미 구조를 모델링한다. 또한, 스코핑(scoping)과 조응어, 의미의 애매성을 다루기 쉽도록 QLF를 도입한다. 몬테규 이론에 입각한 합성 의미론을 이론적 배경으로 하여 다양한 형태소 범주에 알맞는 기본 QLF요소를 제안하고 이를 사전에 코딩한다. 두개의 구문 범주가 category cancellation 연산에 의해 결합될 때 그에 해당하는 QLFs도 범주 제약과 의미 제약을 만족시키도록 결합된다. 이 제약만족에 의해 문장의 의미적/구조적 애매성이 해결된다. 파싱의 결과로 생성된 QLF는 스코프 해결, 조응어 처리, 생략처리를 거쳐 마지막 논리 구조로 변환된다. In this paper, we developed a synergistic architecture based on categorial grammar and quasi logical form for syntactic and semantic co-analysis. Categorial grammar declaratively models Korean syntax such as partially free word-order, noun-endings, and complex verb-endings, and the logical form models each morpheme's semantic structure. QLF (quasi logical form) is introduced for convenient handling of scoping, anaphora and semantic ambiguities. Based on the compositional semantics derived from the Montague theory, proper QLFs for various morpheme categories are suggested and coded in the dictionary. When two categories are combined by the category cancellation operations, their QLFs are also combined with categorial and semantic restrictions. These restrictions resolve semantic/structural ambiguities of the sentence. The derived QLF for the sentence is converted into a logical form(LF) through scope, anaphora and ellipsis resolution.