http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
정천영,서영훈,Jung, Cheon-Young,Seo, Young-Hoon 한국정보처리학회 1998 정보처리논문지 Vol.5 No.9
본 논문에서는 한국어대화체를 분석하고 의미패턴에 기반한 대화체 한영 기계번역 시스템에 대하여 기술한다. 한영 기계번역에서 구문정보를 이용한 한국어 모호성은 의미패턴을 이용하여 해결할 수 있다. 따라서 대화체 번역을 위하여 한국어 스케쥴링 도메인으로부터 추출된 의미패턴에 기반한 시스템을 구성한다. 번역의 강건함을 위하여 한국어 문장 분석시 음절을 건너뛰어 분석할 수 있도록 하였으며, 패턴수를 줄이기 위하여 의미패턴에 옵션을 부가하였다. 실험을 위하여 사용된 데이터는 스케쥴링 도메인으로 실험결과 88%의 번역율을 보인다. This paper analyzes Korean spoken language and describes the machine translation o[ Korean to-English spoken language based on semantic patterns, In Korean-to-English machine translation. ambiguity of Korean sentence analysis using syntactic information can be resolved by semantic patterns, Therefore, for machine translation of spoken language, we estabilish the system based on semantic patterns extracted from Korean scheduling domain, This system obtains the robustness by skip ability of syllables in analysis of Korean sentence and we add options to semantic patterns in order to reduce pattern numbers, The data used [or the experiment are scheduling domain and performance of Korean-to-English translation is 88%.
정천영(Cheon-Young Jung),서영훈(Young-Hoon Seo) 한국정보과학회 2001 정보과학회논문지 : 소프트웨어 및 응용 Vol.28 No.4
본 논문에서는 대화체 번역을 위한 논항 구조에 기반한 한국어 분석에 대하여 기술한다. 논항구조 기반 문법은 순서에 관계없이 기술된다. 따라서 한국어의 부분 자유 어순 특성으로 문법이 방대해지는 문제점을 해결할 수 있다. 또한, 서술어가 지배하는 논항이 문법으로부터 선택됨으로서 대화체가 갖는 특성인 간투어나 중복 발화 현상 등을 효과적으로 해결할 수 있다. 실험을 위하여 사용된 데이타는 ‘여행 안내’ 영역 중에서 1,335개의 훈련된 발화문과 420개의 훈련되지 않은 발화문이다. 실험 결과 훈련된 발화문에서는 99.7%, 훈련되지 않은 발화문에서는 93.3%의 분석 성공률을 보였다. This paper describes a Korean analysis based on argument structures for spoken language translation. A rule in our grammar denotes only immediate dominance relation. That is, the order of components in a grammar rule is meaningless. Owing to characteristic of this grammar the our grammar size can be greatly reduced. Also, a problem of ungrammatical constituents is resolved because only arguments are described in a rule, and the parser ignores words in input utterance when they do not match in the rule. Experimental domain is travel arrangement. The total number of utterances in domain corpus is 1,755. We train a system by use of 1,335 utterances, and remain 420 utterances for test. Experimental result shows that 99.7% for trained utterances and 93.3% for untrained ones are analyzed successfully.
정천영(Jung Cheon Young),성영훈(Seo Young Hoon) 한국정보처리학회 1998 정보처리학회논문지 Vol.5 No.9
This paper analyzes Korean spoken language and describes the machine translation of Korean-to-English spoken language based on semantic patterns. In Korean-to-English machine translation, ambiguity of Korean sentence analysis using syntactic information can be resolved by semantic patterns. Therefore, for machine translation of spoken language, we establish the system based on semantic patterns extracted from Korean scheduling domain. This system obtains the robustness by skip ability of syllables in analysis of Korean sentence and we add options to semantic patterns in order to reduce pattern numbers. The data used for the experiment are scheduling domain and performance of Korean-to-English translation is 88%.
노서영(Noh Seo Young),정천영(Jung Cheon Young),서영훈(Seo Young Hoon) 한국정보처리학회 1999 정보처리학회논문지 Vol.6 No.8
The partial free order feature of Korean makes grammar size represented by CFG too big and that's why grammar has to contain all the ordered words. There are some problems to parse spoken language, because spontaneous spoken language has special features such as meaningless words, repetitious speech, etc. So, in this paper, we define 'Core-Concept' as the necessary element for parsing and we describe grammar only using Core-Concept. And we can prevent grammar from becoming very large and reduce an additional parsing burden as we select Core-Concept described in grammar as parsing element. Through this strategy, we present that the simplified grammar can give us more efficient method to get right results. Experiments show that our parsing strategy has an average of 98% or over success rate in correct parsing results.
정천영,장수진,진성일 충남대학교 자연과학연구소 1992 忠南科學硏究誌 Vol.19 No.1
The purpose of this paper is to suggest an automatic indexing system for Korean documents with an auxiliary word and the ending of a word in thesis. This system is structured with an auxiliary word dictionary, a negative dictionary, a declinable word list and an abbreviation dictionary. In this thesis, we suggest methods to analyze short clauses, remove negative words, restore abbreviations to original words and extract compound phrases.
한국어 구조 중의성 해소를 위한 부사 문법과 부사 확률 문법
신승은,정천영,서영훈 충북대학교 컴퓨터정보통신 연구소 2001 컴퓨터정보통신연구 Vol.9 No.2
본 논문은 말뭉치에서 추출된 통계 정보와 특징을 기반으로 한 부사 정보를 이용하여 부사 문법과 부사 확를 문법을 구축하고. 이를 적용하여 한국어의 구조 증의성을 해소하였다. 부사들의 사용과 수식 패턴들을 대량의 말뭉치로부터 조사하였고, 많은 패턴들 중에 비교적 규최적인 것들을 부사 문법으로 구축하였다. 그리고 부사 꽉률 문법은 부사와 릭수식어의 상대적 위치 확률과 피수식어의 품사 확률로 구성하였다. 구문 분석기에 의해 생성된 구문 구조들 중 가장 율은 구문 구조를 선택하기 위해 부사 문법과 부사 확률 문법을 적용하였고, 이것으로 부사에 의한 많은 구조적 증의 성들을 해소하였다. This paper describes a Korean structural disambiguation using adverb grammar and Probabilistic adverb grammar. These are made by adverb information which is based on statistical information and special features extracted from corpus. Usage and modification pattern of adverbs are fully investigated in large corpus. and relatively regular ones among a number of patterns are encoded in adverb grammars. And probability of part-of-speech and relative position of modified word is encoded in Probabilistic adverb grammar. Adverb grammar and Probabilistic adverb grammar are applied to select the best passe among parses generated by a general purpose parser. They resolve lots of ambiguities caused by adverbs.