http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
여상화(Sanghwa Yuh),서정연(Jeongyuh Seo) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B
본 논문에서 제안하는 영어 Parser는 Bottom-Up Best-First Chart Parser를 기반으로 영어 구문 분석과 동시에 영 ->한 구조변환을 수행한다. 따라서, 영어 입력문에 대한 파서의 결과는 한국어 구문 Tree가 된다. 구문 분석과 변환을 동시에 수행하므로, 번역 과정을 단순화 하고, 번역 지식 관리가 용이하여 번역기의 튜닝이 용이하다. 구현된 파서는 대규모 문법 규칙에 대응하기가 용이하고, 새로운 규칙의 추가가 용이하여 번역기의 점진적인 성능 향상이 가능하다.
여상화(Sanghwa Yuh),정한민(Hanmin Jung),김태완(Taewan Kim),박동인(Dong-In Park),서정연(Jungyub Seo) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
영어에서 하이픈(‘-’)은 여러 단어가 하나의 의미를 가진 복합어(Compound Word)를 이룰 때 사용한다. 하이픈의 사용에는 절대적인 원칙이 없고 하이픈을 이용한 복합어의 생성력은 매우 커서 모든 하이픈 단어를 사전에 수록하는 것은 불가능하다. 기존의 시스템에서는 사전을 이용하거나 Pattern Matching을 이용하여 하이픈 단어의 일부를 처리하였다. 본 논문에서는 사전과 Pattern에 의해 처리되지 않은 하이픈 단어들을, 개별 단어들로 형태소 분석하고, 이들의 품사 Sequence에 따라 적절한 대역어를 부가시키는 하이픈 단어의 처리 방법을 제안한다. 본 논문에서 제안한 방법은 기존에 미등록어로 처리되던 하이픈 단어들에 대하여 적절한 대역어를 생성해주므로 영한 기계 번역 시스템의 번역 질을 향상시킨다.
정한민(Hanmin Jung),여상화(Sanghwa Yuh),김태완(Taewan Kim),박동인(Dong-In Park) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.1B
본 논문은 복합 단위 검색을 위한 새로운 알고리즘을 제안한다. 복합 단위는 미리 정의된 자연스러운 대역어를 제공함으로써 생성 모듈의 부담을 감소시키며, divide-and-conquer 기법을 이용한 구문 분석의 검색 영역을 감소시킨다. 다양한 형태로 나타나는 복합 단위의 검색을 위한 빠르고 효율적인 검색 구조가 필요하다. 본 논문에서는 융통성 있는 매칭과 효율적인 검색을 위해 이종 노드를 가진 트라이를 사용한다. 현상태로부터의 검색 행동을 결정하는 기준자인 “method"를 사용하여 일관성을 가진 검색 기법을 구현한다. 실험은 이 검색 알고리즘이 단어 수에 대한, 그리고 복합 단위 수의 증가에 대한 시간 복잡도가 선형적인 형태라는 것을 보여준다.
정한민(Hanmin Jung),여상화(Sanghwa Yuh),채영숙(Youngsoog Chae),김태완(Taewan Kim),박동인(Dongin Park) 한국정보과학회 1996 한국정보과학회 학술발표논문집 Vol.23 No.2A
본 논문은 효율적인 영한 번역을 수행하기 위한 전 단계로서의 복합 단위 인식기 설계를 제안한다. 우리는 복합 단위를 각 단어의 의미만으로는 번역되기 힘들거나 항상 같은 형태로 나타나는 둘 이상의 단어들로 이루어진 단어 뭉치로 정의한다. 복합 단위를 인식함으로써 구문 분석의 검색 영역을 감소시키며 품사 중의성의 일부를 해결할 수 있다. 또한, 자연스러운 대역 표현을 제공하여 생성 모듈의 부담을 줄일 수 있다. 본 시스템에는 품사 한정 기법, 공기 제약 문자열/품사 집합, 단어 재배치, 동사 유형 정보 및 유사 구문 태그가 도입되어 보다 효율적인 번역이 가능하도록 설계되었다.
정한민(Hanmin Jung),여상화(Sanghwa Yuh),김태완(Taewan Kim),박동인(Dong-In Park) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
본 논문은 부분 파싱을 도입하여 복합 단위 인식기의 성능을 향상시키는 기법에 대해 기술한다. 복합 단위 인식기는 태깅과 구문 분석 과정 사이에 위치하여 연어, 숙어, 복합 명사들을 포함하는 고정된 표현들을 총칭하는 복합 개념인 복합 단위를 인식한다. 복합 단위를 인식함으로써 구문 분석의 검색 영역과 품사 중의성 문제를 감소시킨다. 부분 파싱은 복합 단위 인식 과정의 구문 태그 범위 결정 문제에서 발생하는 잘못 인식된 복합 단위 후보 제거 및 구문 분석기의 검색 영역 축소를 통한 복합 단위 인식기의 신뢰도를 높이는 것을 목적으로 한다. 실험 결과는 31개의 기본 CFG 문법 규칙과 Cyclic 트라이 구조를 이용한 부분 파서가 복합 단위 인식기의 Precision을 99.69%까지 높여서 복합 단위 인식 결과의 신뢰성을 크게 향상시킴을 보여준다.