http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
심철민(Chul-Min Sim),여상화(SangHwa Yuh),김태완(Taewan Kim),박동인(Dong-In Park),권혁철(Hyuk-Chul Kwon) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
현재 웹 문서에 대한 정보 검색 시스템이 상용화되어 널리 사용되고 있다. 국내에서는 심마니, 까치네 등의 한국어 웹 문서 검색 시스템이 있으며, 국외 시스템으로는 Alta-Vista, Lycos, Yahoo 등의 시스템이 있다. 이 논문에서는 영어와 한국어 간의 단어 대 단어 번역 기능을 이용한 질의어 변환 기법을 개발한다. 이 논문에서는 단어 대 단어 번역시 발생하는 모호성을 해소하기 위해 명사의 의미 분류 체계와 단어 간의 공기 정보를 이용한다. 이 논문에서 구현한 질의어 변환기는 한국어 질의어를 입력으로 하여 영어 질의어를 생성해 냄으로써 한국어만을 사용하는 일반 사용자도 기존의 다국어 정보 검색 시스템을 검색할 수 있도록 하는 역할을 한다. 이 논문에서 제안한 질의어 변환 시스템을 이용하여 변환된 질의어를 다국어 정보 검색 시스템(Alta-Vista)에 입력한 결과 단순한 단어 대 단어 변환에 비해 검색 성능이 개선되었다.
심철민(Chul-Min Sim),최승권(Sung-kwon Choi),여상화(SangHwa Yuh) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅱ
변환 방식의 기계 번역 시스템에서 구조 변환은 번역의 품질을 결정하는 중요한 요소이다. 각 번역 시스템들은 이러한 구조 변환을 수행하기 위해 특별한 기법을 사용한다. 구조 변환을 수행하는 방안으로는 어휘 사전에 기술된 구조 변환 정보를 이용하는 방법, 변환 엔진에 언어 현상별 구조 변환 규칙을 프로그래밍하는 방법, 스크립트 언어를 이용하여 구조 변환 규칙을 기술하는 방법이 있다. 이 논문에서는 스크립트 형식의 범용 문법 기술 언어(Grammar Writing Language)를 제안한다. 이 논문에서 제안하는 문법 기술 언어는 규칙 기술을 용이하게 하기 위해 다양한 연산자와 기본 함수를 제공하며, 그 적용 대상에 따라 컴파일러 버전과 인터프리터 버전을 선택적으로 사용할 수 있다. 문법 기술 언어는 영한 기계 번역의 변환 모듈 뿐만 아니라 한영 변환 등의 트리 구조 변환을 요하는 다양한 응용 분야에 활용할 수 있다.
심철민(Chul-Min Sim),권혁철(Hyuk-Chul Kwon) 한국정보과학회 1996 정보과학회논문지(B) Vol.23 No.7
최근의 한국어 철자 검사와 교정기는 크게 2가지의 문제점을 안고 있다. 첫째, 고려 영역이 한어절로 제한되어 있다. 둘째, 교정 기법의 기본이 되는 음소 대치나 음절 단위 띄어쓰기 교정, 연속된 두 어절에 대한 붙여 보기 교정은 시간을 많이 소모한다. 본 논문에서는 한국어 문서에는 기존의 철자 검사기로는 인식하지 못하는 많은 오류가 있음을 보여준다. 그리고 이를 처리하기 위해 형태소와 어절 간의 연어 관계를 제시한다. 특히, 이를 효율적으로 처리하기 위해 "데몬 프로그래밍"에 기반한 규칙 베이스 기법을 이용한다. 본 논문에서 제안한 기법은 철자 검사기에서 문법 검사기로 발전하기 위한 기반이 될 것이다. The existing Korean spelling checkers have two problems as (1) the analysis is restricted in one word and (2) the correction is performed in a very ad hoc manner as to give a space, to change some characters or to join two adjacent words. This paper shows that Korean people make many spelling errors that exist in many Korean texts but can not be detected by existing Korean spelling checkers We shows in this paper that such spelling errors can be detected by introducing collocation of words in a sentence. For the efficiency to detect these types of errors, a rule based approach based on "demon programming" is applied. This extension bridges the gap between spelling checker to grammar checker.
트리 변환 언어를 이용한 한국어 문법 검사 / 교정기의 설계
심철민(Chul-Min Sim),권혁철(Hyuk-Chul Kwon),김태완(TaeWan Kim),박동인(Dong-In Park) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.2Ⅱ
현재 한국어 철자 검사기는 현재 실용화 추세에 들어섰다. 그러나 한국어 문법 검사/교정기의 경우는 한국어의 어순 자유성과 생략, 도치 등의 현상으로 인해 실용적인 시스템에 대한 연구가 활발하지 못하다. 이 논문에서는 한국어 구문 분석기의 분석 결과를 바탕으로 트리 변환 언어로 기술된 문법 검사 규칙을 통해 문법 오류를 검사하고 교정하는 문법 검사/교정기를 제안한다. 구문 분석기는 CYK 알고리즘을 이용한 의존 파서를 사용하며, 문법 검사/교정기는 일반적인 문서에서 발생하는 문법 오류들을 대상으로 어휘 교정 규칙, 구문 구조 교정 규칙, 스타일 교정 규칙의 3단계 교정 규칙을 적용한다. 문법 오류 검사/교정 규칙은 수행 및 유지/보수의 효율을 위해 계층적으로 구현하였다. 이 시스템은 한국어 문법 검사 뿐만 아니라 문체 및 의미 검사기의 시제품으로서 의의를 가진다.
정한민(Hanmin Jung),최승권(Sung-Kwon Choi),김영길(Young-Kil Kim),심철민(Chul-Min Sim) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅱ
웹 상에서의 자연어 처리 응용에 관한 연구가 활발히 진행되면서, 웹 문서에서 자주 나타나는 특징인 문장 표현에 있어서의 자유로움은 문장 처리의 기술적인 어려움을 가중시킨다. 특히, 문장 내의 부분적인 비정형적 표현이 흔히 나타남으로 인해 구문 분석이 자주 실패하게 되는데, 이에 대한 강건성 확보를 위해서 실패에 대한 복구 작업이 필요하다. 우리는 두 단계 구문 규칙을 사용하여 1 단계에서 정형적 표현의 문장들을 처리하고, 2 단계 구문 규칙의 제약 완화하여 부분적인 비정형적 표현까지도 포용할 수 있도록 한다. 후-실패 완화 과정에서 일관성 있게 구문 규칙을 사용함으로써 효율적인 구조적 파스 트리의 복구도 가능하게 하며, 차트의 재사용을 통해 구조적 애매성과 분석 시간의 단축을 가져온다.