http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
김미훈(Meixun Jin),김미영(Mi-Young Kim),이종혁(Jong-Hyeok Lee) 한국정보과학회 2006 정보과학회논문지 : 소프트웨어 및 응용 Vol.33 No.5
입력문장이 길어질수록 구문분석의 정확률은 크게 낮아진다. 따라서 긴 문장의 구문분석 정확률을 높이기 위해 장문분할 방법들이 많이 연구되었다. 중국어는 고립어로서 자연언어처리에 도움을 줄 수 있는 굴절이나 어미정보가 없는 대신 쉼표를 비교적 많이, 또 정확히 사용하고 있어서 이러한 쉼표사용이 장문분할에 도움을 줄 수 있다. 본 논문에서는 중국어 문장에서 쉼표 주변의 문맥을 파악하여 해당 쉼표위치에 문장분할이 가능한지 Support Vector Machine을 이용해 판단하고자 한다. 쉼표의 분류의 정확률이 87.1%에 이르고, 이 분할모델을 적용한 후 구문분석한 결과, 의존트리의 정확률이 5.6% 증가했다. The longer the input sentences, the worse the parsing results. To improve the parsing performance, many methods about long sentence segmentation have been reserarched. As an isolating language, Chinese sentence has fewer cues for sentence segmentation. However, the average frequency of comma usage in Chinese is higher than that of other languages. The syntactic information that the comma conveys can play an important role in long sentence segmentation of Chinese languages. This paper proposes a method for classifying commas in Chinese sentences according to the context where the comma occurs. Then, sentences are segmented using the classification result. The experimental results show that the accuracy of the comma classification reaches 87.1%, and with our segmentation model, the dependency parsing accuracy of our parser is improved by 5.6%.
EM 알고리즘을 이용한 전문용어 온톨로지 클래스간 관계 정의를 위한 동사 클러스터링
김미훈(Meixun Jin),남상협(Sang-Hyob Nam),이용훈(Yong-Hoon Lee),이종혁(Jong-Hyeok Lee) 한국정보과학회 언어공학연구회 2007 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2007 No.10
온톨로지 구축에서 클래스간 관계 설정은 중요한 부분이다. 본 논문에서는 클래스간 상 하위 관계 외의 관계 설정을 위한 클래스간 관계 자동 정의를 목적으로 의존구문분석의 (주어, 용언) (목적어, 용언) 쌍들을 추출하고, 이렇게 추출된 데이터를 이용하여 용언들을 클러스터링 하는 방법을 제안한다. 도메인 전문 코퍼스 데이터 희귀성 문제를 해결하고자, 웹검색을 결합한 방식을 선택하여 도메인 온톨로지 구축 클래스간 관계 자동 설정에 대한 방법론을 제시한다.
김미훈(Meixun Jin),김미영(Mi-Young Kim),김동일(Dongil Kim),이종혁(Jong-Hyeok Lee) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B
일반적인 언어에서 대등접속문은 접속사와 함께 나타나지만, 중국어 대등접속문은 접속사 없이도 이루어질 수 있다. 이러한 경우 조사정보가 대등접속문을 판단하는데 중요한 정보가 된다. 본 논문에서는 중국어 조사(助詞)정보를 고려하여 접속사가 없는 중국어 대등접속문을 인식하는 방법을 제안한다.
이언,김영보,김미훈,안성기,강동수,박철완 대한신경외과학회 1995 Journal of Korean neurosurgical society Vol.24 No.9
During thalamotomy, we have to use the various kinds of brain reference points. From 1989 to 1992, the authors performed streotactic thalamotomy or pallidotomy in 169 patients suffering from tremor. We measured and estimated the important intracerebral reference points. These data were very meaningful for stereotactic functional neurosurgery in the Korean medical community because it is obtained from Korean people. We have also estimated the average location of targets for tremor submission.
문장부호 정보와 확장된 청크에 기반한 중국어 최장명사구 식별
백설매(Xue-Mei Bai),김미훈(Mei-Xun Jin),이금희(Jin-Ji Li),정유진(You-Jin Chung),이종혁(Jong-Hyeok Lee) 한국정보과학회 언어공학연구회 2005 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2005 No.10
명사구는 기본명사구와 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구문구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 수행한다. 본 논문에서는 확장된 청크(chunk) 개념과 다섯 개의 클래스로 세분화된 문장부호 정보를 사용한 최장명사구 식별 기법을 제안한다. 제안된 기법은 기본모델(baseline)보다 4.05% 향상된 평균 88.63%의 우수한 F-measure 성능을 보인다.
윤창호(Changhao Yin),이용훈(Yong-Hun Lee),김미훈(Mi-hoon Kim),김동일(Dong-il Kim),이종혁(Jong-hyeok Lee) 한국정보과학회 언어공학연구회 2004 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.16 No.1
일반적으로 중국어의 명사구는 기본명사구(base noun phrase), 최장명사구(maximal noun phrase) 등으로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구조를 파악하고 정확한 구문 트리(parse tree)를 찾아내는데 중요한 역할을 한다. 본 논문은 두 단계 학습모델을 이용하여 최장명사구 자동식별을 진행한다. 먼저 기본명사구, 기본동사구, 기본형용사구, 기본부사구, 기본수량사구, 기본단문구, 기본전치사구, 기본방향사구 등 8가지 기본구를 식별한다. 다음 기본구의 중심어(head)를 추출해 내고 이 정보를 이용하여 최장명사구의 식별을 진행한다. 본 논문에서 제안하는 방법은 기존의 단어레벨의 접근방법과는 달리구레벨에서 학습을 진행하기 때문에 주변문맥의 정보를 많이 고려해야 하는 최장명사구 식별에 있어서 아주 효과적인 접근방법이다. 후처리 작업을 하지 않고 기본구의 식별에서 25개 기본구 태그의 평균 F-measure가 96%, 평균길이가 7인 최장명사구의 식별에서 4개 태그의 평균 F-measure가 92.5%로 좋은 성능을 보여주었다.
백설매(Xue-Mei Bai),이금희(Jin-Ji Li),김미훈(Mei-Xun Jin),정유진(You-Jin Cheng),이종혁(Jong-Hyeok Lee) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.1
일반적으로 중국어의 명사구는 최단명사구, 기본명사구, 최장명사구로 분류된다. 최장명사구에 대한 정확한 식별은 문장의 전체적인 구조를 파악하고 문장의 정확한 지배용언을 찾아내는데 중요한 역할을 한다. 본 논문에서는 특성에 따라 5개의 클래스로 세분화된 문장부호를 학습자질로 사용하여 최장명사구 자동식별을 진행한다. 제안된 기법은 평균길이가 4인 최장명사구의 식별실험에서 기본모델(baseline)보다 4.5% 향상된 평균 85.1%의 우수한 F-measure 성능을 보인다.