http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
LHMM기반 영어 형태소 품사 태거의 도메인 적응 방법
권오욱(Oh-Woog Kwon),김영길(Young-Gil Kim) 한국정보과학회 2010 정보과학회 컴퓨팅의 실제 논문지 Vol.16 No.10
형태소 품사 태거는 언어처리 시스템의 전처리기로 많이 활용되고 있다. 형태소 품사 태거의 성능 향상은 언어처리 시스템의 전체 성능 향상에 크게 기여할 수 있다. 자동번역과 같이 복잡도가 높은 언어처리 시스템은 최근 특정 도메인에서 좋은 성능을 나타내는 시스템을 개발하고 자 한다. 본 논문에서는 기존 일반도메인에서 학습된 LHMM 이나 HMM 기반의 영어 형태소 품사 태거를 특정 도메인에 적응하여 높은 성능을 나타내는 방법을 제안한다. 제안하는 방법은 특정도메인에 대한 원시코퍼스를 이용하여 HMM이나 LHMM의 기학습된 전이확률과 출력확률을 도메인에 적합하게 반자동으로 변경하는 도메인 적응 방법이다. 특허도메인에 적응하는 실험을 통하여 단어단위 태깅 정확률 98.87%와 문장단위 태깅 정확률 78.5%의 성능을 보였으며, 도메인 적응하지 않은 형태소 태거보다 단어단위 태깅 정확률 2.24% 향상(ERR: 66.4%)과 문장단위 태깅 정확률 41.0% 향상(ERR: 65.6%)을 보였다. A large number of current language processing systems use a part-of-speech tagger for preprocessing. Most language processing systems required a tagger with the highest possible accuracy. Specially, the use of domain-specific advantages has become a hot issue in machine translation community to improve the translation quality. This paper addresses a method for customizing an HMM or LHMM based English tagger from general domain to specific domain. The proposed method is to semi-automatically customize the output and transition probabilities of HMM or LHMM using domain-specific raw corpus. Through the experiments customizing to Patent domain, our LHMM tagger adapted by the proposed method shows the word tagging accuracy of 98.87% and the sentence tagging accuracy of 78.5%. Also, compared with the general tagger, our tagger improved the word tagging accuracy of 2.24% (ERR: 66.4%) and the sentence tagging accuracy of 41.0% (ERR: 65.6%).
몬트리올협약과 개정 상법상 항공화물운송인의 책임에 관한 비교연구
이양우 한국무역경영학회 2023 한국무역경영연구 Vol.- No.29
This paper aims to comparative on the Air Cargo Carrier of liability system under the Montreal Convention and the Korean Commercial Code. In this paper, the results of the study are presented the difference and improvement on the Korean commercial Code and Montreal Convention for the carrier’s liability in the carriage by air of cargo as follow. First, the Montreal Convention was inserting the type of cargo as the ‘destruction’, ‘loss’, ‘damage’ and ‘delay’ but the Korean Commercial Code was inserted the only as ‘loss’, ‘damage’ and ‘delay’ except the ‘destruction’. So, in the Korean Commercial Code should stipulate the ‘destruction’ for the cause of cargo loss because of specialty in the carriage by air cargo. Secondly, the carrier’s period of liability is a during the carriage by air which the goods are in charge of the carrier. In the international transportation have many uses the cause of ‘delay’, and then the Korean Commercial Code necessary should add the justice of ‘delay’ and ‘during the carriage by air’ in the Article 914. Third, they are in discord with the amounts of limited liability of the carrier as 19 SDR in the international transport or 15 SDR in the national transport. Therefore, the Korean Commercial Code should revised to accord that which it will the application for the governing law. Fourth, the Korean Commercial Code should revised to rules that in the limited liability of the carrier rule out the liability of the agents or servants of the carrier moreover carrier in the wilful conduct or reckless behavior. Fifth, the Korean Commercial Code should make a division the justice of ‘destruction’, ‘partially of loss’ and ‘partially damage’ so as to the effectiveness of notify for the complain. Sixth, the consignor’s disposition right of cargo should revised to the extinction period in which when consignee do the action of demand right of cargo delivery like the land transportation and sea transportation in the Korean Commercial Code.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ) 한국정보처리학회 2023 한국정보처리학회 학술대회논문집 Vol.30 No.2
CEFR(Common European Framework of Reference for Language)는 유럽 전역의 교육기관에서 언어구사 능력을 평가하는 평가 기준이다. 본 논문은 학습자가 문장 작문한 것을 CEFR 에 기반하여 평가하는 모델을 기술하는 것을 목표로 한다. CEFR 기반 문장 작문 평가는 크게 전처리 단계, 작문 단계, 평가 단계로 구성된다. CEFR 기반 문장 작문 평가 모델의 평가는 CEFR 수준별로 분류한 문장들이 전문가의 수동 분류와 일치하는 지의 정확도와 학습자가 작문한 결과의 자동 평가로 측정되었다. 실험은 독일어를 대상으로 하였으며 독일어 전공 41 명의 대학생에게 CEFR 6 등급별로 5 문장씩 총 30 문장의 2 세트를 만들어 실험을 실시하였다. 그 결과 CEFR 등급별 자동 분류는 전문가의 수동 분류와 61.67%로 일치하는 정확도를 보였다.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ),김영길 ( Young-gil Kim ) 한국정보처리학회 2022 한국정보처리학회 학술대회논문집 Vol.29 No.2
언어학적 다양성을 가지는 고품질의 한국어 패러프레이즈 생성을 위해 패러프레이즈의 생성을 제어할 수 있는 제약이 필요하다. 원문을 패러프레이즈로 변경하기 위한 생성용 제약으로 6 개의 제약을 제시한다: 키워드 치환, 키워드 확장, 품사 변경, 패턴 변경, 구조 변경, 키워드 리스트, 생성길이. 원문으로부터 패러프레이즈를 생성할 때 제약이 적용되는 정도를 시물레이션해 보았다. 10 어절 이하의 원문은 평균 2.05 번의 제약이 적용되면 패러프레이즈가 생성되었으며 키워드 치환, 마스킹에 의한 키워드 확장과 패턴 변경에 관한 제약이 가장 많이 적용되는 것을 확인하였다.
최승권 ( Sung-kwon Choi ),권오욱 ( Oh-woog Kwon ),노윤형 ( Yoon-hyung Roh ),이기영 ( Ki-young Lee ),김영길 ( Young-gil Kim ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.2
본 논문은 한국전자통신연구원(ETRI)에서 2010 년부터 2015 년까지 5 년간에 걸쳐 개발 예정인 영어 교육용 대화 시스템 중 2011 년에 개발된 관광용 영어 교육용 대화 시스템 중 도시 관광 도메인을 대상으로 한 도시 관광용 영어 대화 시스템을 소개하는 것을 목표로 한다. 도시 관광용 영어대화 시스템은 크게 대화 이해 모듈, 대화 관리 모듈, 대화 생성 모듈, 대화 모델링 구축/관리 모듈, 대화 지식 구축 도구로 구성된다. 도시 관광용 영어 대화 시스템 평가를 위해 평가자를 초급, 중급, 고급의 3 개 그룹으로 나누어 평가를 실시하였다. 평가자는 원격 웹 평가 도구에 접속하여 4 개의 대화 미션에 대해 영어로 대화 시스템과 대화를 실시하였으며 평가는 태스크 성공률로 측정되었다. 태스크 성공률은 82.5%로 측정되었다.
패턴기반 영한 자동번역 시스템의 상용화를 위한 도메인 특화 방법
최승권(Sung-Kwon Choi),이기영(Ki-Young Lee),노윤형(Yoon-Hyung Roh),권오욱(Oh-Woog Kwon),김영길(Young-Gil Kim) 한국정보과학회 2012 정보과학회논문지 : 소프트웨어 및 응용 Vol.39 No.4
본 논문은 한국전자통신연구원 언어처리연구팀에서 2004년까지 개발하였던 웹문서 자동번역시스템을 2006년부터 매년 도메인별로 상용화에 성공한 사례를 기술한 것이다. 상용화가 가능하였던 주요 요인 중 하나인 도메인 특화 방법을 소개하며 이 도메인 특화 방법이 시기별로 개선되어 진화되는 모습을 기술한다. 즉 2004년의 웹문서 영한 자동번역기를 2006년에 특허문서 영한 자동번역기로 특화할 때 사용한 도메인 특화 방법이 '초기 도메인 특화 방법'이라 할 수 있는데, 이 초기의 도메인 특화 방법에 번역지식 및 번역엔진 모듈의 반자동 튜닝 방법과 자동화된 평가 방법을 추가하여 2007년에 '개선된 도메인 특화 방법'을 개발하였다. 이 '개선된 도메인 특화 방법'은 2007년에 특허문서 영한 자동번역기를 기술논문 영한 자동번역기로, 2008년에 기술논문 영한 자동번역기를 IT웹신문 영한 자동번역기로, 2009년에 IT 웹신문 영한 자동번역기를 전자우편 및 기업문서 영한 자동번역기로, 그리고 2010년에 전자우편 영한 자동번역기를 메신저 영한 자동번역기로 구현할 때 사용하였으며 그 효과는 신규 도메인용 영한 번역기를 개발하는 기간을 점차적으로 줄이게 하였으며 구현 프로세스에 일관성을 제공하였다. This paper is to describe the success case that NLP Research Team, ETRI could commercialize the domain-specific machine translation systems every year since 2006. One of the main factors to enable the commercialization was the customization method which adapts an existing system to new domain. The goal of this paper is to introduce the customization method in detail and show how the customization method has evolved according to domains. For this, we will first describe the pure customization method used to adapt an English-Korean Web MT system in 2004 to an English-Korean patent MT system in 2006. Then we will discuss the upgraded customization method that semi-automatic construction of translation knowledge, semi-automatic tuning of translation engine modules, and automatic evaluation were added to the pure customization method. This upgraded customization method could make the following commercialization possible: machine translation system for scientific paper translation in 2007, machine translation system for IT web news translation in 2008, machine translation system for business documents translation in 2009, and machine translation system for messenger translation in 2010.