http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
황금하,권오욱,이경순,김영길,Huang, Jin-Xia,Kwon, Oh-Woog,Lee, Kyung-Soon,Kim, Young-Kil 한국정보처리학회 2017 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.6 No.11
목적 지향 대화 시스템에서 자유대화를 지원하기 위해 챗봇이 활용되고 있다. 그러나 목적지향 대화시스템을 위한 챗봇과 독립 챗봇에 대한 사용자 기대와 평가가 같은지에 대한 연구는 거의 없는 상황이다. 본 논문에서는 목적지향 대화시스템으로 구현한 영어 교육용 대화시스템에서, 대화의 자유도를 높이기 위하여 주제외 사용자 발화를 허용하고, 이에 대응하기 위한 챗봇을 개발하였다. 독립 챗봇과 보조 시스템으로서의 챗봇에 대하여 비교 평가함으로, 서로 다른 시스템에 대한 사용자의 서로 다른 기대를 살펴보았다. 또한 검색 기반 챗봇과 신경망 기술을 이용한 생성 기반 챗봇에 대한 비교 평가를 통해 이들의 장단점과 향후 활용 방안에 대하여 살펴보았다. Chatter bots are normally used in task-oriented dialogue systems to support free conversations. However, there is not much research on how chatter bots as auxiliary system should be different from independent ones. In this paper, we have developed a chatter bot for a dialogue-based computer assisted language learning (DB-CALL) system. We compared the chatter bot in two different cases: as an independent bot, and as an auxiliary system. The results showed that, the chatter bot as an auxiliary system showed much lower satisfaction than the independent one. A discussion is held about the difference between an auxiliary chatter bot and an independent bot. In addition, we evaluated a search-based chatter bot and a deep learning based chatter bot. The advantages and disadvantages of both methods are discussed.
황금하(Jin-Xia Huang),신지애(Ji-Ae Shin),최기선(Key-Sun Choi) 한국정보과학회 2008 정보과학회논문지 : 소프트웨어 및 응용 Vol.35 No.9
본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반 방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 isa와 기타 관계(non-isa 관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다. For the purpose of building domain ontology, this paper proposes a methodology for building core ontology first, and then enriching the core ontology with the concepts and relations in the domain thesaurus. First, the top-level concept taxonomy of the core ontology is built using domain dictionary and general domain thesaurus. Then, the concepts of the domain thesaurus are classified into top-level concepts in the core ontology, and relations between broader terms (BT) - narrower terms (NT) and related terms (RT) are classified into semantic relations defined for the core ontology. To classify concepts, a two-step approach is adopted, in which a frequency-based approach is complemented with a similarity-based approach. To classify relations, two techniques are applied: (i) for the case of insufficient training data, a rule-based module is for identifying isa relation out of non-isa ones; a pattern-based approach is for classifying non-taxonomic semantic relations from non-isa. (ii) For the case of sufficient training data, a maximum-entropy model is adopted in the feature-based classification, where k-NN approach is for noisy filtering of training data. A series of experiments show that performances of the proposed systems are quite promising and comparable to judgments by human experts.
황금하(Jin-Xia Huang),신지애(Ji-Ae Shin),최기선(Key-Sun Choi) 한국정보과학회 언어공학연구회 2007 한국정보과학회 언어공학연구회 학술발표 논문집 Vol.2007 No.10
본 논문에서는 분야 시소러스의 개념과 관계를 이용하여 코아 온톨로지를 확장하는 방법을 제안한다. 분야 시소러스의 개념을 코아 온톨로지의 상위 개념으로 분류하고, 시소러스에서의 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT)들 사이의 관계는 코아 온톨로지에서 정의한 의미관계로 분류한다. 유사도와 빈도수 기반의 방법으로 개념 분류를 수행하였고, 관계 분류에서는 두 가지 방법을 적용하였는데, (ⅰ) 훈련데이터가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 isa와 기타 관계(non-isa관계)로 분류하고, 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ⅱ) 훈련데이터를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 분류 방법을 사용하되, kNN방법으로 훈련데이터를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과, 시스템 성능이 사람에 의한 판단 결과와 비교 가능한 수준이었다.
황금하(Jin-Xia Huang),배선미(Sun-Mee Bae),최기선(Key-Sun Choi) 한국정보과학회 2004 한국정보과학회 학술발표논문집 Vol.31 No.1B
기존의 한글-한자 변환에서는 문맥정보와 통계정보를 고려하지 않는 사전기반의 단어단위 변환 방법을 사용한 반면, 본 논문에서는 언어모델 및 변환모델을 이용한 문장단위의 한자 자동변환 방법을 제안하고, 사전 미등록어와 복합어의 한글-한자 변환을 위하여 단어분할을 변환의 숨김 과정으로 처리하는 통합모델을 사용하였다. 실험 결과, 전문용어의 한글-한자 변환에서 제한된 한자 데이터를 이용하여 기존의 사전기반 변환보다 나은 결과를 얻을 수 있었다.
황금하(Jin-Xia Huang),이신목(Sheen-Mok Lee),남윤영(Yun-Yeong Nam),신지애(Ji-Ae Shin),최기선(Key-Sun Choi) 한국정보과학회 2006 한국정보과학회 학술발표논문집 Vol.33 No.2B
시소러스의 개념과 개념간 계층관계가 온톨로지 구축에 흔히 이용되고 있다. 다만 시소러스 계층관계는 is-a관계 뿐만 아니라 세분화되지 않은 관계도 포함되고 있기 때문에, 온톨로지의 기본 관계인 is-a관계를 분별하는 작업이 필요하다. 본 논문은 개념의 어휘표현 정보를 이용하여 온톨로지의 is-a관계를 설정하는 규칙을 제시하였고, 개념의 정의문 정보를 이용하여 is-a관계를 검수하는 방법을 제안하였다. IT분야 시소러스에 대한 is-a관계 설정 실험결과, 어휘표현 정보를 이용한 규칙 기반 is-a관계 설정은 85.83%의 정확도를 보였고, 정의문 정보를 이용한 is-a관계 판단의 일관성 평가 결과 일치도가 86.44%였다.
Dual-scale BERT using multi-trait representations for holistic and trait-specific essay grading
조민수,황금하,권오욱 한국전자통신연구원 2024 ETRI Journal Vol.46 No.1
As automated essay scoring (AES) has progressed from handcrafted techniques to deep learning, holistic scoring capabilities have merged. However, specific trait assessment remains a challenge because of the limited depth of earlier methods in modeling dual assessments for holistic and multi-trait tasks. To overcome this challenge, we explore providing comprehensive feedback while modeling the interconnections between holistic and trait representations. We introduce the DualBERT-Trans-CNN model, which combines transformerbased representations with a novel dual-scale bidirectional encoder representations from transformers (BERT) encoding approach at the document-level. By explicitly leveraging multi-trait representations in a multi-task learning (MTL) framework, our DualBERT-Trans-CNN emphasizes the interrelation between holistic and trait-based score predictions, aiming for improved accuracy. For validation, we conducted extensive tests on the ASAP++ and TOEFL11 datasets. Against models of the same MTL setting, ours showed a 2.0% increase in its holistic score. Additionally, compared with single-task learning (STL) models, ours demonstrated a 3.6% enhancement in average multi-trait performance on the ASAP++ dataset.
권오욱,홍택규,황금하,노윤형,최승권,김화연,김영길,이윤근,Kwon, O.W.,Hong, T.G.,Huang, J.X.,Roh, Y.H.,Choi, S.K.,Kim, H.Y.,Kim, Y.K.,Lee, Y.K. 한국전자통신연구원 2019 전자통신동향분석 Vol.34 No.4
In this study, we introduce trends in neural-network-based deep learning research applied to dialogue systems. Recently, end-to-end trainable goal-oriented dialogue systems using long short-term memory, sequence-to-sequence models, among others, have been studied to overcome the difficulties of domain adaptation and error recognition and recovery in traditional pipeline goal-oriented dialogue systems. In addition, some research has been conducted on applying reinforcement learning to end-to-end trainable goal-oriented dialogue systems to learn dialogue strategies that do not appear in training corpora. Recent neural network models for end-to-end trainable chit-chat systems have been improved using dialogue context as well as personal and topic information to produce a more natural human conversation. Unlike previous studies that have applied different approaches to goal-oriented dialogue systems and chit-chat systems respectively, recent studies have attempted to apply end-to-end trainable approaches based on deep neural networks in common to them. Acquiring dialogue corpora for training is now necessary. Therefore, future research will focus on easily and cheaply acquiring dialogue corpora and training with small annotated dialogue corpora and/or large raw dialogues.