http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
윤희근(Hee-Geun Yoon),박성배(Seong-Bae Park) 한국지능시스템학회 2015 한국지능시스템학회논문지 Vol.25 No.1
웹의 비구조 문서로부터 자동으로 인스턴스를 생성하기 위한 다양한 연구가 제안되었다. 영어권의 기존 연구들에서는 간단한 규칙과 정규식 기반의 패턴을 활용하였다. 영어에서는 단순한 정규식 기반의 패턴만으로도 충분히 높은 정확도를 보여 주었지만. 한국어는 영어와 다른 언어적인 특성으로 인하여 기존의 정규식 형태의 패턴으로는 적합한 패턴을 생성할 수 없다. 이에 본 논문에서는 한국어에 적합한 패턴 및 인스턴스 생성 방법을 제안한다. 제안한 방법은 대상 문장의 의존 관계를 고려함으로써 높은 정확도를 가지는 패턴 집합을 생성한다. 또한 인스턴스의 주어(subject)와 목적어(object) 판별을 위하여 조사 정보를 함께 활용함으로써 한국어의 자유로운 어순으로부터 오는 제약을 해결한다. 실험 결과에 따르면 본 논문에서 제안한 패턴 생성 방법이 단순 어순만을 고려하여 생성된 패턴들에 비하여 더 높은 정확률을 보여주어, 한국어 대상 자동 인스턴스 생성에 적합함을 확인하였다. There are various researches which proposed an automatic instance generation from freetext on the web. Existing researches that focused on English, adopts pattern representation which is generated by simple rules and regular expression. These simple patterns achieves high performance, but it is not suitable in Korean due to differences of characteristics between Korean and English. Thus, this paper proposes a novel method for generating patterns and instances which focuses on Korean. A proposed method generates high quality patterns by taking advantages of dependency relations in a target sentences. In addition, a proposed method overcome restrictions from high degree of freedom of word order in Korean by utilizing postposition and it identifies a subject and an object more reliably. In experiment results, a proposed method shows higher precision than baseline and it is implies that proposed approache is suitable for self-knowledge learning system.
의미 유사도를 활용한 Distant Supervision 기반의 트리플 생성 성능 향상
윤희근(Hee-Geun Yoon),최수정(Su Jeong Choi),박성배(Seong-Bae Park) Korean Institute of Information Scientists and Eng 2016 정보과학회논문지 Vol.43 No.6
The existing pattern-based triple generation systems based on distant supervision could be flawed by assumption of distant supervision. For resolving flaw from an excessive assumption, statistics information has been commonly used for measuring confidence of patterns in previous studies. In this study, we proposed a more accurate confidence measure based on semantic similarity between patterns and properties. Unsupervised learning method, word embedding and WordNet-based similarity measures were adopted for learning meaning of words and measuring semantic similarity. For resolving language discordance between patterns and properties, we adopted CCA for aligning bilingual word embedding models and a translation-based approach for a WordNet-based measure. The results of our experiments indicated that the accuracy of triples that are filtered by the semantic similarity-based confidence measure was 16% higher than that of the statistics-based approach. These results suggested that semantic similarity-based confidence measure is more effective than statistics-based approach for generating high quality triples.
공공부문 디지털전환 가속화를 위한 한국형 클라우드 전략모델
김영희(Kim Young Hee),방인혜(Bang InHye),윤희근(Yoon Hee Geun),이민기(Lee Min-Ki),김형순(Kim Hyong-Soon) 한국통신학회 2021 한국통신학회 학술대회논문집 Vol.2021 No.6
코로나19로 인해 우리 일상은 경제활동뿐만 아니라 교육, 문화, 의료 등 사회 전반에 온라인 및 비대면 방식으로 급속도로 변화되고 있으며 디지털 정부 발전계획, 데이터 댐 등 국가 주도 디지털 뉴딜 정책을 통해 공공부문에서도 대규모 사업을 추진하여 디지털 전환 가속화를 위해 노력하고 있다. 이러한 비대면 방식의 중심에는 세상을 연결하는 클라우드 기술이 있다. 본 논문에서는 클라우드를 활용한 디지털전환 지원을 위해 공공부문에서 추진하고 있는 디지털 전문계약 제도와 클라우드 플랫폼 기술, 공공부문 선도사업 등 제도와 기술, 사업 세 가지 축을 중심으로 한국형 클라우드 전략모델을 고찰하고자 한다.
곽창욱(Chang-Uk Kwak),윤희근(Hee-Geun Yoon),박성배(Seong-Bae Park) Korean Institute of Information Scientists and Eng 2014 정보과학회논문지 Vol.41 No.12
In order to assist user’s who are in the process of executing a search, a query expansion method suggests keywords that are related to an input query. Recently, several studies have suggested keywords that are identified by finding domains using a clustering method over the documents that are retrieved. However, the clustering method is not relevant when presenting various domains because the number of clusters should be fixed. This paper proposes a method that suggests keywords by finding various domains related to the input queries by using a community detection algorithm. The proposed method extracts words from the top-30 documents of those that are retrieved and builds communities according to the word graph. Then, keywords representing each community are derived, and the represented keywords are used for the query expansion method. In order to evaluate the proposed method, we compared our results to those of two baseline searches performed by the Google search engine and keyword recommendation using TF-IDF in the search results. The results of the evaluation indicate that the proposed method outperforms the baseline with respect to diversity.