http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
정보검색에서 어휘체인을 이용한 효과적인 색인어 추출 방안
강보영(Bo Yeong Kang),이상조(Sang Jo Lee) 한국정보과학회 2002 정보과학회논문지 : 소프트웨어 및 응용 Vol.29 No.7·8
정보 검색(Information Retrieval)이나 디지털 도서관(Digital Library)과 같은 분야에서 가장 중요한 요소는 사용자가 필요로 하는 정보를 찾아주는 것이다. 이를 위해서 사용자가 사용하는 장치는 사용자의 의도뿐만 아니라 문서의 내용 또한 잘 파악하여야 한다. 본 논문은 문서의 의미적인 내용을 파악하는데 도움을 주는 효과적인 키워드 추출 시스템을 제안한다. 제안된 시스템은 문서에서 추출된 명사들의 의미 (sense)를 결정(disambiguation)하고, 의미가 결정된 명사로 어휘체인을 생성한다. 특정 척도를 이용하여 강한 체인을 선별하고, 몇 개의 강한 체인에서 키워드들을 추출한다. 문서에서 사용된 명사들의 실제 센스를 결정하는 단계에서 semantic window라는 개념을 제안한다. 이것은 주변 명사들과의 의미관계를 미리 살펴보고, 문서내의 명사들의 센스를 결정하는 것이다. 본 시스템의 성능을 검증하기 위하여, 주요 구(key phrase) 추출 시스템인 KEA의 성능과 비교 분석하였다. 본 시스템은 정보 검색과 디지털 도서관을 포함한 범용적인 도메인에서 유용하게 사용될 수 있을 것으로 판단된다. In information retrieval or digital library, one of the most important factors is to find out the exact information which users need. In this paper, we present an efficient index term extraction method which makes it possible to guess the content of documents and get the information more exactly. To find out index terms in a document, we use lexical chains. Before generating lexical chains, we roughly disambiguate the senses of nouns in a document using specific concept, called semantic window. Semantic window is that we look ahead semantic relations of peripheral nouns and disambiguate the senses of nouns. After generating lexical chains with sense-disambiguated nouns, we find out strong chains by some metrics and extract index terms from a few strong chains. We evaluated our system, using results of a key phrase extraction system, KEA. This system works in general domains of documents including Information Retrieval and Digital Library.
강보영(Bo-Yeong Kang),김혜정(Hae-Jung Kim),황선욱(Sun-Wook Hwang),이상조(Sang-Jo Lee) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1B
본 논문은 문서내의 의미적인 관계에 기반하여, 문서의 내용을 보다 잘 추측할 수 있는 의미 인덱스 추출 및 가중치 부여 시스템을 제안하고자 한다. 문서 내의 개념 추출에 있어서는 기존의 어휘 체인(lexical chains)에 관한 연구를 확장하여 적용였다. 또한, 추출된 개념에서 중요 어휘에 가중치를 부여하기 위해서, 개념 벡터 공간을 이용한 정보성(information quantity)과 정보비(information ratio)를 정의하고, 인덱스의 가중치를 측정할 수 있는 정량화 할수 있는 척도로 제시하였다.
Human Evaluation of Keyword Extraction System Using Lexical Chains
강보영(Bo-Yeong Kang),이상조(Sang-Jo Lee) 한국정보과학회 2001 한국정보과학회 학술발표논문집 Vol.28 No.2Ⅱ
In Information Retrieval or Digital Library, one of the most important factors is to find out the exact information which users need. Exact keywords which represent the content of a document can be much help to find the exact information. In this paper, we evaluate an efficient keyword extraction system by recall and precision. The results presented here are based on the human evaluations of the quality and the appropriateness of keywords.
강보영(Bo-Yeong Kang),김대원(KAIST)(Dae-Won Kim(KAIST)),구상옥(Sang-Ok Gu),이상조(Sang-Jo Lee) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B
If there is an Information Retrieval system which comprehends the semantic content of documents and knows the preference of users, the system can search the information better on the Internet, or improve the IR performance. Therefore we propose the IR model which combines semantic based indexing and fuzzy relevance model. In addition to the statistical approach, we chose the semantic approach in indexing, lexical chains, because we assume it would improve the performance of the index term extraction. Furthermore, we combined the semantic based indexing with the fuzzy model, which finds out the exact relevance of the user preference and index terms. The proposed system works as follows: First, the presented system indexes documents by the efficient index term extraction method using lexical chains. And then, if a user tends to retrieve the information from the indexed document collection, the extended IR model calculates and ranks the relevance of user query, user preference and index terms by some metrics. When we experimented each module, semantic based indexing and extended fuzzy model, it gave noticeable results. The combination of these modules is expected to improve the information retrieval performance.
Hierarchical Clustering of Categorical Data using Improved Inter-Cluster Similarity
강보영(Bo-Yeong Kang),김대원(Daewon Kim) 한국정보과학회 2011 정보과학회논문지 : 소프트웨어 및 응용 Vol.38 No.1
본 연구는 범주형 데이터에 대한 계층적 클러스터링 알고리즘을 개선한 결과를 제시한다. 개별데이터간의 유사도에 기반한 기존의 알고리즘을 새로이 제안된 클러스터간 유사도에 기반한 방식으로 확장하였다. 제안된 알고리즘은 범주형 데이터에 대한 클러스터 특성을 유사도 계산에 반영하게 되며, 실험을 통해 그 성능 향상을 보이고 있다. This research proposed an improved hierarchical clustering algorithm for clustering categorical data. The traditional hierarchical algorithm was extended by calculating a similarity between clusters with a new inter-cluster similarity measure instead of the inter-individual measure used in the conventional algorithm. The proposed algorithm takes the cluster characteristics for categorical data into account in the similarity calculation, which is found to give better clustering results through experiments.
김미진(Mi-Jin Kim),강보영(Bo-Yeong Kang),구상옥(Sang-Ok Koo),박미성(Mi-Sung Park),이상조(Sang-Jo Lee) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.2Ⅱ
본 논문은 한국어 복합문에서의 영 대용어 해결을 위해 복합문 분해 알고리즘과 영 대용어 복원 규칙을 제안하고, 해결 방법을 제시한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 활용 어미들을 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 82.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.
연구논문 : 기후변화 연구에 관한 사회연결망 분석과 함의
최충익 ( Choong Ik Choi ),강보영 ( Bo Yeong Kang ) 한국지역개발학회 2012 韓國地域開發學會誌 Vol.24 No.5
A great deal of study is being carried out to cope with climate change. Very little attention has been paid to figure out the features of differences and similarities between the various researches related to climate change. This paper aims to find out the trend and characteristics of climate change research by using social network analysis. Also, the research attempts to explore some characteristics in climate change research with a forty-year time span, which is appropriate because many studies on climate change have been conducted since the late 1980s. Contents analysis and social network analysis are adopted as the methodology of this empirical study. This article reflects that various researches on climate change cover a wide range from engineering to social science. The results of the analysis also show that collaborative studies on climate change is actively performed in social science and humanities as well as natural science and engineering.
공간계획법과 환경관련법의 연계성에 관한 연결망 분석과 함의
최충익 ( Choong Ik Choi ),강보영 ( Bo Yeong Kang ) 한국환경정책평가연구원 2014 환경정책연구 Vol.13 No.2
이 논문은 국토의 환경을 효율적으로 유지하고 관리하기 위한 정책적 이슈로서 환경관련법 및 공간계획법의 상호 관계성 파악에 집중하고 있다. 이와 함께 환경문제의 근본적 해결은 공간계획과 함께 다루어져야 한다는 문제의식에서 출발하고 있다. 방법론으로서 연결망 분석을 활용하고 있으며 이를 통해 환경관련법과 공간계획법 간의 연계성 및 중심성 구조를 살펴보고 있다. 52개의 환경관련법과 29개의 공간계획법을 실증분석 대상으로 하여 환경법체계에 대한 제도적 대응방안 마련을 위한 학문적 토대 마련하고 있다. 기존 질적 연구의 틀을 벗어나, 환경관련법과 공간계획법 각각의 법률들을 실증적으로 분석하려는 시도를 했다는 점에서 의미 있다고 생각된다. This article aims to explore the connectivity and centrality between environment law and spatial law, where make implications in environmental planning. To achieve it, we used Network Analysis(NA) as a tool for analyzing the connectivities. 52 environmental Laws and 29 Spatial Laws are selected and used for this analysis. This study also attempts to explain the phenomenon through quantitative study rather than qualitative research. This paper is methodologically the first attempt to Environmental Law study, which will help to understand the structure of complex Environmental Law. The result of the network analysis for connectivity between Spatial Law and Environmental Law demonstrates that two laws are in less mutual relationship with each other. It also supports that Environmental Law and Spatial Law need to be closely connected with each other for effective environmental management.