http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
U-WIN(사용자어휘지능망) 기반의 의미적 정보검색과 KISTI-STA
최호섭,윤화묵,옥철영,Choe, Ho-Seop,Yun, Hwa-Muk,Ok, Cheol-Yeong 한국전문도서관협의회 2007 STIMA bulletin Vol.6 No.-
정보검색서비스는 '사용자가 얼마나 편리하게 검색할 수 있는가'와 '검색 결과에 얼마나 만족하는가'가 중요한데, 이는 정보검색 기술 개발에서 가장 중요하게 고려해야 할 사항이다. 본고는 과학기술 지식정보를 대상으로, 어휘망과 온톨로지적 성격을 가지고 있는 U-WIN을 기반으로 의미적인 정보검색 서비스가 가능하도록 하기 위하여, 한국과학기술정보연구원(KISTI)에서 개발 중인 U-WIN을 이용한 의미적 정보검색 기술과 시범서비스인 KISTI-STA를 소개한다.
최호섭(Ho-Seop Choe),옥철영(Cheol-Young Ock),장문수(Moon-Soo Chang),장명길(Myung-Gil Jang) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B
시소러스, 의미망, 온톨로지 등과 같은 지식베이스는 자연언어처리와 관련된 여러 분야에서 중요한 언어자원의 역할을 담당하고 있다. 하지만 정보검색, 기계번역과 같은 특정 분야마다 다르게 구축되어 이러한 지식베이스는 실질적인 한국어 처리에는 크게 효과를 보지 못하고 있는 실정이다. 본 논문은 한국어를 대상으로 한 시소러스, 의미망 등의 구축 방법론적 문제를 지적하고, 말뭉치를 중심으로 한 텍스트 언어처리에 필요한 의미망의 구축 방법과 포괄적인 활용 방안을 모색한다. 의미망 구축의 기반이 되는 지식은 각종 사전(dictionary)를 이용했으며, 구축하고 있는 의미망의 활용 가능성을 평가하기 위하여 ETRI의 ‘의미기반 정보검색’과 언어처리의 큰 문제 중 하나인 단어 중의성 해소(WSD)에서 어떻게 활용되는지를 살핀다. 그리하여 언어자원의 처리 방안 중의 하나인 의미망을 구축함으로써 언어를 효과적으로 처리하기 위한 기본적이면서 중요한 어휘 데이터베이스 마련과 동시에 언어자원 구축의 한 방향을 제시하고자 한다.
최호섭(Choe Ho Seop),옥철영(Ock Cheol Young) 한국어학회 2002 한국어학 Vol.17 No.-
It is important to construct Knowledge Base(like Thesaurus, Ontology, Semantic Network, etc) which can be applied to the whole field of natural language processing. For example, WordNet, Kadokawa Thesaurus, and Lexical FreeNet represent the most typical Knowledge Base in natural language processing. Many Knowledge Bases constructed in many fields does not come up to our expectations in Korean language processing. In order to construct an effective Knowledge Base, various language resources such as corpus, dictionary, synonym dictionary and WordNet have to be integrated one another, and the knowledge base has to consist of chain of morpheme-word-phrase-collocation-idiom-corpus. This paper presents a construction method and application of Korean Semantic Network (KSN). The KSN is based on Korean dictionary and Sejong corpus, and is applied to text processing, word sense disambiguation (WSD). semantic analysis, query pattern analysis in information retrieval, and so on. This paper deals with the following contents: (1) We point out problems of thesaurus and semantic network that look like a hierarchical structure of words, and compare KSN with them. The KSN has 1:1 relationship between word and sense, not 1:n relationship that an existing thesaurus and semantic network has (2) We present KSN component parts and a construction method. The KSN has noun semantic hierarchy structure linked to predicates, semantic class, proper noun, semantic information, and so on. The links are resulted from consideration of a paradigmatic relation and a syntagmatic relation within sentence. For reference, the KSN consists of dictionary, morpheme information, parts of speech information, construction information, proper noun information (name entity), noun semantic hierarchical structure, predicates classification structure, semantic class relation, idiom, semantic information, and so on. (3) We Present that WSD using the KSN is more effective than one using an existing thesaurus and semantic network.
김광영(KwangYoung Kim),최호섭(Ho-Seop choe),진두석(Dusuk Jin),김진숙(Jinsuk Kim) 한국정보과학회 2010 한국정보과학회 학술발표논문집 Vol.37 No.1B
본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.
이왕우(Wang-Woo Lee),최호섭(Ho-Seop Choe),옥철영(Cheol-Young Ock) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B
뜻풀이에서 추출한 의미 정보를 이용한 통계적인 방법의 기존 동형이의어 분별 시스템에서는 불필요한 의미 정보들을 많이 가지고 있었다. 그리고 동형이의어간의 의미정보가 서로 교차하는 부분이 많아 확률적인 결정에 오류를 발생시켰다. 본 논문에서는 뜻풀이에서 구문패턴을 분석하여 보다 정제된 의미 정보를 추출하였고, 구문패턴에 속하는 어휘들의 하위어를 사전에서 자동 추출하여 부족한 의미 정보를 보완하였다. 또한, 구문패턴으로 분별할 수 없는 일부 동형이의어들은 순환 뜻풀이 망(RDN)을 이용하여 동형이의어를 분별하였다. 이러한 방법으로 동형이의어 분별을 통해 기존 연구보다 8%의 정확률 향상을 가져왔다.
임지희(Im Ji-Hui),최호섭(Choe Ho-Seop),옥철영(Ock Cheol-Young) 한국콘텐츠학회 2006 한국콘텐츠학회 종합학술대회 논문집 Vol.4 No.2
사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서만 집중적으로 나타나는 현상을 볼 수 있다. 그래서 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여, 질의어의 모호성을 해결하는 의미적 정보검색의 기반이 되는 기술을 제안한다. 실험에서 질의어는 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형이의로 구분하고, ‘질의어+상위어’ 형태의 확장 질의어를 설정한다. 그래서 포탈사이트의 웹 문서만을 대상으로 한 정확률은 73.5%, 통합검색의 정확률은 68.7%로 나타났다. 이것은 U-WIN 기반의 의미적 정보검색 기술이 정보검색 시스템에서 효율적임을 알 수 있다. The criterion which judges an information retrieval system performance is to how many accurately retrieve an information that the user wants. The search result which uses only homograph has been appears the various documents that relates to each meaning of the word or intensively appears the documents that relates to specific meaning of it. So in this paper, we suggest semantic information retrieval technique using relation within User-Word Intelligent Network(U-WIN) to solve a disambiguation of query. In our experiment, queries divide into two classes, the homograph used in terminology and the general homograph, and it sets the expansion query forms at "query + hypernym". Thus we found that only web document search's precision is average 73.5% and integrated search's precision is average 70% in two portal site. It means that U-WIN-Based semantic information retrieval technique can be used efficiently for a IR system.