http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
KT114 상호 / 업종 검색 시스템에서의 사전 기반 통상명 검색 모듈의 설계 및 구현
신봉근(Bong Keun Shin),정희정(Hee Jung Chung),김종수(Jong Soo Kim),김명호(Myoung Ho Kim),유병규(Byung Kyu Yoo),유광일(Kwang Il Yoo),홍희경(Hee Kyoung Hong) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
KT114 상호/업종 검색 서비스에서는 데이터베이스 내의 동일한 개체에 대하여, 사용자가 입력한 상호명과 실제 데이터베이스에 저장된 상호명이 서로 다른 ‘통상명 검색 문제’가 존재한다. 이는 사용자가 인지하고 있는 상호명이 실제 상호명이 아니라, 해당 상호의 대표적인 상표 혹은 상품명 등인 경우 발생한다. 본 논문에서는 이러한 ‘통상명 검색 문제’의 해결을 위하여 실제 상호와 사용자 인지 상호 간의 관계를 정의한 사전에 기반을 둔 해결 방안을 제안한다. 대용량의 자료에 대한 빠른 검색을 요구하는 시스템 특성상 사전의 구축 방식은 매우 중요한 문제이다. 본 논문에서는 사전을 구축하는 두 가지 서로 다른 접근 방법으로, ‘DBMS 내부 구축 방식’과 ‘외부 사전 구축 방식’에 대하여 설명하고, 시스템 환경을 고려하여 두 접근 방법을 비교 및 분석한다.
신봉근(Bong Keun Shin),곽태영(Tae Yeong Kwak),최승락(Seung Lak Choi),이윤준(Yoon-Joon Lee),김명호(Myoung Ho Kim) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
최근 들어 내용 기반의 이미지 검색을 지원하기 위한 방법으로, 특징 벡터를 이용한 유사 질의 연구가 활발히 진행되고 있다. 이러한 유사 질의를 효율적으로 지원하기 위해서는 고차원 공간상에 존재하는 점 데이터나 공간 데이터를 효과적으로 색인할 수 있는 색인 기법이 필요하다. 하지만 R*-트리를 바탕으로 하는 기존의 방법들은 고차원 데이터에 대해서 차원이 증가함에 따라 검색시간이 급격하게 증가하는 문제점을 안고 있다. 이러한 문제는 데이터의 클러스터링에 기반을 둔 기존의 방법들이 차원이 증가함에 따라 데이터를 제대로 클러스터링하지 못하기 때문에 발생하며, 따라서 이를 해결하기 위해서는 효과적인 클러스터링 기법이 필요하다. 본 논문에서는 하나의 최소 한계 영역(minimum bounding region)에 속하는 개체들의 응집 정도와 최소 한계 영역들간의 결합 정도를 고려하여 효과적으로 클러스터링하는 방안을 제안한다. 또한 이러한 클러스터링 기법을 수용하기 위한 색인 기법을 간략히 제시한다.