http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
구조화 문서를 위한 정보 검색 인덱스의 구현과 성능 평가
손정한(Jeong-han Son),이희주(Hee-Ju Lee),장재우(Jae-Woo Chang),심부성(Bu-Seong Shim),주종철(Zong-Cheol Zhoo) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.1B
문서의 논리적 구조를 표현하는데 매우 융통성 있는 문법을 제공하는 SGML(Standard Generalized Markup Language : ISO 8879)은 이기종간의 문서교환 및 처리를 목적으로 개발되었다[1]. SGML 의 효용성 때문에 미국방성의 CALS(Commece At Light Speed)프로젝트, Digital Library등에서 정보 관리의 표준으로 채택되어 그 비중이 높아지고 있다. 이에 본 연구에서는 SGML 문서에 대한 효율적인 정보 검색을 제공하기 위해서 사용자 질의를 형태별로 분류하여 이를 토대로 SGML 문서의 기본단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 지원하기 위한 인덱스관리자를 설계하였고 UNIX 운영체제하에서 표준 C 언어를 사용하여 O1 Store 하부 저장 시스템 위에서 구현하였다. 구현된 인덱스 관리자의 성능평가를 위해 저장 시간, 삭제 시간, 검색 시간, 부가 저장 공간 측면에서 성능평가를 수행한다.
SGML 정보 검색 인덱스 설계를 위한 K - ary 트리, 문서 단위 구문 트리와 엘리먼트 단위 구문 트리의 비교
손정한(Jeong-han Son),한성근(Sung-geun Han),장재우(Jae-Woo Chang),주종철(Zong-Cheol Zhoo) 한국정보과학회 1998 한국정보과학회 학술발표논문집 Vol.25 No.2Ⅰ
ISO에서 문서 교환에 대한 표준을 제시된 SGML(Standard Generalized Markup Language)은 논문이나 보고서와 같이 내부적으로 복잡한 구조를 가지는 문서를 효과적으로 처리하기 위해 매우 융통성 있는 문법을 제공하고 있다. 이에 각 기업체나 행정기관에서는 기존의 전자 문서들을 SGML 문서로 변환하는 작업이 활발히 진행되고 있다. 따라서 문서의 논리적 구조에 기반한 검색에 대한 요구도 크게 증가하고 있다. 본 연구에서는 SGML 문서의 기본단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 효율적으로 지원하는 인덱스를 설계하기 위해, K-ary 트리, 문서단위 구문트리와 엘리먼트단위 구문 트리의 3가지 방법에 대해 저장 시간, 삭제 시간, 검색 시간, 부가 저장 공간 측면에서 수학적 모델로서 성능평가를 수행한다.
SGML 문서를 위한 효율적인 인덱스 관리자의 구현 및 성능평가
손정한(Jeong-Han Son),한성근(Sung-geun Han),장재우(Jae-Woo Chang),김현기(Hyun-ki Kim),강현규(Hyun-kyu Kang) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B
ISO에서 문서 교환에 대한 표준으로 제시된 SGML(Standard Generalized Markup Language)은 논문이나 보고서와 같이 내부적으로 복잡한 구조를 가지는 문서를 효과적으로 처리하기 위해 매우 융통성 있는 문법을 제공하고 있다. 이에 각 기업체나 행정기관에서는 기존의 전자 문서들을 SGML 문서로 변환하는 작업이 활발히 진행되고 있다. 따라서 기존의 정보 검색에서의 문서 단위뿐만 아니라 엘리먼트 단위의 검색이 이루어져야 하며, 문서의 부분삭제와 부분삽입의 동적인 환경을 지원해야 한다. 본 연구에서는 이를 위한 SGML 문서의 기본단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 효율적으로 지원하는 SGML 인덱스 관리자를 구현하여 기존 인덱스 관리자와 성능비교를 수행한다.
동적 환경에 적합한 SGML 인덱스 관리자의 설계 및 구현
한성근(Han Sung Geun),손정한(Son Jeong Han),장재우(Chang Jae Woo),김현기(Kim Hyun Ki),강현규(Kang Hyun Kyu) 한국정보처리학회 1999 정보처리학회논문지 Vol.6 No.10
Since a SGML document is composed of elements, the primitive unit of information, SGML information retrieval should support retrieval on element as well as document. In addition, SGML index organization should support the partial insertion and deletion of document for the dynamic environment. For this, we propose a SGML index organization suited to structured-based retrieval for dynamic environment. Based on the proposed index organization, we design a SGML index manager to support content-based and structure-based retrieval efficiently. We implement the SGML index manager based on O2 storage system and compare the performance of our SGML index manager with the conventional SGML index manager. According to the performance comparison, it is shown that the proposed index structure achieves better retrieval performance that the conventional K-ary complete tree.
SGML 정보검색을 위한 인덱스 관리자의 설계 및 구현
장재우,이희주,손정한,심부성,주종철(Jae-Woo Chang),Hee-Ju Lee,Jeong-Han Son,Bu-Seong Shim,Zong-Cheol Zhoo 한국정보과학회 1999 정보과학회 컴퓨팅의 실제 논문지 Vol.5 No.2
SGML 정보검색을 위한 인덱스 관리자는 SGML 정보 표현의 기본 단위인 엘리먼트 단위의 검색과 문서의 논리적인 구조에 기반한 검색을 지원해야 하며, 아울러 우수한 검색 시간과 낮은 부가 저장 공간을 보장하여야 한다. 이러한 요구사항을 만족시키기 위해 본 논문에서는 SGML 정보검색을 위한 사용자 질의를 형태별로 분류하여 이를 토대로 SGML 정보검색 인덱스 관리자를 설계한다. 아울러 인덱스 관리자를 UNIX 운영체제하에서 표준 C 언어를 가지고 O2 Store 하부저장 시스템을 이용하여 구현한다. 마지막으로 저장 시간, 삭제 시간, 검색 시간, 부가 저장 공간 측면에서 구현된 인덱스 관리자의 성능 평가를 수행한다. An index manager for SGML information retrieval (SIR) should support not only retrieval based on elements, i.e. primitives of SGML documents, but also retrieval based on logical structures of SGML documents. It also should guarantee good retrieval performance and low storage overhead. In order to support the requirements, we, in this paper, design a SIR index manager based on the types of user queries for SIR and implement it with the standard C language using the O2 Store storage system under UNIX OS environment. Finally, we make a performance analysis of our SIR index manager in terms of insertion time, deletion time, retrieval time, and storage overhead.