RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
          펼치기
        • 주제분류
        • 발행연도
          펼치기
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 객체지향 데이터베이스상의 협력질의응답

        원정임(Jung-Im Won),홍동완(Dong-Wan Hong),이경준(Kyung-Jun Lee),윤지희(Jee-Hee Yoon) 한국정보과학회 1997 한국정보과학회 학술발표논문집 Vol.24 No.1B

        기존의 질의처리 시스템에서 사용자가 질의문을 잘못 작성하거나, 문제 영역을 잘못 기술한 경우, 사용자는 일반적으로 원하는 해를 얻지 못하거나 매우 제한적인 해만을 얻게 된다. 객체지향 데이터베이스 시스템상에서 이와같은 문제점을 보완하여, 사용자의 질의 응답 과정을 적극 지원하는 협력 질의 응답 기능에 대하여 논한다. 이를 위한 시스템 요구 사항, 시스템 기능 등을 정의하고, 클래스 구조의 지식베이스 구성 방법, 클래스 객체의 계층 구조 및 객체의 유사도 개념을 활용한 질의 수정 및 변환처리 방식 등에 제안한다. 또한 이들 이론에 근거한 질의 처리 시스템의 설계 및 구현 방식에 대하여 설명한다. 질의 처리 시스템은 사용자와의 합의하에 질의의 구문 보정, 스키마 질의, 질의 그래프 출력, 유사 객체 검색, 결과의 설명 기능 등을 제공한다.

      • KCI등재

        시계열 데이터베이스에서 복수의 모델을 지원하는 모양 기반 서브시퀀스 검색

        원정임,윤지희,김상욱,박상현,Won, Jung-Im,Yoon, Jee-Hee,Kim, Sang-Wook,Park, Sang-Hyun 한국정보처리학회 2003 정보처리학회논문지D Vol.10 No.4

        모양 기반 검색이란 실제 요소 값과 관계없이 질의 시퀀스와 유사한 모양을 갖는 시퀀스(서브시퀀스)를 데이터베이스 내에서 검색하여 내는 연산이다. 본 논문에서는 시계열 데이터베이스에서의 모양 기반 검색을 위한 유연성 있는 새로운 유사 모델을 정의하고, 이 유사 모델을 지원하기 위한 인덱싱 및 질의 처리 방안을 제시한다. 제안된 유사 모델에서는 정규화, 이동 평균, 타임 워핑 등 다양한 변환을 지원한다. 특히 최종 유사 정도를 계산하기 위하여 사용되는$L_p$거리 함수론 사용자가 임의로 지정하도록 함으로써 응용에서 선호하는 유사 모델을 반영할 수 있다. 또한 이러한 모양 기반 검색을 효과적으로 지원하기 위한 압축된 서브시퀀스 트리 구조를 제안하고, 이를 기반으로 하는 효율적인 질의 처리 기법을 제시한다. 실험 결과에 의하면 제안된 기법은 진의 시퀀스와 모양이 유사한 서브시퀀스들을 사용자에 의하여 선택된 거리 함수를 사용하여 성공적으로 검색할 뿐 아니라, 순차 검색과 비교하여 거리 함수 선택에 따라 수 십배에서 수 백배까지의 성능 개선 효과를 갖는 것으로 나타났다. The shape-based retrieval is defined as the operation that searches for the (sub) sequences whose shapes are similar to that of a query sequence regardless of their actual element values. In this paper, we propose a similarity model suitable for shape-based retrieval and present an indexing method for supporting the similarity model. The proposed similarity model enables to retrieve similar shapes accurately by providing the combination of various shape-preserving transformations such as normalization, moving average, and time warping. Our indexing method stores every distinct subsequence concisely into the disk-based suffix tree for efficient and adaptive query processing. We allow the user to dynamically choose a similarity model suitable for a given application. More specifically, we allow the user to determine the parameter p of the distance function $L_p$ when submitting a query. The result of extensive experiments revealed that our approach not only successfully finds the subsequences whose shapes are similar to a query shape but also significantly outperforms the sequence search.

      • KCI등재

        배아 데이터의 효율적 검색을 위한 계층적 구조화 방법

        원정임(Jung-Im Won),오현교(Hyun-Kyo Oh),장민희(Min-Hee Jang),김상욱(Sang-Wook Kim) 大韓電子工學會 2011 電子工學會論文誌-CI (Computer and Information) Vol.48 No.2

        배아란 동물이나 식물과 같은 다세포 생물의 초기 단계를 의미한다. 배아의 단계에서 다세포 생물의 기초적인 체제가 결정되기 때문에 배아는 개체발생의 기구를 연구하는 중요한 연구대상이 된다. 생물학자들은 배아 연구를 위해 대용량의 배아 이미지 데이터를 소유하고 있으며, 이러한 대용량 데이터 중 원하는 이미지를 효율적으로 검색하기 위해서는 데이터 구조화가 필요하다. 데이터베이스 구조화를 위해 주로 사용되는 방법으로 계층적 클러스터링이 있다. 그러나 기존의 계층적 클러스터링 방법은 데이터베이스를 트리 형태로 구조화 하는 과정에서 클러스터의 크기와 클러스터 내의 객체 수를 동시에 고려하지 못하기 때문에 결과 클러스터링 트리가 경사 트리일 가능성이 매우 높다. 경사 트리인 경우 사용자가 원하는 이미지를 검색하기 위해 트리를 순회할 때 많은 시간이 걸린다. 따라서 본 논문에서는 대용량의 배아 이미지 데이터를 경사 되지 않으며 균형 상태에 가까운 트리 형태로 구조화하기 위한 방안을 제시한다. 제안하는 방안은 데이터베이스 내에 저장된 배아 이미지를 그래프로 변환하고 반복적으로 그래프 분할 알고리즘을 적용하여 클러스터를 생성한다. 이 때 클러스터의 크기와 클러스터 내의 객체 수를 동시에 고려하여 특정 클러스터의 크기가 지나치게 커지거나 객체 수가 많아지는 것을 방지한다. 실험을 통해서 제안하는 방안의 우수성을 규명하고 시각화 툴을 제공하여 사용자가 원하는 배아 이미지를 쉽게 찾을 수 있도록 돕는다. Embryo is a very early stage of the development of multicellular organism such as animals and plants. It is an important research target for studying ontogeny because the fundamental body system of multicellular organism is determined during an embryo state. Researchers in the developmental biology have a large volume of embryo image databases for studying embryos and they frequently search for an embryo image efficiently from those databases. Thus, it is crucial to organize databases for their efficient search. Hierarchical clustering methods have been widely used for database organization. However, most of previous algorithms tend to produce a highly skewed tree as a result of clustering because they do not simultaneously consider both the size of a cluster and the number of objects within the cluster. The skewed tree requires much time to be traversed in users’ search process. In this paper, we propose a method that effectively organizes a large volume of embryo image data in a balanced tree structure. We first represent embryo image data as a similarity-based graph. Next, we identify clusters by performing a graph partitioning algorithm repeatedly. We check constantly the size of a cluster and the number of objects, and partition clusters whose size is too large or whose number of objects is too high, which prevents clusters from growing too large or having too many objects. We show the superiority of the proposed method by extensive experiments. Moreover, we implement the visualization tool to help users quickly and easily navigate the embryo image database.

      • KCI등재

        DNA 시퀀스 데이타베이스를 위한 실용적인 유사 서브 시퀀스 검색 기법

        원정임(Jung-Im Won),홍상균(Sang-Kyoon Hong),윤지희(Jee-Hee Yoon),박상현(Sang-Hyun Park),김상욱(Sang-Wook Kim) 한국정보과학회 2007 정보과학회논문지 : 데이타베이스 Vol.34 No.2

        유사 서브 시퀀스 검색은 분자 생물학 분야에서 사용되는 매우 중요한 연산이다. 본 논문에서는 대규모 DNA 시퀀스 데이타베이스를 처리 대상으로 하여 효율성과 정확도를 보장하는 실용적인 유사서브 시퀀스 검색 기법을 제안한다. 제안된 기법은 이진 트라이를 인덱스 구조로 채택하여 DNA 시퀀스로부터 추출한 일정 길이의 윈도우 서브 시퀀스를 인덱싱 대상으로 한다. 유사 서브 시퀀스 검색 알고리즘은 기본적으로 다이나믹 프로그래밍 기법에 근거하여 이진 트라이를 루트로부터 너비 우선(breadth-first) 방식으로 운행하며, 경로 상에 존재하는 모든 유사 서브 시퀀스를 검색해 낸다. 그러나 질의 길이가 윈도우의 크기보다 큰 일반적인 경우에는 질의를 일정 길이의 서브 시퀀스로 분해하여 각 서브 시퀀스에 대하여 유사 서브 시퀀스 검색을 수행한 후, 후처리 과정에 의하여 정확도에 손상 없이 이 들 결과를 결합하는 분할 질의 처리 방식을 채택한다. 제안된 기법의 우수성을 검증하기 위하여, 실험을 통한 성능 평가를 수행한다. 실험 결과에 의하면, 제안된 인덱스 기법은 접미어 트리에 비하여 약 40%의 작은 저장 공간을 가지고도 약 4~17배의 검색 성능의 개선 효과를 나타낸다. 또한 분할 질의 처리 방식에 의한 유사 서브시퀀스 검색 알고리즘은 질의 길이가 긴 경우에도 효율적으로 동작하여 Suffix와 Smith-Waterman 알고리즘에 비하여 각각 수배에서 수십배의 검색 성능의 개선 효과를 나타낸다. In molecular biology, approximate subsequence search is one of the most important operations. In this paper, we propose an accurate and efficient method for approximate subsequence search in large DNA databases. The proposed method basically adopts a binary trie as its primary structure and stores all the window subsequences extracted from a DNA sequence. For approximate subsequence search, it traverses the binary trie in a breadth-first fashion and retrieves all the matched subsequences from the traversed path within the trie by a dynamic programming technique. However, the proposed method stores only window subsequences of the pre-determined length, and thus suffers from large post-processing time in case of long query sequences. To overcome this problem, we divide a query sequence into shorter pieces, perform searching for those subsequences, and then merge their results. To verify the superiority of the proposed method, we conducted performance evaluation via a series of experiments. The results reveal that the proposed method, which requires smaller storage space, achieves 4 to 17 times improvement in performance over the suffix tree based method. Even when the length of a query sequence is large, our method is more than an order of magnitude faster than the suffix tree based method and the Smith-Waterman algorithm.

      • 유사객체 검색을 지원하는 협력 의료정보 시스템 설계

        원정임(Jung-Im Won),박형주(Hyung-Joo Park),안상원(Sang-Won An),윤지희(Jee-Hee Yoon) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.1B

        문자 정보 및 X-Ray, MRI, CT등과 같은 의료영상 정보를 취급하는 의료정보 시스템에서의 유사객체 검색을 지원하는 협력 의료정보 시스템의 설계에 대하여 논한다. 이를 위해 객체간 의미적 관련성을 기반으로 한 유사도 자동 추출 방식 및 지식베이스 구성 방식을 제안하고 이를 활용한 유사객체 검색에 대하여 논한다. 특히 의료영상을 객체 값으로 갖는 경우 객체간 유사도는 영상처리의 특징추출 방식에 의해 추출된 영상내에 출현하는 공간 객체의 위치, 면적, 둘레, 공간 객체간의 위상 관계 등의 공간 속성을 이용한다. 여기서 공간적 위치에 근거한 유사도는 공간 위치를 대표하는 Hilbert값의 분포와 빈도를 토대로 계산한다.

      • 유사객체 분류에 의한 유사 의료영상의 검색

        원정임(Jung-Im Won),이덕형(Duck-Hyung Lee),송혜정(Hyeo-Jung Song),윤지희(Jee-Hee Yoon),김백섭(Baek-Sop Kim) 한국정보과학회 2002 한국정보과학회 학술발표논문집 Vol.29 No.1B

        의료영상 처리시스템의 자동인식 결과 등과 함께 진단 중인 의료 영상과 유사한 영상객체를 임의로 검색하여, 부가정보로 활용할 수 있는 지능적 의료정보 시스템 구현에 대하여 논한다. 의료 영상객체간 유사도 계산을 위하여 각 객체로부터 추출된 특징 정보를 객체 속성으로 이용하며, 이 들 특징 값들의 빈도와 관련 분포, 속성 간 관련성 등을 고려한 유사객체 분류방식을 사용한다. 이와 같이 얻어진 영상객체 간 유사도 정보는 지식베이스로 관리되어 자동 영상 인식에 사용될 뿐 아니라 유사 영상 검색 및 진단의 근거자료로 사용된다. 즉 전문의나 병리학자들은 진단 과정에서 유사영상의 판독 결과 등을 참조함으로써 영상의 정확한 판독 및 진단 확증의 객관적 근거 자료를 확보하는데 도움을 받을 수 있다. 구현된 시스템의 적용 예로 자궁경부 세포진 영상인식 시스템을 이용하여 그 유용성을 보인다.

      • KCI등재

        대용량 DNA 시퀀스 데이타베이스를 위한 효율적인 인덱싱

        원정임(Jung-Im Won),윤지희(Jee-Hee Yoon),박상현(Sang-Hyun Park),김상욱(Sang-Wook Kim) 한국정보과학회 2004 정보과학회논문지 : 데이타베이스 Vol.31 No.6

        DNA 시퀀스 검색은 분자 생물학 분야에서 사용되는 매우 중요한 연산이다. DNA 시퀀스 데이타베이스는 매우 큰 용량을 가지므로 DNA 시퀀스 검색의 효율적인 처리를 위해서는 고속 인덱스의 사용이 필수적이다. 본 논문에서는 DNA 시퀀스 검색을 위하여 기존에 제안된 접미어 트리가 가지는 저장 공간, 검색 성능, DBMS와의 통합 등의 문제점들을 지적하고, 이러한 문제점을 해결할 수 있는 새로운 인덱스를 제안한다. 제안된 인덱스는 포인터 없이 트라이를 비트 스트링으로 표현하는 기본 구조와 후처리 시 액세스 되어야 하는 트라이의 단말 노드를 신속하게 찾기 위한 보조 자료 구조로 구성된다. 또한, 제안된 인덱스를 이용하여 DNA 시퀀스 검색을 효과적으로 처리하는 알고리즘을 제시한다. 제안된 기법의 우수성을 검증하기 위하여, 실험을 통한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 인덱스는 기존의 접미어 트리와 비교하여 더 작은 저장 공간을 가지고도 13배에서 29배까지의 검색 성능의 개선 효과를 가지는 것으로 나타났다. In molecular biology, DNA sequence searching is one of the most crucial operations. Since DNA databases contain a huge volume of sequences, a fast indexing mechanism is essential for efficient processing of DNA sequence searches. In this paper, we first identify the problems of the suffix tree in aspects of the storage overhead, search performance, and integration with DBMSs. Then, we propose a new index structure that solves those problems. The proposed index consists of two parts: the primary part represents the trie as bit strings without any pointers, and the secondary part helps fast accesses of the leaf nodes of the trie that need to be accessed for post processing. We also suggest an efficient algorithm based on that index for DNA sequence searching. To verify the superiority of the proposed approach, we conducted a performance evaluation via a series of experiments. The results revealed that the proposed approach, which requires smaller storage space, achieves 13 to 29 times performance improvement over the suffix tree.

      • 트라이 인덱스를 이용한 DNA 시퀀스 검색

        원정임(Jung-Im Won),박용일(Yong-Il Park),윤지희(Jee-Hee Yoon),박상현(Sang-Hyun Park) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.2Ⅱ

        본 논문에서는 대규모 DNA 시퀀스를 위한 트라이 인덱싱 기법을 기반으로 하는 효율적인 부분 시퀀스 검색 기법을 제시한다. 제안된 인덱싱 방안에서는 저장 공간 감소를 위하여 시퀀스의 각 문자를 최소 비트 정보로 표현하며, 저장 구조로서 포인터를 사용하지 않는 디스크 기반의 이진 접미어 트라이 구조를 사용한다. 질의 처리 방안에서는 포인터가 없는 이진 트라이 구조상에서 질의 시퀀스를 검색하기 위하여 이진 정보 기반의 연산과정을 필요로 하며, 또한 단말 정보를 효율적으로 검색하기 위하여 별도의 단말정보 테이블과 인덱스 구조를 사용한다. 실험 결과에 의하면 제안된 방식은 기존의 접미어 트리 인덱싱 방식에 비하여 약 30-50%의 저장 공간 감소 효과를 가질 뿐 아니라, 평균 질의 처리 시간에 있어 약 20배까지의 성능 개선 효과를 갖는 것으로 나타났다.

      • KCI등재

        도로 네트워크 환경을 위한 궤적 클러스터링

        백지행,원정임,김상욱,Bak, Ji-Haeng,Won, Jung-Im,Kim, Sang-Wook 한국정보처리학회 2009 정보처리학회논문지D Vol.16 No.3

        최근 궤적 정보를 이용한 많은 연구들이 진행되고 있으나, 이들 대부분의 연구는 유클리드 공간 내의 궤적들을 대상으로 하고 있다. 그러나 실제 응용에서 대부분의 이동 객체들은 도로 네트워크 공간상에 존재하므로, 유클리드 공간을 대상으로 한 연구들을 도로 네트워크 공간에 적용시키는 것은 적합하지 않다. 본 논문에서는 도로 네트워크 내 이동 객체들의 대용량 궤적 정보를 대상으로 하는 효과적인 클러스터링 기법에 대하여 논한다. 이를 위하여 우선 본 논문에서는 궤적을 각 이동 객체가 시간에 따라 지나온 도로 세그먼트들의 연속으로 정의한다. 다음, 도로 세그먼트들의 길이와 식별자 정보를 이용한 새로운 유사도 측정 함수를 제안하고, 이를 이용하여 측정된 궤적간의 유사도 정보를 기반으로 FastMap과 계층 클러스터링(hierarchical clustering)기법을 이용하여 전체 궤적들을 클러스터링하는 방식을 제안한다. 또한, 본 논문에서는 실제 응용에서 대부분의 이동 객체는 최단 거리를 이용하여 움직인다는 특성을 반영한 새로운 궤적 생성 기법을 제안하고, 이렇게 생성된 궤적 데이터를 이용하여 제안된 클러스터링 기법에 대한 다양한 성능 평가 결과를 보인다. 실험 결과에 따르면 제안된 기법은 사람에 의하여 유사 궤적들을 클러스터링한 결과와 비교하여 95%이상의 높은 정확도를 보였다. Recently, there have been many research efforts proposed on trajectory information. Most of them mainly focus their attention on those objects moving in Euclidean space. Many real-world applications such as telematics, however, deal with objects that move only over road networks, which are highly restricted for movement. Thus, the existing methods targeting Euclidean space cannot be directly applied to the road network space. This paper proposes a new clustering scheme for a large volume of trajectory information of objects moving over road networks. To the end, we first define a trajectory on a road network as a sequence of road segments a moving object has passed by. Next, we propose a similarity measurement scheme that judges the degree of similarity by considering the total length of matched road segments. Based on such similarity measurement, we propose a new clustering algorithm for trajectories by modifying and adjusting the FastMap and hierarchical clustering schemes. To evaluate the performance of the proposed clustering scheme, we also develop a trajectory generator considering the observation that most objects tend to move from the starting point to the destination point along their shortest path, and perform a variety of experiments using the trajectories thus generated. The performance result shows that our scheme has the accuracy of over 95% in comparison with that judged by human beings.

      • KCI등재

        영역 질의의 효과적인 처리를 위한 궤적 인덱싱

        차창일,김상욱,원정임,Cha, Chang-Il,Kim, Sang-Wook,Won, Jung-Im 한국정보처리학회 2009 정보처리학회논문지D Vol.16 No.4

        This paper addresses an indexing scheme capable of efficiently processing range queries in a large-scale trajectory database. After discussing the drawbacks of previous indexing schemes, we propose a new scheme that divides the temporal dimension into multiple time intervals and then, by this interval, builds an index for the line segments. Additionally, a supplementary index is built for the line segments within each time interval. This scheme can make a dramatic improvement in the performance of insert and search operations using a main memory index, particularly for the time interval consisting of the segments taken by those objects which are currently moving or have just completed their movements, as contrast to the previous schemes that store the index totally on the disk. Each time interval index is built as follows: First, the extent of the spatial dimension is divided onto multiple spatial cells to which the line segments are assigned evenly. We use a 2D-tree to maintain information on those cells. Then, for each cell, an additional 3D $R^*$-tree is created on the spatio-temporal space (x, y, t). Such a multi-level indexing strategy can cure the shortcomings of the legacy schemes. Performance results obtained from intensive experiments show that our scheme enhances the performance of retrieve operations by 3$\sim$10 times, with much less storage space. 본 연구에서는 대용량 궤적 데이터베이스에서 영역 질의를 효과적으로 처리하기 위한 인덱싱 기법에 대하여 논의한다. 먼저, 기존 인덱싱기법의 문제점을 지적하고, 이러한 문제점을 해결하는 새로운 기법을 제안한다. 제안된 기법에서는 우선 시간 차원을 다수의 시간 구간으로 분할하고, 인덱싱의 대상이 되는 전체 라인 세그먼트들을 시간 구간별로 구분한다. 각 시간 구간에 속하는 라인 세그먼트들에 대하여 별도의 인덱스를 구축한다. 또한, 디스크에서 관리되는 과거 시간 구간에 대한 인덱스들과는 달리 최근 시간 구간에 대한 인덱스는 메인 메모리상에 관리함으로써 삽입과 검색의 성능을 크게 개선할 수 있다. 각 시간 구간에 속하는 라인 세그먼트들은 다음과 같은 방식으로 인덱스를 구축한다. 먼저, 2D-트리를 이용하여 전체 공간 차원을 유사한 수의 라인 세그먼트들이 배정되도록 다수의 셀들로 분할한다. 또한, 분할된 각 셀마다 시공간 차원 (x, y, t)에 대한 별도의 3차원 $R^*$-트리를 두어 보다 상세한 인덱싱을 지원한다. 이와 같은 다양한 전략을 이용함으로써 기존 기법의 문제점들을 해결 할 수 있다. 다양한 실험을 통하여 제안된 기법의 우수성을 정량적으로 검증한다. 실험 결과에 의하면, 기존 기법에 비하여 작은 인덱스 구조를 갖으면서도 검색 성능면에서 3$\sim$10배까지의 성능 향상 효과를 갖는 것으로 나타났다.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼