RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • 과학 데이타베이스에서 부분 문자열의 발생 빈도 예측

        배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.1A

        대량의 짧은 문자열들에 대해 부분 문자열의 발생 빈도를 예측하는 문제는 카운트 서픽스 트리를 미리 생성한 후 이를 이용함으로써 처리될 수 있다. 카운트 서픽스 트리는 모든 부분 문자열의 발생 빈도를 저장한 뒤 가지치기를 함으로써, 제한된 트리 크기와 발생 빈도 예측이라는 두 가지 목표를 처리한다. 하지만, 염기서열에서 처럼 저장된 문자열의 길이가 길어질 경우 카운트 서픽스 트리를 생성하기가 대단히 어려워진다는 문제점이 발생한다. 이 논문에서는 선삽입, 후가지치기 방식의 카운트 서픽스 트리 대신, 처음부터 길이가 q 이하인 문자열들만을 삽입하는 큐그램 트리를 제안한다. 큐그램 트리는 제한된 트리 크기에 따라 저장할 부분 문자열의 크기를 미리 결정할 수 있으며, 데이터베이스에 저장된 문자열의 전체 길이가 N일 때 O(N) 시간에 생성 가능하다. 실험 결과 제한된 부분 문자열을 가지고 있음에도 불구하고 긴 부분 문자열의 발생 빈도를 매우 정확하게 예측할 수 있음을 보였다.

      • KCI등재

        생물학 서열 데이타베이스에서 부분 문자열의 선택도 추정

        배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2003 정보과학회논문지 : 데이타베이스 Vol.30 No.2

        지금까지 문자열 데이타에 대한 선택도 추정은 문자열들의 등장 회수에 대한 정보를 저장하고 있는 ‘카운트 서픽스 트리’를 생성한 뒤, 이 트리를 이용하여 부분 문자열들의 선택도를 추정하는 방법으로 이루어졌다. 그런데, 문자열 데이타가 생물학 서열처럼 매우 길어질 경우 카운트 서픽스 트리를 생성하는 일은 거의 불가능해진다는 문제점이 발생한다. 이 논문에서는 길이가 q인 부분 문자열들만을 삽입한 ‘카운트 큐그램 트리’를 제안한다. 카운트 큐그램 트리는 서열 내의 길이가 q 이하인 모든 부분 문자열(큐그램)들의 정확한 등장 회수를 저장하고 있으며, 문자열의 전체 길이 N에 상관없는 크기로, O(N) 시간에 생성 가능하다. 또한, 이 논문에서는 카운트 큐그램 트리를 이용한 ‘k번째 최대겹침’ 추정 방법을 제시한다. 이 추정 방법은 질의 문자열을 길이 q인 부분 문자열로 나눌 때 부분 문자열들의 겹치는 정도 k를 선택할 수 있도록 한 방법으로 이전 연구에서 제시한 ‘최대겹침’ 방법을 확장하였다. q와 k를 변화시키며 진행한 실험을 통해 대부분의 경우에 매우 정확하게 선택도를 추정할 수 있음을 확인하였다. Until now, substring selectivities have been estimated by two steps. First step is to build up a count-suffix tree, which has statistical information about substrings, and second step is to estimate substring selectivity using it. However, it's actually impossible to build up a count-suffix tree from biological sequences because their lengths are too long. So, this paper proposes a novel data structure, count q-gram tree, consisting of fixed length substrings. The Count q-gram tree retains the exact counts of all substrings whose lengths are equal to or less than q and this tree is generated in O(N) time and in size not subject to total length of all sequences, N. This paper also presents an estimation technique, k-MO. k-MO can choose overlapping length of splitted substrings from a query string, and this choice will affect accuracy of selectivity and query processing time. Experiments show k-MO can estimate very accurately.

      • 다중 XML 문서 인덱싱을 위한 전역 인코딩 기법

        배진욱(Jinuk Bae),문봉기(Bongki Moon),이석호(Sukho Lee) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.1

        지금까지 제안된 구조조인 알고리즘들은 하나의 XML 문서에 대해 복잡한 질의를 빠르게 처리할 수 있다는 장점이 있다. 하지만, 다중 문서를 처리할 때 각 문서에 부여된 문서식별자에 의해 문서별 질의 처리를 하기 때문에, 문서의 수가 증가한다면 질의 처리 시간도 길어진다는 문제점이 발생한다. 이 논문에서는 이 문제를 해결하기 위해 XML 문서를 XMAS 트리로 병합한 뒤 전역적으로 인코딩을 하는 기법을 제안한다. XMAS 트리는 각 문서의 구조 정보를 유지한 채 공통된 부분을 공유하는 트리이다. 이 공유에 의해서 질의 처리시에 성능 향상을 얻을 수 있다. 실험 결과, 선형 질의에 대해 수백 배, 가지모양 질의에 대해 수십 배 빠르게 질의를 처리할 수 있었다.

      • KCI등재

        빠른 XML 질의 처리를 위한 세그먼트 조인 기법

        배진욱(Jinuk Bae),문봉기(Bongki Moon),이석호(Sukho Lee) 한국정보과학회 2005 정보과학회논문지 : 데이타베이스 Vol.32 No.3

        Complex queries such as path and twig patterns have been the focus of much research on processing XML data. Structural join algorithms use a form of encoded structural information for elements in an XML document to facilitate join processing. Recently, structural join algorithms such as TwigStack and TSGeneric+ have been developed to process such complex queries, and they have been shown that the processing costs of the algorithms are linearly proportional to the sum of input data. However, the algorithms have a shortcoming that their processing costs increase with the length of a query. To overcome the shortcoming, we propose the segment join technique to augment the structural join with structural indexes such as the 1-Index. The SegmentTwig algorithm based on the segment join technique performs joins between a pair of segments, which is a series of query nodes, rather than joins between a pair of query nodes. Consequently, the query can be processed by reading only a query node per segment. Our experimental study shows that segment join algorithms outperform the structural join methods consistently and considerably for various data sets. XML 데이타를 대상으로 선형 질의나 가지모양 질의 같은 복잡한 질의가 많이 연구되고 있다. 이와 같은 질의를 처리하기 위해 XML 데이타를 구조정보에 의해 미리 인코딩한 후, 질의 처리시 구조정보를 이용하여 빠르게 질의를 수행하는 구조 조인 알고리즘들이 제안되었다. 그 중 최근에 제안된 TwigStack 알고리즘과 TSGeneric 알고리즘은 각각 인덱스가 없는 환경과 있는 환경에서 수행시간이 입력 데이타의 양과 비례하는 최적의 성능을 보여주었다. 하지만 이들 알고리즘은 질의의 길이(질의에 나타난 엘리먼트 개수)에 비례하여 입력 데이타의 양이 증가하고, 따라서 수행시간이 길어진다는 제한점이 있다. 이 논문에서는 기존의 구조 조인 알고리즘들에 구조 인덱스를 결합한 세그먼트 조인 기법을 제안한다. 이 기법은 질의 노드와 노드 간의 구조 조인과는 달리, 구조 인덱스를 이용하여 일련의 질의 노드들을 하나의 세그먼트로 식별한 후 세그먼트와 세그먼트 사이의 조인을 수행한다. 그 결과 세그먼트마다 하나의 질의 노드만을 읽음에 의해 질의를 처리할 수 있게 되어 수행성능이 향상된다. 다양한 데이타셋에 대해 인덱스가 없는 환경에서 실험 결과, 세그먼트 조인 기법을 적용한 SegmentTwig 알고리즘은 TwigStack 알고리즘보다 우수한 성능을 보였다.

      • 경로 정보 축약 레이블링 기법을 이용한 효율적인 XML 분기 질의 처리

        서세훈(Sehoon Seo),배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2005 한국정보과학회 학술발표논문집 Vol.32 No.2

        지금까지 제안된 XML 문서상의 분기 질의(twig query) 처리 기법들의 중요한 흐름 중 하나는 지역 인코딩 기법을 이용하는 것이다. 하지만 이 기법에 기반한 분기 질의 처리는 분기 질의상의 단말 노드와 분기 노드의 엘리먼트를 반드시 읽어야 하는 단점이 있다. 그러나 지역 인코딩 기법과는 달리 경로 정보를 축약하는 방식의 레이블링 기법(예: 듀이 인코딩)은 지역인코딩에 의한 레이블에 비해 더 많은 정보를 담고 있어서,이 기법과 구조 인덱스를 이용하여XML 문서를 인덱싱하면 질의상의 단말 태그의 엘리먼트만을 읽어도 분기 질의를 처리할 수 있다.이를 이용하여,본 논문에서는 경로 정보 축약 레이블링 기법과 구조 인덱스를 이용한 분기 질의 처리 기법을 제안한다. 제안된 알고리즘은 디스크 입출력을 줄일 수 있으며 불필요한 중간 결과도 생성하지 않는다.

      • 시간지원 집단 함수 처리를 위한 시점 시퀀스

        권준호(Joonho Kwon),배진욱(Jinuk Bae),송병호(Byoungho Song),이석호(Sukho Lee) 한국정보과학회 2000 한국정보과학회 학술발표논문집 Vol.27 No.2Ⅰ

        시간에 따라 변화하는 자료들을 저장하는 시간지원 데이타베이스에서 집단 함수는 시간지원 그룹화를 통하여 집단 함수 값이 변하지 않는 시간 구간을 구하고 그 각각의 구간마다 집단 함수의 결과를 생성하여 하는 복잡한 연산이다. 기존의 시간지원 집단 함수 처리 기법들은 집단 함수를 포함하는 질의가 요구되었을 때, 불변 구간을 구하기 위해 트리와 같은 자료구조를 생성하고 이 트리의 노드들을 순회함으로서 집단 함수의 결과를 생성하였다. 이 논문에서는 미리 데이타베이스를 한 번 스캔하여 투플의 시작 시간과 종료 시간들의 정렬된 집합인 시점 시퀀스를 생성하고, 이를 이용하여 시간지원 집단 함수를 처리하는 방법을 제안한다. 또한 데이타베이스에서 저장된 데이타의 삭제나 새로운 데이타의 삽입에 따른 시점 시퀀스의 갱신 방법도 제시한다.

      • XML 데이타를 위한 EP2 레이블링 스킴

        진주용(Juyong Jin),배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2004 한국정보과학회 학술발표논문집 Vol.31 No.2Ⅱ

        범위 기반 레이블링 스킴(range-based labeling scheme)을 이용하면 임의의 두 노드에 대한 조상-자손 관계를 판별할 수 있으므로, XPath나 XQuery 형태의 질의를 효율적으로 처리할 수 있다. 그러나 노드의 삽입이 일어나는 동적인 상황에서는 불가피하게 전체 또는 일부의 레이블을 다시 할당(re-labeling)할 가능성이 있다는 문제점이 있다. 본 논문에서는 Dietz 레이블링 스킴을 개선한 EP2(extended preorder & postordor) 레이블링 스킴을 제안한다. 제안하는 스킴은 동일한 저장 공간상에서 범위 기반 레이블링 스킴에 비해 동적인 갱신에 유리하며, 기조의 구조 조인 알고리즘(structural join algorithm)을 이용하여 효율적으로 구조 질의(structural query)를 처리할 수 있다.

      • KCI등재

        범위 모자이크 질의의 효율적인 수행

        홍석진(Seokjin Hong),배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2005 정보과학회논문지 : 데이타베이스 Vol.32 No.5

        질의 영역에 대한 단일 값의 통계 정보를 반환하는 범위 집계 질의와는 달리, 범위 모자이크 질의는 질의 영역 내의 데이타 분포를 모자이크 형태로 반환한다. 즉, 범위 모자이크 질의는 질의 영역을 다차원 격자로 나눈 후, 나뉜 각 영역에 대해 집계값을 구해서 결과로 반환하는 질의이다. 이 논문에서는 범위 모자이크 질의와, 범위 모자이크 질의를 SQL문으로 표현하기 위한 mosaic-by 연산자를 제안한다. 그리고 이 논문에서는 집계 R-트리를 이용한 범위 모자이크 질의의 효율적인 수행 알고리즘을 소개한다. 알고리즘은 모든 모자이크 셀의 집계값을 한 번의 트리 순회만으로 계산하며, 집계 R-트리의 집계값을 이용하여 질의 영역 내의 모든 노드를 접근하지 않고도 작은 수의 노드 접근만으로 질의를 수행할 수 있다. 실험 결과를 통해 제안된 알고리즘이 생성된 데이타와 실제 데이타 모두에 대해 좋은 성능을 보이는 것을 알 수 있다. A range mosaic query returns distribution of data within the query region as a pattern of mosaic, whereas a range aggregate query returns a single aggregate value of data within the query region. The range mosaic query divides a query region by a multi-dimensional grid, and calculates aggregate values of grid cells. In this paper, we propose a new type of query, range mosaic query and a new operator, mosaic-by, with which the range mosaic queries can be represented. In addition, we suggest efficient algorithms for processing range mosaic queries using an aggregate R-tree. The algorithm that we present computes aggregate results of every mosaic grid cell by one time traversal of the aggregate R-tree, and efficiently executes the queries with only a small number of node accesses by using the aggregate values of the aggregate R-tree. Our experimental study shows that the range mosaic query algorithm is reliable in terms of performance for several synthetic datasets and a real-world dataset.

      • 이동객체 데이타베이스에서 TP 최근접 쌍 질의의 처리

        권영철(Yongzhe Quan),배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2003 한국정보과학회 학술발표논문집 Vol.30 No.2Ⅱ

        최근 들어 위치정보 시스템(GIS)의 발전으로 움직이는 물체의 위치는 쉽게 알 수 있게 되어서 이를 기반으로 미래의 최근접 쌍을 찾는 질의가 중요하게 되었다. 하지만 이동객체는 계속해서 움직이므로 현재의 질의 결과는 시간이 흐름에 따라 유효하지 않게 된다. 본 논문에서는 사용자에게 현재의 가장 인접한 쌍과 이 인접한 쌍이 유효한 시간, 그리고 그 유효한 시간 후에 바뀐 결과를 알려주는 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다.

      • 주문형 오디오 시스템을 위한 웹 캐시 구조의 설계 및 평가

        이태원(Taewon Lee),심마로(Maro Shim),배진욱(Jinuk Bae),이석호(Sukho Lee) 한국정보과학회 2000 정보과학회논문지 : 데이타베이스 Vol.27 No.2

        인터넷을 통해 멀티미디어 데이타를 서비스하는 주문형 오디오 서비스(AOD, Audio On Demand)와 같은 시스템에서는 기존의 운영체제가 반복적으로 요청되는 데이타를 효과적으로 처리하지 못하고 있다. 본 논문에서는 웹 캐시(Web Cache) 구조를 제안한다. 이것은 과거 요청들과의 시간 간격 정보를 기초로 가까운 미래에 다시 요청될 곡들을 효과적으로 예측하고 웹 캐시에 유지하므로서 효율적인 서비스를 제공하도록 한다. 웹 캐시의 교체 전략으로는 LFRR(Least Frequently Requested Recently)을 제안한다. LFRR은 가까운 미래에 다시 요청될 확률이 적은 곡을 교체한다. 어느 한 곡이 다시 요청될 확률은 과거 요청들과의 시간 간격의 평균값이 작을수록 높게 된다. 제안된 웹 캐시의 이점은 디스크 액세스 횟수를 현저하게 줄일 수 있고 한정된 자원으로 더 많은 수의 동시 사용자를 지원할 수 있다는 것이다. 실제로 운영되고 있는 AOD 사이트의 요청 자료를 이용하여 제안된 웹 캐시를 시뮬레이션한 결과 높은 성능 향상을 얻을 수 있음을 보였다 In the on-demand services like AOD(Audio On Demand) over the internet, existing operating systems cannot serve repeatedly requested data efficiently. This paper proposes a web cache architecture. It predicts the songs to be requested in near future, based on the intervals between the requests in the past on the same song and keeps the songs in the web cache. For the replacement strategy of the web cache, LFRR(Least Frequently Requested Recently) is proposed. LFRR replaces the song that has less probability to be requested in near future. The average of the intervals between the requests in the past and the new request is used as the probability of the requests. It is more likely to be requested in near future as the average is less. The web cache decreases the number of disk access extremely, and support to serve more users with restricted resources. From the simulation result based on the data at the AOD site currently operating, it is shown that the high performance enhancement is achieved.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼