RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목

      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
          • 원문제공처
          • 등재정보
          • 학술지명
          • 주제분류
          • 발행연도
          • 작성언어
          • 저자

        오늘 본 자료

        • 오늘 본 자료가 없습니다.
        더보기
        • 무료
        • 기관 내 무료
        • 유료
        • 대용량 XML 데이터베이스에서 경로정보의 중복을 제거한 효율적인 질의 처리

          이혜자(Hiye-Ja Lee), 정병수(Byeong-Soo Jeong), 이영구(Young-Koo Lee) 한국정보과학회 데이터베이스 소사이어티 2005 데이타베이스 연구 Vol.21 No.3

          본 논문에서는 관계형 데이터베이스를 기반으로 대용량 XML 문서 집합에 대한 효율적인 저장 및 질의 처리 기법으로, 경로 정보의 중복을 제거하면서 역 인덱스를 함께 이용한 방법을 제안한다. 구조적인 특성을 갖는 XML 문서들을 관계형 데이터베이스로 저장하기 위해서는 XML 문서의 내용뿐만 아니라 문서의 구조적 정보가 트리 구조에 기반하는 노드들로 분해되어, 노드 타입에 따라, 루트에서 각 노드까지의 경로 정보가 함께 관계형 테이블에 저장되어야 한다. 경로 정보를 이용한 기존의 XML 문서들의 저장 및 질의 처리 기법들에서는 모든 엘리먼트 노드들에 대해 경로 정보를 저장함에 따라 정보의 양이 증가하여 질의 처리의 성능을 저하시키는 요인이 되고 있다. 제안 방법에서는 경로 정보 중 가장 긴 단말 엘리먼트 노드까지의 경로인 단말 엘리먼트 경로(leaf element path)만을 저장하고 내부 엘리먼트 노드까지의 경로인 내부 엘리먼트 경로들(internal element path)은 단말 엘리먼트 경로 정보를 이용하여 처리함으로써 경로 정보의 양을 줄이고 있다. 또한, 단말 엘리먼트 경로만을 대상으로 하여 역 인덱스를 구성함에 따라, 기존의 역 인덱스 이용 기법에 비해 키워드별 포스팅 리스트(posting lists)의 수를 줄이게 되어 인덱스를 이용한 질의 처리의 성능을 향상시킬 수 있다. 기존 방법들과의 성능을 비교하기 위하여 대표적인 XPath 질의들에 대한 처리 성능을 측정하여 제안한 방법의 효용성을 입증하였다. We propose an improved approach that stores and retrieve a large volume of XML documents in a relational database, while removing the redundancy of path information and using an inverted index for reduced path information. In order to store XML documents which have structural information, in a relational database, an XML document is decomposed into nodes based on its tree structure, and stored in relational tables according to the node type with path information from the root node to each node. The existing XML storage methods which use relational data model, usually store path information for every node type. Thus, they can increase storage overhead and decrease retrieval performance with the increased data volume. Our approach stores only data for leaf node path information in XML tree structure while finding out internal node path information from leaf node path information. In this manner, our approach can reduce data volume for a large amount of XML documents to a degree and also reduce the size of inverted index for the path information with the smaller number of posting lists by key words. We show the effectiveness of this approach through several experiments that compare XPath query performance with the existing methods.

        • PBDM+G:그룹 개념을 이용한 목적 기반 데이터베이스 접근 제어 모델

          임지영(Ji-Young Lim), 김우철(Woo-Cheol Kim), 박상현(Sanghyun Park) 한국정보과학회 데이터베이스 소사이어티 2006 데이타베이스 연구 Vol.22 No.1

          온라인상에서 수집되어 사용되는 개인의 정보는 오용, 남용될 수 있다. 따라서 데이터 제공자가 허용하는 목적으로만 데이터를 사용할 수 있도록 하는 데이터 보안 기법이 필요하다. 기존의 LDHD 데이터베이스 보안 모델은 제공자의 프라이버시를 보호하기 위해 셀 단위로 제공 목적을 표시한다. 하지만 이 방식은 메타 데이터의 크기가 원본 데이터보다 커지며, 사용자-목적 별로 데이터 제공 여부를 조사하므로 새로운 데이터 제공자가 추가될 경우 변경되어야 하는 메타 데이터의 크기가 크다는 단점을 가지고 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 먼저 제공자의 프라이버시를 보호하기 위한 데이터베이스 관리 시스템의 조건을 기술한 후, 이를 만족시키는 새로운 데이터베이스 보안 모델을 제안한다. 본 논문에서 제안하는 PBDM+G 모델은 중복된 데이터를 그룹으로 묶어 저장함으로써 메타 데이터의 크기를 크게 줄이며, 목적 단위로 데이터 제공 여부를 입력하게 함으로써 새로운 사용자가 추가되어도 데이터 제공 여부를 다시 입력해야 하는 번거로움을 줄이도록 한다. 실험을 통하여 PBDM+G 모델은 LDHD에 비해 약 2.6%에서 10%의 메타 데이터만을 사용하면서도 질의 처리 시간을 최대 23.6%까지 줄이는 것을 확인할 수 있었다. The personal information that is collected and used in on-line can be misused and abused. Therefore, data security techniques that restrict the usage of data only to the purpose of data provider are needed. The LDHD model, a well-known database security model, represents the purpose of data provision in the unit of "cell" in order to protect the privacy of data provider in detail. However, since the meta data is collected for every pair of users and purposes in this model, the size of the meta data is much larger than the original one and the introduction of a new user into the system causes the meta data to be changed significantly. To solve this problem, this paper first identifies the requirements of the database management systems supporting the privacy preservation and then suggests an effective and flexible database security model called PBDM+G. The PBDM+G model collects the meta data for every purpose rather than for every pair of users and purposes, and uses the concept of "grouping" to remove the duplicated meta data and thus reduce the size of meta data. The experimental result reveals that the PBDM+G model consumes at most 10% of the space need for the LDHD model while reducing the query processing time up to 23.6%.

        • 바이오 데이터 통합과 데이터 웨어하우스 구축

          안명상(Myoung-Sang Ahn), 오정수(Jung-Su Oh), 임정곤(Jung-Gon Lim), 노동현(Dong-Hyun Rho), 조완섭(Wan-Sup Cho) 한국정보과학회 데이터베이스 소사이어티 2004 데이타베이스 연구 Vol.20 No.3

          생물학에서 다루는 데이터의 유형은 DNA나 RNA와 같은 서열 데이터 대사경로나 조절경로와 같은 그래프 데이터, 마이크로-어레이 실험의 결과인 배열 데이터, 관련 문헌 등 매우 다양하다. 지금까지 새로운 유형의 데이터가 필요할 때마다 별도의 데이터베이스가 구축된 경우가 많고 동일한 유형의 데이터에 대해서도 서로 다른 주체에 의해 복수 개의 데이터베이스가 구 축, 운영되고 있다. 일부는 관계형 DBMS로 구축된 것도 있고, 일부는 파일로 구축된 것도 있다. 더욱이 서로 독립적으로 구축되었기 때문에 구조적으로 상이함은 물론, 데이터 모델도 다르다. 하지만, 유전체 연구를 위해서는 여러 데이터베이스에 저장된 정보를 종합적으로 활용해야 한다. 따라서 구조와 내용면에서 매우 이질적인(heterogeneous) 바이오 데이타베이스를 통합하기 위한 연구가 최근 활발히 이루어지고 있다. 이 논문은 많은 이질적인 데이터베이스를 통합하기 위한 데이터 웨어하우징 기법을 소개하고, 보다 효율적인 통합을 위한 매커니즘으로 시스템 생물학의 표준인 SBML의 이용방법과 다양한 데이터베이스에 저장된 용어들의 의미적 통합을 위한 온툴로지 시스템에 대하여 기술한다. In bioscience, there are many different data types such as sequential data (DNA, RNA protein sequences, etc.), graph data (metabolic pathways, regulatory networks, etc.), and array data (results of micro-array experiment, etc.). Various bio-data types are increasing all over the world and each bio-database has different abstraction levels, times, scales, and database schemas. For the accumulated bio-databases, a development of sophisticated analysis system is an important research issue. To do this, these databases must be integrated into a data warehouse and then OLAP or data mining technology can be applied. In database community, data integration has been studied for many years in the context of data warehousing. In this paper, we propose data warehouse technologies for integrating heterogeneous bio-data from various remote bio-databases. For efficiency and accuracy, we use SBML (Systems Biology Markup Language), which is standard for system biology documentation, and bio-ontology in the integration of the bio-databases.

        • RAH-tree: 편향 접근 패턴을 갖는 공간 데이터에 대한 새로운 색인 구조

          최근하(Keunha Choi), 이승중(Seung Joong Lee), 정성원(Sungwon Jung) 한국정보과학회 데이터베이스 소사이어티 2006 데이타베이스 연구 Vol.22 No.1

          GPS및 PDA의 발달로 인해서 위치 기반 서비스(LBS), 차량항법장치(CNS), 지리정보시스템(GIS)등 공간데이터를 다루는 응용프로그램들이 급속하게 보급되었다. 이러한 응용프로그램들은 높이 균등 색인 기법을 통해 사용자가 원하는 데이터에 대한 색인을 제공하였다. 그러나 모든 공간 객체는 서로 상이한 접근 빈도를 가지고 있음에도 불구하고 기존의 공간색인 기법은 이를 고려하지 못하는 단점을 가지고 있었다. 또한 빈도수만을 고려한 공간 객체의 색인 방법은 접근 빈도에 따른 편향성(skewed)은 제공하지만 공간 객체에 대한 지역성을 반영하지 못한다. 이는 공간 객체가 2개 이상의 차원에 대한 정보를 요구하고 하나의 차원에 대해서만 정렬을 할 수 없기 때문이다. 본 논문에서는 밀집되어 있는 공간 객체의 접근 빈도를 반영해서 편향된 색인 트리를 생성하는 기법을 제안한다. 이형 클러스터링으로 분포되어 있는 전체 영역에 대해서 Zahn의 클러스터링 알고리즘을 변형시켜서 다단계 세부 영역을 구분한다. 이렇게 구분된 세부 영역에 대해서 거리적 인접성과 접근 빈도수의 합을 이용해서 색인 트리를 생성한다. 또한 다단계로 구성된 전체 영역에 대해서 하향식 방식으로 편향된 색인 트리를 생성함으로써, 접근 빈도가 높은 공간 객체에 대해서 빠른 탐색이 가능하게 한다. Because of the advancement of GPS and PDA, applications using spatial data like Location Based Service(LBS), Car Navigation System(CNS) and Geographic Information System(GIS) has been widely used. Most of these applications provide indexes for data using height-balanced indexing techniques. However, those techniques doesn't consider the access frequency of each spatial object. Though some indexing techniques which consider frequency can provide the skewedness effected by the frequency, it's not suitable when spatial objects are massed. Because, to work efficiently, they also have to consider the distance between spatial objects when it's more than 2 dimensions. In this paper, we propose a new indexing technique which can make an skewed index tree considering the distance and access frequency. It divides the area into multistaged subareas using a revised version of Zahn's clustering algorithm. It considers the sum of distance and access frequency between the subareas when it builds the index tree. Also the index tree is built with a top-down approach using density as a criterion. As the search starts from the root with the highest density, it enables fast search.

        • 데이터 스트림에 대한 연속 질의를 위한 우선순위 기반의 의미적 부하 제한

          박재석(Jaeseok Park), 조행래(Haengrae Cho) 한국정보과학회 데이터베이스 소사이어티 2005 데이타베이스 연구 Vol.21 No.1

          데이터 스트림 관리 시스템(Data Stream Management System: DSMS)은 대량의 데이터 스트림과 다수의 연속 질의를 처리하는 시스템이다. 시스템에 입력되는 데이터 스트림의 양이 시스템의 처리 능력을 초과할 경우, DSMS는 입력 데이터의 일부를 무시함으로써 적정 부하를 유지한다. 기존에 연구된 데이터 스트림에 대한 질의 알고리즘들의 공통적인 목표는 모든 질의 결과들 사이의 평균 오차를 줄이는 것이다. 이와는 달리 본 논문에서는 각 질의의 우선순위를 고려하여 중요한 질의일수록 신빙성 있는 결과를 출력하는 부하 제한 알고리즘을 제안한다. 즉, 본 논문에서 제안하는 알고리즘은 질의를 실행하는 각 응용들의 중요도를 반영하여 차별화된 QoS(Quality of Service)를 지원할 수 있다. 본 논문에서는 모의실험을 통해 제안하는 알고리즘의 성능을 평가한다. The data stream management system (DSMS) has to handle high-volume and bursty data streams with large number of continuous queries. When the input rate of any data stream exceeds the system capacity, the DSMS has to shed load by dropping some fraction of the unprocessed data items. This paper proposes a new load shedding algorithm for queries over data streams. Unlike previous algorithms that try to reduce the average deviation of the estimated answers of all queries, the proposed algorithm considers the priority of each query so that more important queries can make more convincing outputs. As a result, the proposed algorithm can support differentiated quality of services by exploiting semantics inherent to applications. We also report the experiment results confirming the benefits of the proposed algorithm.

        • 관계 데이터베이스에 저장된 XML데이터에 대한 효율적인 XPath 질의처리

          박영섭(Young Sup Park), 정연돈(Yon Dohn Chung), 김명호(Myoung Ho Kim) 한국정보과학회 데이터베이스 소사이어티 2005 데이타베이스 연구 Vol.21 No.2

          XML데이터 포맷은 점점 인터넷에서 표준으로 자리잡아 가고 있다. 이에 따라 XML문서들을 저장하고 질의하는 기술들이 필요하다. 이 중에서 XML문서를 관계 데이터베이스에 저장하고 질의하는 방법들이 연구되어 왔으며 전위 정렬 번호, 후위 정렬 번호, 부모 번호를 사용하여 효율적으로 질의할 수 있는 방법이 제안되었었다. 이 논문에서는 부모 번호대신에 s -레벨 번호를 사용하여 더 효율적으로 질의할 수 있는 방법을 제안하고 실험을 통하여 성능을 평가한다. XML is fast emerging as the dominant standard for representing data in the World Wide Web. This is creating a new set of data management requirements involving XML, such as the need to store and query XML documents. Researchers have proposed using relational database systems to accomplish these requirements and translate XML queries into SQL queries. The previous work shows that all the XPath axes can be efficiently queried over XML documents in a relational database system by using preorder, postorder and parent numbering. In this paper, we show that all the XPath axes is more efficiently processed with preorder, postorder and s-level numbering. Finally, we report the results of an experimental study that compare the performance between the previous method and the proposed method.

        • 관계 데이터베이스를 기반으로 하는 XQuery 질의 처리기

          장형화(Hyung Hwa Jang), 홍의경(Eui Kyeong Hong) 한국정보과학회 데이터베이스 소사이어티 2006 데이타베이스 연구 Vol.22 No.3

          XML은 데이터 교환의 표준으로 빠르게 자리를 잡아가고 있다. XML은 응용들 간에 상호 호환성이 가능하도록 정보 교환을 용이하게 한다. XML의 장점을 활용하고, 데이터베이스의 기능과 XML의 특징을 결합하기 위해서는 XML 문서들을 DBMS에 효율적으로 저장하고 관리해야 한다. 이 논문에서는 XML 데이터를 관계 데이터베이스 시스템에 저장하고 XQuery 질의를 통해 검색할 수 있는 프로토타입 시스템을 설계 및 구현한다. 이 시스템은 두 부분으로 구성된다. 첫 번째 부분은 XQuery 질의를 SQL 문장으로 변환하는 XQuery 질의 생성기이고, 두 번째 부분은 SQL 결과 집합으로부터 XML 문서들을 구성하는 XML 데이터 생성기이다. 마지막으로 본 논문에서는 XQuery 질의를 처리하는 시간을 측정하고, XPath 질의 처리 시스템과 성능을 비교하였다. XML is fast becoming an industry standard for data exchange. XML offers an easy information exchange that enables interoperability between applications. To take advantage of XML's features and to blend the power of a database with XML's features, XML documents should be stored efficiently and managed by DBMS. In this paper, we designed and implemented prototype system that can store XML data in relational database system and retrieve it with XQuery query. The system is composed of two parts. The first part of the system is XQuery query generator that translates XQuery to SQL statements and the second part is XML data generator that constructs XML document from SQL result set. Finally, this paper shows measurement time of processing XQuery query and compares storage performance with XPath query processing systems.

        • KCI등재
        • 관계 데이터베이스를 기반으로 하는 XQuery 질의 처리기

          장형화(Hyung Hwa Jang), 홍의경(Eui Kyeong Hong) 한국정보과학회 데이터베이스 소사이어티 2006 데이타베이스 연구 Vol.22 No.2

          XML은 데이터 교환의 표준으로 빠르게 자리를 잡아가고 있다. XML은 응용들 간에 상호 호환성이 가능하도록 정보 교환을 용이하게 한다. XML의 장점을 활용하고, 데이터베이스의 기능과 X M L의 특징을 결합하기 위해서는 XML 문서들을 D B M S에 효율적으로 저장하고 관리해야 한다. 이 논문에서는 X M L 데이터를 관계 데이터베이스 시스템에 저장하고 XQuery 질의를 통해 검색할 수 있는 프로토타입 시스템을 설계 및 구현한다. 이 시스템은 두 부분으로 구성된다. 첫 번째 부분은 XQuery 질의를 SQL 문장으로 변환하는 XQuery 질의 생성기이고, 두 번째 부분은 SQL 결과 집합으로부터 XML 문서들을 구성하는 XML 데이터 생성기이다. 마지막으로 본 논문에서는 XQuery 질의를 처리하는 시간을 측정하고, XPath 질의 처리 시스템과 성능을 비교하였다. XML is fast becoming an industry standard for data exchange. XML offers an easy information exchange that enables interoperability between applications. To take advantage of XML's features and to blend the power of a database with XML's features, XML documents should be stored efficiently and managed by DBMS. In this paper, we designed and implemented prototype system that can store XML data in relational database system and retrieve it with XQuery query. The system is composed of two parts. The first part of the system is XQuery query generator that translates XQuery to SQL statements and the second part is XML data generator that constructs XML document from SQL result set. Finally, this paper shows measurement time of processing XQuery query and compares storage performance with XPath query processing systems.

        • 점진적 모델 갱신 기법을 이용한 스트림 데이터 예측

          김성현(Sung Hyun Kim), 이용미(Yongmi Lee), 김룡(Long Jin), 서성보(Sungbo Seo), 류근호(Keun Ho Ryu) 한국정보과학회 데이터베이스 소사이어티 2006 데이타베이스 연구 Vol.22 No.2

          최근 센서 네트워크의 발달로 실세계의 많은 데이터가 시간 속성을 갖고 실시간으로 수집되고 있다. 기존의 시계열 데이터 예측 기법은 긴 주기를 갖는 과거 데이터를 통해 미래를 예측하거나 모델 갱신 없이예측을 수행하였다. 그러나 스트림 데이터는 매우 빠르게 수집이 되고 시간이 지남에 따라 데이터의 특성이 변경될 수 있으므로 기존의 시계열 예측 기법을 적용하는 것은 적절하지 않다. 따라서 이 논문에서는 슬라이딩 윈도우와 점진적인 회귀분석을 이용한 스트림 데이터 예측 기법을 제안한다. 이 기법은 스트림데이터를 다중 회귀 모델에 입력하기 위해 차원 분열을 통해 여러 개의 속성으로 분열( F r a c t a l )하고, 변화되는 데이터의 분포를 반영하기 위해 슬라이딩 윈도우 기법을 사용하여 점진적으로 회귀 모델을 갱신한다. 이전 데이터의 유지 없이 최소 정보를 갖는 행렬을 통해 모델을 갱신하므로 낮은 공간 복잡도를 갖는다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 1시점 예측 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 DES(Double Exponential Smoothing), SVR(Support Vector Regression), MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression) 기법에 비해 R M E가 평균 5.6%, RMSE가 평균 0.067 정도 우수하였다. Advance in wireless sensor network made it possible to collect massive amounts of sensor-based data with temporal attribute at real-time. Existing prediction methods for time-series data have tried to predict the future using the past data or without updating a model. However, the methods are not suitable for stream data, because the data is characterized by high data rate and changes in data distribution over time. In this paper, we propose IMQR(Incremental Multiple Quadratic Regression), a novel prediction method using incremental model updating. To apply stream data to a multiple regression model, we fractionalize stream data in several attributes using fractal. The model is then updated using sliding window to reflect changes in data distribution incrementally. This method that updates the model through a matrix having minimal information without maintaining the past data guarantees low space complexity. We evaluated error rate in IMQR using RME(Relative Mean Error) and RMSE(Root Mean Square Error). As a result, compared with other methods such as DES(Double Exponential Smoothing), SVR(Support Vector Regression), MLR(Multiple Linear Regression), and MQR(Multiple Quadratic Regression), RME and RMSE in IMQR decreased by 5.6% and 0.067% in average, respectively.

        맨 위로 스크롤 이동