RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      • 좁혀본 항목

      • 좁혀본 항목 보기순서

        • 원문유무
        • 음성지원유무
          • 원문제공처
          • 등재정보
          • 학술지명
          • 주제분류
          • 발행연도
          • 작성언어
          • 저자

        오늘 본 자료

        • 오늘 본 자료가 없습니다.
        더보기
        • 무료
        • 기관 내 무료
        • 유료
        • KCI등재

          Prefix-트리를 이용한 동적 가중치 빈발 패턴 탐색 기법

          정병수,Jeong, Byeong-Soo,Farhan, Ahmed 한국정보처리학회 2010 정보처리학회논문지D Vol.17 No.4

          지금까지의 빈발 패턴(Frequent Pattern) 마이닝에서는 각 항목들의 중요도(Weight)는 모든 같은 값으로 다루어 왔으나 실 환경에서는 각 항목들의 중요도가 다르게 적용되는 경우가 많이 있고 또 같은 항목이라도 시간에 따라 다른 중요도 값으로 다루어져야 할 경우가 있다. 비즈니스 데이터 분석 환경이나 웹 클릭 데이터 분석 환경과 같은 응용에서도 동적으로 변하는 중요도를 고려하여야 한다. 지금까지 항목의 중요도를 고려하는 여러 패턴 마이닝 기법들이 제안되고 있으나 동적으로 변하는 항목의 중요도를 고려하는 연구는 발표되지 않고 있다. 본 논문에서는 처음으로 동적인 항목들의 중요도(혹은 가중치)를 고려하는 빈발 패턴 마이닝 알고리즘을 제안한다. 제안하는 기법은 단 한번의 데이터베이스 스캔으로 처리되므로 스트림 데이터를 분석할 수 있다. 여러 실험을 통하여 제안하는 기법은 매우 효과적이며 확장성이 좋은 것임을 보인다. Traditional frequent pattern mining considers equal profit/weight value of every item. Weighted Frequent Pattern (WFP) mining becomes an important research issue in data mining and knowledge discovery by considering different weights for different items. Existing algorithms in this area are based on fixed weight. But in our real world scenarios the price/weight/importance of a pattern may vary frequently due to some unavoidable situations. Tracking these dynamic changes is very necessary in different application area such as retail market basket data analysis and web click stream management. In this paper, we propose a novel concept of dynamic weight and an algorithm DWFPM (dynamic weighted frequent pattern mining). Our algorithm can handle the situation where price/weight of a pattern may vary dynamically. It scans the database exactly once and also eligible for real time data processing. To our knowledge, this is the first research work to mine weighted frequent patterns using dynamic weights. Extensive performance analyses show that our algorithm is very efficient and scalable for WFP mining using dynamic weights.

        • 병렬 데이타베이스 시스템에서의 색인 파일 분할

          정병수(Byeong-Soo Jeong) 한국정보과학회 1996 정보과학회논문지(B) Vol.23 No.12

          다중 디스크를 사용하는 병렬 데이타베이스 시스템하에서는 디스크 입/출력을 병렬적으로 처리하기 위하여 테이블(릴레이션)들이 여러 부분으로 분할되어 저장되어지며, 데이타베이스 질의어를 처리하는 과정에서 색인 파일은 데이타 검색의 속도를 향상시키기 위하여 필수적으로 사용되어진다. 따라서, 병렬 데이타베이스 시스템에서는 분할된 테이블에 대한 색인 파일의 설계가 데이타베이스 시스템의 성능에 큰 영향을 미치게 된다. 분할된 테이블에 대한 색인 파일의 설계 방안으로는, 지역 색인(Local Index)과 분할된 전역 색인(Partitioned Global Index)으로 크게 두가지를 생각할 수 있으며, 서로 다른 색인 파일들은 색인 파일이 자주 이용되어지는 환경에서 병렬 데이타베이스 질의어들의 처리속도에 서로 다른 성능적 특징을 나타낸다. 본 논문에서는 다중 디스크를 사용하는 병렬 데이타베이스 시스템하에서 색인 파일을 분할 하는 여러 방법론을 제시하고, 이러한 색인 파일을 이용한 질의어 처리 방법과 아울러, 여러 부하 (Workloads) 환경에서 시스템 성능에 미치는 영향에 대하여 시뮬레이션 방법을 통하여 연구한다. In a parallel database system, a table is often partitioned into multiple fragments and stored on different nodes in order to exploit I/O parallelism. Since using an index is typical for processing a database query, the problem of how to design the index for such partitioned tables can be a crucial performance factor in a parallel database. In terms of the index for partitioned tables, we can think of two alternatives, i.e., local index and partitioned global index. These alternative indexing schemes might display different performance characteristics for parallel query processing when the index is frequently used. In this paper, we examine the problem of how to partition an index file in a shared-nothing parallel database system. We present query processing strategies under alternative index file partitioning schemes. We also study the performance impact of alternative index file partitioning schemes by using simulation under different workloads.

        • KCI등재

          정보 보호 기능을 갖는 최대 빈발 패턴 탐색 기법

          정병수(Byeong-Soo Jeong),최호진(Ho-Jin Choi) 한국정보과학회 2013 정보과학회논문지 : 데이타베이스 Vol.40 No.1

          데이터의 사용이 증가함에 따라 사적인 정보에 대한 보호의 필요성이 대두되었고, 비즈니스를 위한 데이터 마이닝 분야에서도 비즈니스에 사용되는 데이터의 노출이 기업 이익과 결부되면서 데이터 보호의 기능이 더욱 중요하게 다루어지고 있다. 또한 기업의 구매 데이터와 같은 트랜잭션 데이터베이스에서 빈번히 발생하는 패턴에 대한 탐색은 고객들의 구매 패턴을 예측하는 일뿐만 아니라 여러 데이터 마이닝기술에서 기본적으로 사용하게 되는 기법으로 그 동안 많은 연구가 이루어져 왔다. 그러나 정보 보호 기능을 함께 제공할 수 있는 탐색 기법에 대한 연구는 아직 미진한 상황이다. 본 논문에서는 정보 보호 기능을 갖는 효과적인 최대 빈발 패턴 탐색 기법을 제안한다. 제안하는 기법은 소수(prime number)에 기반한 암호화를 통하여 정보의 노출을 막고 격자(lattice) 구조를 이용하여 최대 빈발 패턴을 탐색한다. 많은 실험을 통하여 제안하는 기법이 수행 속도뿐만 아니라 메모리 공간의 사용에서도 효과적임을 보인다. As increased use of data mining technology becomes popular, data mining technique, which has information protection capability, is required in several areas. Business data owners do not want to release business specific information to another party since it may generate economic loss to business data owner when third-party companies can analyze their data for the purpose of mining interesting patterns or finding business information. Many works have been done to efficiently discover maximal frequent patterns from a large database. However, most of existing works do not consider information protection during mining process. In this paper, we propose an efficient approach for mining maximal frequent patterns from a large transactional database with the capability of information protection. Our approach uses prime number based encryption method for information protection and utilizes lattice structures to find maximal frequent patterns in time and memory efficient manner. Extensive experimental results show that our approach can find accurate results within an acceptable time with information protection capability.

        • KCI등재
        • KCI등재

          Prefix-Tree를 이용한 높은 유틸리티 패턴 마이닝 기법

          정병수(Byeong-Soo Jeong),아메드 파한(Chowdhury Farhan Ahmed),이인기(In-Gi Lee),용환승(Hwan-Seong Yong) 한국정보과학회 2009 정보과학회논문지 : 데이타베이스 Vol.36 No.5

          유틸리티 패턴 마이닝은 데이터 항목에 대한 다른 가중치를 고려할 수 있는 장점으로 인하여 비즈니스 데이터를 분석하는 환경에서 효율적으로 이용되고 있다. 그러나 기존의 빈발 패턴(Frequent Pattern) 마이닝에서의 Apriori 규칙을 그대로 적용하기 어려운 문제점으로 인하여 패턴 마이닝의 성능이 현저하게 떨어지고 있다. 본 연구는 Prefix-tree를 이용하여 지속적으로 증가하는 비즈니스 트랜잭션 데이터베이스에 대한 유틸리티 패턴 마이닝을 효과적으로 수행하기 위한 기법을 제안한다. 제안하는 기법은 Prefix-tree의 각 항목 노드에 유틸리티 값을 저장하여 FP-Growth 알고리즘에서와 같이 트리의 상향 탐색을 통하여 높은 유틸리티 패턴을 빠르게 찾아낸다. 여러 형태의 실험을 통하여 이용할 수 있는 세가지 다른 Prefix-tree 구조들 간의 성능적 특징과 패턴 탐색의 방법들을 비교하였으며 실험 결과에 따라 제안하는 기법이 기존의 기법들에 비해 많은 성능 향상을 가져올 수 있는 것을 입증하였다 Recently high utility pattern (HUP) mining is one of the most important research issues in data mining since it can consider the different weight values of items. However, existing mining algorithms suffer from the performance degradation because it cannot easily apply Apriori-principle for pattern mining. In this paper, we introduce new high utility pattern mining approach by using a prefix-tree as in FP-Growth algorithm. Our approach stores the weight value of each item into a node and utilizes them for pruning unnecessary patterns. We compare the performance characteristics of three different prefix-tree structures. By thorough experimentation, we also prove that our approach can give performance improvement to a degree.

        • KCI등재후보

          대용량 XML 문서의 효율적인 질의 처리를 위한 세그먼트 기반 역 인덱스

          정병수(Byeong-Soo Jeong),이혜자(Hiye-Ja Lee) 한국IT서비스학회 2008 한국IT서비스학회지 Vol.7 No.3

          '스콜라' 이용 시 소속기관이 구독 중이 아닌 경우, 오후 4시부터 익일 오전 7시까지 원문보기가 가능합니다.

            The existing XML storage methods which use relational data model, usually store path information for every node type including literal contents in order to keep the structural information of XML documents. Such path information is usually maintained by an inverted index to efficiently process XPath queries for large XML documents. In this study, We propose an improved approach that retrieve information from the large volume of XML documents stored in a relational database, while using a segment-based inverted index for path searches. Our new approach can reduce the number of searching an inverted index for getting target path information. We show the effectiveness of this approach through several experiments that compare XPath query performance with the existing methods.

        • KCI등재

          경로정보의 중복을 제거한 XML 문서의 저장 및 질의처리 기법

          이혜자,정병수,김대호,이영구,Lee Hiye-Ja,Jeong Byeong-Soo,Kim Dae-Ho,Lee Young-Koo 한국정보처리학회 2005 정보처리학회논문지D Vol.12 No.5

          본 논문에서는 대용량 XML 문서를 저장하고 그로부터 원하는 정보를 효율적으로 찾기 위한 방법으로, 경로정보의 중복을 제거하면서 역 인덱스를 함께 이용한 방법을 제안한다. XML 문서는 트리구조에 기반한 노드로 분해되어, 노드 타입에 따라, 루트에서 각 노드까지의 경로정보와 함께 관계형 테이블에 저장된다. 경로정보를 이용한 기존의 U 질의 기법들에서는 모든 엘리먼트 노드들에 대해 경로정보를 저장함에 따라 정보의 양이 증가하여 질의 처리의 성능을 저하시키는 요인이 되고 있다. 제안 방법에서는 경로정보 중 가장 긴 단말 엘리먼트 노드까지의 경로인 단말 엘리먼트 경로(leaf element path)만 저장하고 내부 엘리먼트 노드까지의 경로인 내부 엘리먼트 경로들(internal element paths)은 저장하지 않는다. 단말 엘리먼트 경로만을 대상으로 하여 역 인덱스를 구성함에 따라, 기존의 역 인덱스 이용 기법에 비해 키워드별 포스팅 리스트(posting lists)의 수를 줄이게 된다. 제안 방법에서는 U 문서의 저장과 질의를 위하여 XML 문서에 대한 스키마 정보가 없어도 되며, 관계형 데이터베이스의 어떤 확장도 요구하지 않는다. 실험을 통해 제안 방법은 실험 범위 내에서 기존 기법들에 비해 좋은 성능을 보인다. This Paper Proposes an approach that removes the redundancy of Path information and uses an inverted index, as an efficient way to store a large volume of XML documents and to retrieve wanted information from there. An XML document is decomposed into nodes based on its tree structure, and stored in relational tables according to the node type, with path information from the root to each node. The existing methods using path information store data for all element paths, which cause retrieval performance to be decreased with increased data volume. Our approach stores only data for leaf element path excluding internal element paths. As the inverted index is made by the leaf element path only, the number of posting lists by key words become smaller than those of the existing methods. For the storage and retrieval of U data, our approach doesn't require the XML schema information of XML documents and any extension of relational database. We demonstrate the better performance of on approach than the existing approaches within the scope of our experiment.

        • KCI등재

          XML 템플릿 기반 지식베이스 관리 기법과 그 응용

          이혜자,정병수,박승훈,Lee Hiye-Ja,Jeong Byeong-Soo,Park Seung-Hun 한국정보처리학회 2004 정보처리학회논문지D Vol.11 No.7

          For using the knowledge of experts diversely and efficiently, it is very important that the system could represent the complex knowledge in well structured manner and also adapt well to the frequent schema changes. In this paper, we propose an efficient method for knowledge base management by using XML based templates. In our proposed method, to solve the inefficiency of management of many XML documents, we represent the complex knowledge on XML-based templates, and manage the templates structurally by using a meta-template that defines relationship among the templates. In order to show the effectiveness of our method, we developed a knowledge base to formulate an exercise prescription for a subject and an application program to classify the subject's fitness. The experimental study shows that XML-based templates provide a flexible, extensible and structured way of representing expert knowledge. The inference using XML-based templates can be controlled systematically and efficiently by using meta-template. 전문가의 지식을 다양하고 효율적으로 활용하기 위해서는 복잡한 지식을 구조적으로 표현하고 변화에 유연하게 적응하도록 관리하는 것이 무엇보다도 중요하다. 본 논문에서는 XML 템플릿(template)을 기반으로 한 지식베이스 관리 방법을 제안한다. 제안하는 방법에서는 복잡하고 다양한 정보를 구조적으로 표현하는데 효과적인 XML을 이용하면서, XML 문서의 종류와 개수가 많아지면서 발생하는 문서관리상의 비효율성 문제를 해결하기 위하여, 복잡한 지식을 XML로 표현된 다수의 탬플릿으로 분류하여 작성하고, XML 템플릿들 사이의 연관관계 등을 정의한 메타템플릿을 이용하여 구조적으로 관리한다. 제안한 방법의 효용성을 입증하기 위해 개인의 건강과 체력에 적합한 운동을 처방하는 데 필요한 지식베이스와 운동처방 프로세스 중 대상자의 체력유형을 분류하는 프로그램을 개발하고 그 결과를 분석하였다. 실험을 통해 본 논문에서 제안하는 XML 템플릿 기반 지식베이스 관리 방법은 복잡한 전문지식을 구조적으로 표현하고, 새로운 유형의 정보가 필요하거나 기존 정보의 변경이 필요할 경우 유연하게 대처할 수 있으며, 메타템플릿을 이용하여 XML 템플릿들을 구조적으로 관리함으로써 효율적으로 추론할 수 있음이 확인되었다.

        맨 위로 스크롤 이동