http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
최현진 ( Hyunjean Choi ),이기용 ( Ki Yong Lee ) 한국정보처리학회 2013 한국정보처리학회 학술대회논문집 Vol.20 No.2
최근 들어 맵리듀스는 빅데이터 처리의 표준 기술로 자리잡고 있다. 빅데이터 분석에 널리 쓰이는 질의 중 하나는 집계(aggregate) 질의이다. 본 논문에서는 서로 다른 집계 질의가 계속적으로 요청되는 환경에서, 맵리듀스를 사용하여 이들 질의를 효율적으로 처리하는 방법을 제안한다. 제안방법은 여러 집계 질의를 하나의 효율적인 맵리듀스 잡(job)으로 묶어 일괄 처리함으로써, 단순 방법에 비해 시간당 처리되는 질의 수를 크게 증가시킨다. 성능 평가를 통해, 제안 방법은 단순 방법에 비해 처리 성능을 크게 향상시킴을 확인하였다.
데이터 스트림과 산발적으로 변하는 디스크 기반 릴레이션 간의 연속 조인 질의 처리 기법
이기용(Ki Yong Lee),최현진(Hyunjean Choi),이서연(Seoyeon Lee) 한국정보과학회 2012 정보과학회논문지 : 데이타베이스 Vol.39 No.6
빠른 속도로 유입되는 데이터를 데이터 웨어하우스에 실시간으로 반영하고자 하는 능동 혹은 실시간 데이터 웨어하우스에 대한 연구가 최근 활발히 진행되고 있다. 능동 데이터 웨어하우스의 실현에 중요한 요소 중 하나는 빠른 속도로 유입되는 데이터 스트림 S와 데이터 웨어하우스에 저장된 디스크 기반의 대규모 릴레이션 R 간의 연속 조인 질의 S ? R를 효율적으로 처리하는 것이다. 최근 이러한 형태의 질의를 효율적으로 처리하기 위해 메쉬 조인이라는 방법이 제안되었다. 이 방법은 S에 새로운 튜플들이 도착했을 때, 이들과 조인되는 튜플들을 찾기 위해 R에 접근하는 비용을 크게 줄임으로써 효율적으로 S ? R을 처리한다. 하지만 이 방법은 R이 전혀 변하지 않는다고 가정하고 있으며, 질의 처리 중에 R이 변경되면 잘못된 결과를 내보낸다는 문제점이 있다. 본 논문에서는 연속 조인 질의 S ? R의 처리 중 R이 변경되는 경우에도, 그를 반영하여 항상 올바른 조인 질의 결과를 내보내는 방법을 제안한다. 본 논문은 제안방법이 항상 올바른 질의 결과를 내보냄을 증명하며, 실험을 통해 제안하는 방법의 실용성을 보인다. Recently, active or real-time data warehouses have been increasingly investigated, where all updates to data sources are propagated immediately to the warehouse so that users can always access up-to-date information. One of the most important elements in building an active data warehouse is to efficiently process a continuous join query S ? R, where S is a fast data stream and R is a large disk-based relation stored in the warehouse. In order to process such queries efficiently, a new method called mesh join has been proposed recently, which improves performance by reducing the high I/O cost of accessing R as new tuples of S continuously arrives. However, it assumes that R remains fixed while the query is running, so it can produce the wrong results if R changes during query processing. To address this problem, we propose a new method for processing S ? R that always produces the correct results even when R changes during query processing. We also prove the correctness of the proposed method and show the practicability of the proposed method through experiments.