http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
데이터 집약 과학 워크플로우 응용의 특성을 고려한 데이터 배치 기법
안주림,김윤희 한국통신학회 2018 KNOM Review Vol.21 No.2
For data-intensive scientific workflow application experiments that leverage the cloud computing environment, large amounts of data can be distributed across multiple data centers in the cloud. The generated intermediate data can also be transmitted through access between different data centers. When the application is executed, the execution result is changed according to the location of the data since the intermediate data generated is used. However, existing data placement strategies do not consider the characteristics of scientific applications. In this paper, we define a data-intensive tasks and propose runtime data placement in that interval. Through the proposed data placement scheme, we analyze the scenarios considering the number of times in the data intensive tasks defined in this study and derive the results. In addition, performance was compared by analyzing runtime data placement times and runtime data placement overhead. 라우드 컴퓨팅 환경을 활용한 데이터 집약적인 과학 워크플로우 응용 실험의 경우 클라우드의 여러 데이터 센터에 대량의 데이터가 분산될 수 있고, 생성되는 중간 데이터는 서로 다른 데이터 센터 간의 접근을 통해 전송될 수 있다. 또한 응용의 실행이 진행될 때, 생성된 중간 데이터를 이용하며 진행되므로 데이터의 위치에 따라 실행 결과가 달라진다. 그러나 기존의 데이터 배치 기법은 과학 응용의 특성을 고려하지 않는다. 본 논문에서는 데이터 집약적 단계를 정의하여 그 구간에서의 런타임 데이터 배치를 제안한다. 제안하는 데이터 배치 기법을 통해 본 연구에서 정의한 데이터 집약적 단계에서의 횟수를 고려한 시나리오를 분석하여 결과를 도출한다. 또한 런타임 데이터 배치 횟수와 런타임 데이터 배치 시 오버헤드를 분석하여 성능을 비교했다.
과학 워크플로우의 데이터 이동과 실험 환경 변화를 고려한 데이터 재배치
안주림(Julim Ahn),김희원(Heewon Kim),김윤희(Yoonhee Kim) 한국정보과학회 2018 정보과학회논문지 Vol.45 No.12
과학 워크플로우 응용은 데이터 센터에 대량의 데이터가 분산되어 있고, 이를 이용하며 응용을 실행하기 때문에 저장되는 데이터 위치에 따라 실행 결과가 달라질 수 있다. 또한 실행 도중 생산된 중간데이터의 위치도 전송에 영향을 미치기 때문에 이를 최소화하기 위한 데이터의 위치가 중요하다. 따라서 데이터 집약적인 워크플로우 응용을 위해 동적으로 변하는 자원의 상태를 고려한 데이터 재배치를 제안한다. 작업 실행 도중 동적으로 변하는 자원의 상태를 고려하여 프로파일링을 통한 데이터 집약적인 단계에서의 재배치를 통해 데이터 센터 간 데이터의 이동 시간과 이동하는 데이터 크기가 줄어 전체 실험 성능의 향상을 보였다. Scientific workflow applications have a large amount of data scattered in the data center, and as they use and execute applications, the execution results may vary depending on the location of the stored data. The location of the intermediate data produced during execution also affects the transmission. So, it is important for the location of the data to minimize the data transfer time and size. Therefore, we propose data placement considering the state of dynamically changing resources for data-intensive workflow applications. Considering the dynamically changing state of the resource during the execution of the task, the replacements in the data-intensive steps lead to a reduction in the data transfer time and the size of the transfer data.