고성능 컴퓨팅 (HPC) 는 동시에 수천명의 사용자들의 요청을 처리하기 위하여 매우 복잡한 계산 장치와 저장장치로 이루어져 있다. 또한, 사용자들이 실행하는 응용들은 다양한 계산 복잡도,...
http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
국문 초록 (Abstract)
고성능 컴퓨팅 (HPC) 는 동시에 수천명의 사용자들의 요청을 처리하기 위하여 매우 복잡한 계산 장치와 저장장치로 이루어져 있다. 또한, 사용자들이 실행하는 응용들은 다양한 계산 복잡도,...
고성능 컴퓨팅 (HPC) 는 동시에 수천명의 사용자들의 요청을 처리하기 위하여 매우 복잡한 계산 장치와 저장장치로 이루어져 있다.
또한, 사용자들이 실행하는 응용들은 다양한 계산 복잡도, 메모리 및 저장장치 요구사항을 가지고 있다.
이러한 응용의 요구사항을 파악하는 것은 효율적인 스케쥴링 및 자원할당에 필수적이다.
요구사항 중 입출력 성능은 고성능 컴퓨팅 시스템의 저장장치가 매우 복잡하고 모든 사용자가 동시에 저장장치를 활용함에 따라 예측하기가 어렵다.
본 논문에서는 매우 큰 고성능 컴퓨팅 시스템에서의 입출력 성능을 분석하였다.
분석 결과에 따르면 많은 사용자들은 응용에 최적화된 환경설정 값이 아닌 기본 환경설정 값을 사용하고 있다.
또한, 고성능 컴퓨팅 응용의 입출력 성능은 응용의 입출력 특성과 더불어 다른 응용들의 입출력 특성에 영향을 크게 받는다.
이러한 분석 결과를 토대로 입출력 성능을 예측하고 향상하는 방법을 제시하였다.
입출력 성능을 예측하기 위하여 다양한 시스템 로그에서 정보를 추출하여 하나의 검색 가능한 데이터베이스를 구축하였다.
이 데이터베이스를 활용하여 여러 회귀분석 기계학습 알고리즘을 사용하여 입출력 성능을 예측하엿다.
다양한 특성 중 중요한 특성을 여러 기계학습 알고리즘을 통하여 자동적으로 추출하고 최적의 알고리즘을 선택하는 방법을 제시하엿다.
입출력 성능을 향상하기 위하여 데이터베이스의 정보를 이용하여 기존 응용의 환경설정 값과 성능의 상관관계를 파악하고, 제일 좋은 성능을 가지는 환경설정 값을 자동적으로 선택하였다.
또한, 다양한 응용의 환경설정 값을 사용자의 개입 없이 자동적으로 조절하여 응용들 간의 성능간섭을 최소화 시켰다.
본 논문에서는 제안한 방법들의 효과를 증명하기 위하여 저장장치의 통제가 가능한 작은 시스템과 매우 큰 실제 고성능 컴퓨팅 시스템에서 성능을 평가하였다.
실험 결과를 통해 성능을 최대 99%의 정확도로 예측할 수 있음을 확인하였고, 또한 자동적 환경설정을 통하여 기존 대비 263%의 성능향상을 확인하였다.
다국어 초록 (Multilingual Abstract)
Large-scale high performance computing (HPC) systems typically consist of many thousands of CPUs and storage units used by hundreds to thousands of users simultaneously. Applications from large numbers of users have diverse characteristics, such as va...
Large-scale high performance computing (HPC) systems typically consist of many thousands of CPUs and storage units used by hundreds to thousands of users simultaneously.
Applications from large numbers of users have diverse characteristics, such as varying computation, communication, memory, and I/O intensity.
A good understanding of the performance characteristics of each user application is important for job scheduling and resource provisioning.
Among these performance characteristics, the I/O performance is difficult to predict because the I/O system software is complex, the I/O system is shared among all users, I/O operations heavily rely on networking systems.
In this dissertation, we analyzed the I/O performance of a large scale HPC system (the Cori supercomputer at NERSC).
Our analysis results indicate that most users do not adjust storage configurations but rather use the default settings.
In addition, I/O performance of HPC applications is affected by I/O characteristics of each application and interference from other applications.
With the finding from the analysis, we propose schemes to predict and improve the I/O performance of HPC applications.
First, we propose a prediction scheme that integrates information from several different system logs and utilizes various machine learning algorithms to predict the I/O performance.
Our proposed scheme can dynamically select the most relevant features from the log entries using various feature selection algorithms and scoring functions, and can automatically select the regression algorithm with the best accuracy for the prediction task.
Second, we propose DCA-IO, a dynamic distributed file system configuration adjustment algorithm that utilizes the system log information to adjust storage configurations automatically.
Our scheme aims to improve the application performance and avoid interference from other applications without user intervention.
To show the effectiveness of our approach, we implement and evaluate our scheme on a small scale distributed system and a large scale production HPC system.
The evaluation results show that our proposed scheme can predict the write performance with up to 90% prediction accuracy and the read performance with up to 99% prediction accuracy using the logs from the Cori supercomputer at NERSC.
In addition, DCA-IO can improve the performance of HPC applications by up to 263% with the default Lustre configuration by automatically adjusting the file system configurations
목차 (Table of Contents)