http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
범용 서버 프로세서에서의 FLsched 스케줄러 성능 고찰
조희승(Heeseung Jo) 한국정보과학회 2020 정보과학회 컴퓨팅의 실제 논문지 Vol.26 No.9
프로세서 구조가 매니코어 형태로 발전하고 있고, 한 프로세서에 집적되는 코어의 수는 지속적으로 증가하고 있다. 급속히 증가하는 인공지능과 딥러닝 워크로드는 급속히 증가하고 있고, 계산 집약적이고 매우 큰 병렬성을 요구하는 워크로드 또한 이러한 추세를 가중시키고 있다. 반면, 운영체제에서 매니코어를 지원하기 위한 스케줄러의 발전은 하드웨어 발전 속도를 따라가지 못하고 있지만, 최근 리눅스 운영체제에서 매니코어 프로세서를 고려하여 최적화된 FLsched가 제안된 바 있다. FLsched는 Xeon Phi 프로세서를 고려하여, lockless 디자인과 context switch의 수를 최소화함으로써 성능의 향상을 이루고자 한다. 본 연구에서는 FLsched가 범용 서버급 프로세서에서도 타당성을 가지는지, 성능 향상이 가능한지 분석하고 고찰해 본다. 다수의 서버급 워크로드와 벤치마크를 이용한 성능평가 결과, CFS 대비하여 FLsched가 우수한 성능을 나타내었으며, Xeon Phi에서 보다 그 성능의 향상 정도가 더 큰 것으로 나타났다. 주요한 이유로 FLsched의 lockless 디자인이 주요한 것으로 분석된다. The processor structure has evolved into a manycore processor, and the number of cores integrated into a processor has been continuously increasing. Rapidly increasing AI and deep learning workloads, that are computation-intensive and highly parallel, are also accelerating this trend. Conversely, the development of the OS scheduler to support manycore processors cannot match with the speed of hardware development. But recently, FLsched has been proposed which considers manycore processors in the Linux operating system. FLsched aims the Xeon Phi processor and focuses on improving the scheduler performance by removing the internal locks and by minimizing the number of context switches. In this paper, we analyze and study if FLsched is feasible in general-purpose server-class processors and if the performance can be improved. As a result of a performance evaluation using many server-class workloads and benchmarks, FLsched showed superior performance compared to CFS, and the degree of improvement in the performance was greater than in the Xeon Phi. The lockless design of FLsched is the main reason.
리눅스 SSD caching mechanism 의 성능 비교 및 분석
허상복,박진희,조희승,Heo, Sang-Bok,Park, Jinhee,Jo, Heeseung 한국스마트미디어학회 2015 스마트미디어저널 Vol.4 No.2
During several decades, hard disk drive(HDD) has been used in most computer systems as secondary storage and, however, the performance enhancement of HDD is limited by its mechanical properties. On the other hand, although the flash memory based solid state drive (SSD) has more advantages over HDD such as high performance and low noise, SSD is still too expensive for common usage and expected to take several years to replace HDD completely. Therefore, SSD caching mechanism using the SSD as a cache of high capacity HDD has been highlighted lately. The representatives of SSD caching mechanisms are typically bcache, dm-cache, Flashcache, and EnhanceIO. Each of them has its own internal mechanism and implementation, and this makes them to show their own pros. and cons. In this paper, we analyze the characteristics of each SSD caching mechanisms and compare the performance of them under various workloads. We expect that our contribution will be useful to enhance the performance of SSD caching mechanisms. Hard disk drive(HDD)는 보조 저장장치로서 대부분의 컴퓨터 시스템에서 사용되고 있으나 기계적 특성으로 인하여 성능의 향상 측면에서는 한계점에 도달해 있는 상황이다. 반면, 플래시 메모리 기반인 solid state drive(SSD)는 고성능 저소음이라는 장점이 있지만, HDD에 비해 높은 가격으로 인해 아직 HDD를 완전 대체하기에는 부담이 크다. 따라서 SSD를 대용량인 HDD의 cache로 사용하는 SSD caching mechanism이 최근 주목을 받고 있다. SSD caching mechanism은 대표적으로 bcache, dm-cache, Flashcache, EnhanceIO 등이 있으며, 각 mechanism들은 구현상의 장단점과 차별성이 존재한다. 본 논문에서는 각 SSD caching mechanism들의 특정을 파악하고, 벤치마크를 통하여 성능을 비교 분석하였다. 이러한 연구를 기반으로 향후 더 성능이 좋은 SSD caching mechanism을 개발하는데 기여할 수 있을 것으로 예상된다.
서버 응용프로그램 성능 향상을 위한 운영체제 스케줄러 변수 조정
한태현(Taehyun Han),이현명(Hyeonmyeong Lee),조희승(Heeseung Jo) Korean Institute of Information Scientists and Eng 2020 정보과학회논문지 Vol.47 No.7
Modern Linux servers are used in a variety of ways, from large servers to small IOTs, and most machines run their services through the default scheduler provided by Linux. Although it is possible to optimize for a specific purpose, there is a problem in which the average user cannot optimize all modern Linux applications. In this paper, we propose SCHEDTUNE to automatically optimize the scheduler configuration to maximize Linux server performance. SCHEDTUNE allows users to improve performance without modification to the application or basic kernel source running on the server. This makes it easy for administrators to configure schedulers that operate specifically for their servers. Experimental results showed that when SCHEDTUNE is applied, the maximum performance is achieved up to 19 %, and in most cases performance improvement is achieved as well.
P<SUB>AR</SUB>P<SUB>A</SUB>: 고성능 컴퓨팅을 위한 이기종 아키텍처 동시 사용 프레임워크
조효재(Hyojae Cho),한태현(Taehyun Han),이현명(Hyeonmyeong Lee),조희승(Heeseung Jo) Korean Institute of Information Scientists and Eng 2019 정보과학회논문지 Vol.46 No.9
With the substantial performance improvements achieved in GPU, they have come to be commonly used not only in computer graphics but also in high performance computing. Simply using a CPU and a GPU concurrently is not difficult. However, distributing works and adjusting the computing ratio among these heterogeneous processors are challenging issues. We propose a novel framework in this paper, named PARPA, which automatically distributes and processes tasks to a CPU and a GPU. PARPA can maximize computation performance by using a CPU and a GPU simultaneously. The load balancing between them can be performed dynamically based on their usage and features. The evaluation results indicate that PARPA shows 3.48 times better performance.