http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
MPI 노드 내 통신 성능 향상을 위한 매니코어 프로세서의 온-패키지 메모리 활용
조중연(Joong-Yeon Cho),진현욱(Hyun-Wook Jin),남덕윤(Dukyun Nam) 한국정보과학회 2017 정보과학회논문지 Vol.44 No.2
고성능 컴퓨팅 환경을 위해서 최근 등장한 차세대 매니코어 프로세서는 전통적인 구조의 메모리와 함께 고대역 온-패키지 메모리를 장착하고 있다. Intel Xeon Phi Knights Landing(KNL) 프로세서의 온-패키지 메모리인 Multi-Channel DRAM(MCDRAM)은 기존의 DDR4 메모리보다 이론적으로 네배 높은 대역폭을 제공한다. 본 논문에서는 MCDRAM을 이용하여 MPI 노드 내 통신 성능을 향상시키기 위한 방안을 제안한다. 실험 결과, 제안된 기법을 사용할 경우 DDR4를 사용하는 경우와 비교해서 MPI 노드 내 통신 성능을 최대 272% 향상시킬 수 있음을 보인다. 또한 MCDRAM 활용 방법에 따른 성능 영향뿐만 아니라 프로세스의 코어 친화도에 따른 성능 영향을 보인다. The emerging next-generation manycore processors for high-performance computing are equipped with a high-bandwidth on-package memory along with the traditional host memory. The Multi-Channel DRAM (MCDRAM), for example, is the on-package memory of the Intel Xeon Phi Knights Landing (KNL) processor, and theoretically provides a four-times-higher bandwidth than the conventional DDR4 memory. In this paper, we suggest a mechanism to exploit MCDRAM for improving the performance of MPI intra-node communication. The experiment results show that the MPI intra-node communication performance can be improved by up to 272 % compared with the case where the DDR4 is utilized. Moreover, we analyze not only the performance impact of different MCDRAM-utilization mechanisms, but also that of core affinity for processes.
다중 큐를 지원하는 고속 I/O 장치를 위한 동적 코어 친화도
조중연(Joong-Yeon Cho),엄준용(Junyong Uhm),진현욱(Hyun-Wook Jin),정성인(Sungin Jung) 한국정보과학회 2016 정보과학회논문지 Vol.43 No.7
멀티코어 시스템에서 코어 친화도가 네트워크 I/O 성능에 미치는 영향은 다양한 연구들을 통해 관찰 되었다. 점차 고속화되는 네트워크 연결의 발전에 따라 효율적인 코어 친화도 정책은 중요한 성능 요소가 될 수 있다. 미들웨어 수준의 동적 코어 친화도 프레임워크는 네트워크와 디스크 I/O를 함께 고려한 코어 친화도 정책을 제안하였지만 다중 큐에 대한 고려는 이루어지지 않았다. 본 논문에서는 기존 동적 코어 친화도 프레임워크에 사용된 알고리즘을 다중 큐를 지원하기 위한 구조로 확장하고, 40 기가비트 이더넷과 NVMe 디바이스를 장착한 시스템에서 파일 업로드 성능을 분석한다. 실험 결과 다중 큐를 지원하기 위한 동적 코어 친화도는 하둡 분산 파일 시스템의 파일 업로드 처리량을 최대 32% 향상시켰으며 매니코어 시스템에서 더 나은 확장성을 제공할 수 있음을 확인하였다. 또한 다중 큐 조합에 따른 성능영향에 대해 분석하여 다중 큐 분배 조합을 위해 고려해야 할 성능 요소들에 대해 논의한다. Several studies have reported the impact of core affinity on the network I/O performance of multi-core systems. As the network bandwidth increases significantly, it becomes more important to determine the effective core affinity. Although a framework for dynamic core affinity that considers both network and disk I/O has been suggested, the multiple queues provided by high-speed I/O devices are not properly supported. In this paper, we extend the existing framework of dynamic core affinity to efficiently support the multiple queues of high-speed I/O devices, such as 40 Gigabit Ethernet and NVM Express. Our experimental results show that the extended framework can improve the HDFS file upload throughput by up to 32%, and can provide improved scalability in terms of the number of cores. In addition, we analyze the impact of the assignment policy of multiple I/O queues across a number of cores.
조중연(Joong-Yeon Cho),배효철(Hyo-Chul Bae),이상헌(Sang-Hun Lee),진현욱(Hyun-Wook Jin),윤경로(Kyoungro Yoon) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2A
수많은 데이터가 존재하는 인터넷 환경에서 검색 엔진은 매우 중요한 역할을 하고 있다. 그리고 최근에 멀티미디어 데이터의 발전에 따라 과거의 텍스트 기반의 검색과 함께 콘텐츠 기반 검색이 주목받고 있다. 이는 사용자에게 편의성을 제공하고 좀 더 정확한 정보를 검색하기 위한 노력이라고 할 수 있다. 하지만 멀티미디어 데이터를 검색하기 위해서 데이터에 대한 정보를 저장하기 위한 대용량의 저장소와 멀티미디어 데이터를 분석하기 위한 고성능의 컴퓨터가 필요하게 된다. 이로 인해 최근에 분산 컴퓨팅을 이용한 연산 성능향상과 함께 분산 저장소를 활용하기 위한 분산 컴퓨팅이 주목 받고 있다. 이를 통해 저장소 확장의 용이함 및 병렬처리를 이용한 처리 속도 향상을 함께 꾀할 수 있다. 본 논문에서는 기존의 검색 시스템을 Apache의 Hadoop 플랫폼에 적용하고 MapReduce 프레임워크를 통한 시스템 개발 시 성능향상을 위해서 고려해야 하는 중요한 요소들을 분석한다.