http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
MPI 노드 내 통신 성능 향상을 위한 매니코어 프로세서의 온-패키지 메모리 활용
조중연(Joong-Yeon Cho),진현욱(Hyun-Wook Jin),남덕윤(Dukyun Nam) Korean Institute of Information Scientists and Eng 2017 정보과학회논문지 Vol.44 No.2
The emerging next-generation manycore processors for high-performance computing are equipped with a high-bandwidth on-package memory along with the traditional host memory. The Multi-Channel DRAM (MCDRAM), for example, is the on-package memory of the Intel Xeon Phi Knights Landing (KNL) processor, and theoretically provides a four-times-higher bandwidth than the conventional DDR4 memory. In this paper, we suggest a mechanism to exploit MCDRAM for improving the performance of MPI intra-node communication. The experiment results show that the MPI intra-node communication performance can be improved by up to 272 % compared with the case where the DDR4 is utilized. Moreover, we analyze not only the performance impact of different MCDRAM-utilization mechanisms, but also that of core affinity for processes.
다중 큐를 지원하는 고속 I/O 장치를 위한 동적 코어 친화도
조중연(Joong-Yeon Cho),엄준용(Junyong Uhm),진현욱(Hyun-Wook Jin),정성인(Sungin Jung) Korean Institute of Information Scientists and Eng 2016 정보과학회논문지 Vol.43 No.7
Several studies have reported the impact of core affinity on the network I/O performance of multi-core systems. As the network bandwidth increases significantly, it becomes more important to determine the effective core affinity. Although a framework for dynamic core affinity that considers both network and disk I/O has been suggested, the multiple queues provided by high-speed I/O devices are not properly supported. In this paper, we extend the existing framework of dynamic core affinity to efficiently support the multiple queues of high-speed I/O devices, such as 40 Gigabit Ethernet and NVM Express. Our experimental results show that the extended framework can improve the HDFS file upload throughput by up to 32%, and can provide improved scalability in terms of the number of cores. In addition, we analyze the impact of the assignment policy of multiple I/O queues across a number of cores.
조중연(Joong-Yeon Cho),배효철(Hyo-Chul Bae),이상헌(Sang-Hun Lee),진현욱(Hyun-Wook Jin),윤경로(Kyoungro Yoon) 한국정보과학회 2011 한국정보과학회 학술발표논문집 Vol.38 No.2A
수많은 데이터가 존재하는 인터넷 환경에서 검색 엔진은 매우 중요한 역할을 하고 있다. 그리고 최근에 멀티미디어 데이터의 발전에 따라 과거의 텍스트 기반의 검색과 함께 콘텐츠 기반 검색이 주목받고 있다. 이는 사용자에게 편의성을 제공하고 좀 더 정확한 정보를 검색하기 위한 노력이라고 할 수 있다. 하지만 멀티미디어 데이터를 검색하기 위해서 데이터에 대한 정보를 저장하기 위한 대용량의 저장소와 멀티미디어 데이터를 분석하기 위한 고성능의 컴퓨터가 필요하게 된다. 이로 인해 최근에 분산 컴퓨팅을 이용한 연산 성능향상과 함께 분산 저장소를 활용하기 위한 분산 컴퓨팅이 주목 받고 있다. 이를 통해 저장소 확장의 용이함 및 병렬처리를 이용한 처리 속도 향상을 함께 꾀할 수 있다. 본 논문에서는 기존의 검색 시스템을 Apache의 Hadoop 플랫폼에 적용하고 MapReduce 프레임워크를 통한 시스템 개발 시 성능향상을 위해서 고려해야 하는 중요한 요소들을 분석한다.