http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
GPU 를 활용한 분산 컴퓨팅 프레임워크 성능 개선 연구
송주영 ( Ju-young Song ),공용준 ( Yong-joon Kong ),심탁길 ( Tak-kil Shim ),신의섭 ( Eui-seob Shin ),성기진 ( Kee-kin Seong ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.1
빅 데이터 분석의 시대가 도래하면서 대용량 데이터의 특성과 계산 집약적 연산의 특성을 동시에 가지는 문제 해결에 대한 요구가 늘어나고 있다. 대용량 데이터 처리의 경우 각종 분산 파일 시스템과 분산/병렬 컴퓨팅 기술들이 이미 많이 사용되고 있으며, 계산 집약적 연산 처리의 경우에도 GPGPU 활용 기술의 발달로 보편화되는 추세에 있다. 하지만 대용량 데이터와 계산 집약적 연산 이 두 가지 특성을 모두 가지는 문제를 처리하기 위해서는 많은 제약 사항들을 해결해야 하는데, 본 논문에서는 이에 대한 대안으로 분산 컴퓨팅 프레임워크인 Hadoop MapReduce 와 Nvidia 의 GPU 병렬 컴퓨팅 아키텍처인 CUDA 를 연동하는 방안을 제시하고, 이를 밀집 행렬(dense matrix) 연산에 적용했을 때 얻을 수 있는 성능 개선 효과에 대해 소개하고자 한다.
대규모 분산 처리 프레임워크에 따른 대규모 그래프 처리 성능 비교
배경숙 ( Kyung-sook Bae ),공용준 ( Yong-joon Kong ),심탁길 ( Tak-kil Shim ),신의섭 ( Eui-seob Shin ),성기진 ( Kee-kin Seong ) 한국정보처리학회 2012 한국정보처리학회 학술대회논문집 Vol.19 No.1
최근 IT 분야의 화두로 '빅 데이터’ 가 떠오르고 있으며 많은 기업들이 이를 분석하여 이익을 증대하기 위한 노력을 하고 있다. 이에 구글은 초기에 맵리듀스라고 하는 대용량 분산처리 프레임워크 기술을 확보하여 이를 기반으로 한 서비스를 제공하고 있다. 그러나 스마트 단말 및 소셜미디어 등의 출현으로 다양한 디지털 정보들이 그래프로 표현되는 추세가 강화되고 있으며 기존의 맵리듀스로 이를 처리하는 데에 한계를 느낀 구글은 Pregel 이라는 그래프 형 자료구조에 최적화된 또 다른 분산 프레임워크를 개발하였다. 본 논문에서는 일반적인 그래프 형 데이터가 갖는 특성을 분석하고, 대용량 그래프 데이터를 처리하는데 있어 맵리듀스가 갖는 한계와 Pregel 은 어떤 방식으로 이를 극복하고 있는지를 소개한다. 또한 실험을 통하여 데이터의 특성에 따른 적절한 프레임워크의 선택이 대용량 데이터를 처리하는 데에 있어서 얼마나 큰 영향을 미치는지 확인한다.