http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Graphics Memory Bandwidth 증가에 따른 GPGPU 성능 향상 분석
조승환(Seunghwan Cho),유승주(Sungjoo Yoo) 대한전자공학회 2015 대한전자공학회 학술대회 Vol.2015 No.6
Graphic Processing Unit (GPU) has been highly hailed as a general-purpose (GP) high-performance computing unit in a wide variety of domains due to its high-computational capability and energy efficiency in comparison with CPU. Introducing High Bandwidth Memory (HBM), which will overcome the memory bandwidth wall within the context of GDDR5, to GPU is scheduled to take place soon. However, actual study on the impact of increased memory bandwidth on the performance of GPU with real GPGPU workloads is still lacking. We used a cycle accurate GPU simulator, GPGPU-Sim, to analyze the memory bandwidth sensitivity on 18 workloads from GPGPU benchmarks such as NVIDIA CUDA SDK, Rodina, and Parboil, and GPGPU-sim. Our results show most of GPU workloads from aforementioned benchmarks has low memory bandwidth sensitivity (x 1.16@ x 2BW, x 1.25@ x 4BW), yet several workloads have significant speedup with increased memory bandwidth. In addition, it is found that correlation between memory bandwidth sensitivity and memory intensiveness across the workloads used in the experiment is small (r=0.0817).
선택적 타이밍 에러 검출 및 정정을 이용한 Low Power Approximate FPU 설계
김동영(Dongyoung Kim),김재준(Jae-Joon Kim),유승주(Sungjoo Yoo) 대한전자공학회 2015 대한전자공학회 학술대회 Vol.2015 No.6
Timing speculation is an effective approach to enable low power operation at reduced supply voltage by reducing excessive timing margin. At low voltage, e.g., near-threshold voltage, however, large delay variation makes conventional timing speculations ineffective, and hence incurs significant performance overhead. Especially, as the arithmetic calculation with FPU increases the error correction overhead increases dramatically, because operation speed of FPU is slow and FPU consumes lots of power. In this paper, we propose an approximate FPU that corrects timing error occurs in LSB selectively. We verify the benefit of approximate FPU with 20 nm PTM model [6]. The proposed method offers 15.52 % improvement in performance (MIPS) and 13.43 % energy reduction with 99.22 % accuracy at 0.6 V.
실시간 실제이미지 편집을 위한 생성적 적대 신경망의 공간차원 도입 기법 소개
김현수(Hyunsoo Kim),최윤제(Yoonje Choi),김준호(Junho Kim),유승주(Sungjoo Yoo),어영정(Youngjung Uh) 한국정보과학회 2021 정보과학회지 Vol.39 No.6
생성적 적대 신경망(generative adversarial networks, GANs)은 무작위 은닉벡터로부터 사실적인 이미지를 생성한다. 입력인 은닉벡터를 변조함으로써 결과이미지를 수정할 수 있지만, 실제하는 이미지를 편집하려는 경우 1) 실제이미지를 은닉벡터로 사영하는 최적화연산의 높은 시간복잡도 또는 2) 인코더를 통한 사영과정에서 생기는 오차에 의한 어려움이 있다. 본 특집원고에서는 은닉표현자에 공간차원을 도입하고 상응하는 공간별 변조연산을 사용하는 StyleMapGAN을 소개한다. 그로 인해 인코더기반의 사영을 통해 최적화연산보다도 정확한 결과를 얻을 수 있게 되고 지역별 편집이 가능해진다. 이미지 편집의 다양한 작업에 대한 폭넓은 실험은 StyleMapGAN의 우월함을 입증한다. 더불어, 기존의 편집방법들은 StyleMapGAN에서 여전히 유효하다.