RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • GPU 클러스터 내부 코어 개수에 따른 범용 계산 효율성 분석

        손동오,김종면,김철홍 한국공학안전보건예술학회 2015 한국공학예술학회 논문지 Vol.7 No.1

        컴퓨터 성능이 점차 향상됨에 따라 사용자의 요구사항 또한 점차적으로 높아지고 있다. 최근에는 GPU의 여유로운 자원 이나 강력한 계산능력을 그래픽 작업뿐만 아니라 다양한 분야에 활용하기 위한 GPGPU (General-Purpose computing on Graphics Processing Units) 개발이 많은 관심을 받고 있다. 본 논문에서는 GPU 클러스터에 할당된 코어 개수를 다양하게 변경하여 GPU 코어 개수에 따른 GPGPU 성능을 분석하였다. 실험결과, 대부분의 벤치마크 프로그램에서는 GPU 코어 증 가에 따라 연산 자원의 증가로 인한 성능이 증가하지만, 특정 벤치마크 프로그램에서는 GPU 코어 증가에 따라 성능 감소 가 발생한다. 분석결과, GPU 코어 증가에 따라 성능이 감소하는 벤치마크 프로그램은 GPU 코어 개수가 증가에 따른 연산 자원 증가 이점을 잘 활용하지 못하며, 오히려 메모리 충돌에 따른 성능 감소가 큰 것으로 분석된다. 본 연구의 결과를 활 용한다면 GPGPU구조의 병렬성 향상을 위한 기초 연구에 활용 될 것으로 예상된다. Recently, GPGPU (General-Purpose computing on Graphics Processing Units) draws quite attention, since it can provide powerful computing capability of the GPU in executing general-purpose applications as well as graphics applications. Many studies utilizing parallel processing power of the GPU have been proposed in order to improve the performance of recent microprocessors. The GPGPU structure to take advantage of highly parallel processing capability can satisfy the performance requirements to the GPU. In this paper, we analyze the efficiency of the GPGPU varying the number of cores assigned to the GPU cluster. Simulation results show that the performance improves as the number of cores on the GPU cluster increases. However, in some benchmarks, the performance decreases as the number of cores on the GPU cluster increases, due to memory conflicts.

      • KCI등재

        IPC-based Dynamic SM management on GPGPU for Executing AES Algorithm

        Dong Oh Son(손동오),Hong Jun Choi(최홍준),Cheol Hong Kim(김철홍) 한국컴퓨터정보학회 2020 韓國컴퓨터情報學會論文誌 Vol.25 No.2

        최신 GPU는 GPGPU를 활용하여 범용 연산이 가능하다. 뿐만 아니라, GPU는 내장된 다수의 코어를 활용하여 강력한 연산 처리량을 제공한다. AES 알고리즘은 다수의 병렬 연산을 요구하지만 CPU 구조에서는 효율적인 병렬처리가 이뤄지지 않는다. 따라서, 본 논문에서는 강력한 병력 연산 자원을 활용하는 GPGPU 구조에서 AES 알고리즘을 수행함으로써 AES 알고리즘 처리시간을 줄여보았다. 하지만, GPGPU 구조는 AES 알고리즘 같은 암호알고리즘에 최적화되어 있지 않다. 그러므로 AES 알고리즘에 최적화될 수 있도록 재구성 가능한 GPGPU 구조를 제안하고자 한다. 제안된 기법은 SM의 개수를 동적으로 할당하는 IPC 기반 SM 동적 관리 기법이다. IPC 기반 SM 동적 관리 기법은 GPGPU 구조에서 동작하는 AES의 IPC를 실시간으로 반영하여 최적의 SM의 개수를 동적으로 할당한다. 실험 결과에 따르면 제안된 동적 SM 관리 기법은 기존의 GPGPU 구조와 비교하여 하드웨어 자원을 효과적으로 활용하여 성능을 크게 향상시켰다. 일반적인 GPGP 구조와 비교하여, 제안된 기법의 AES의 암호화/복호화는 평균 41.2%의 성능 향상을 보여준다. Modern GPU can execute general purpose computation on the graphic processing unit, and provide high performance by exploiting many core on GPU. To run AES algorithm efficiently, parallel computational resources are required. However, computational resource of CPU architecture are not enough to cryptographic algorithm such as AES whereas GPU architecture has mass parallel computation resources. Therefore, this paper reduce the time to execute AES by employing parallel computational resource on GPGPU. Unfortunately, AES cannot utilize computational resource on GPGPU since it isn’t suitable to GPGPU architecture. In this paper, IPC based dynamic SM management technique are proposed to efficiently execute AES on GPGPU. IPC based dynamic SM management can increase and decrease the number of active SMs by using IPC in run-time. According to simulation results, proposed technique improve the performance by increasing resource utilization compared to baseline GPGPU architecture. The results show that AES improve the performance by 41.2% on average.

      • KCI등재

        GPGPU를 활용한 OpenFOAM 기반 해석자 성능 분석

        한서음(Seoeum Han),정황희(Hwanghui Jeong),이복직(Bok Jik Lee) 한국전산유체공학회 2021 한국전산유체공학회지 Vol.26 No.2

        Two benchmark tests were carried out to analyze the performance of OpenFOAM-based CFD solvers using General-Purpose computing on Graphics Processing Units(GPGPU). In the present study, RapidCFD, which is an implementation of OpenFOAM capable of running most of the functions of OpenFOAM on GPUs, was used to apply GPGPU to OpenFOAM. The numerical simulations of 1) 3D lid-driven cavity incompressible flows and 2) steady flows around a motorbike were conducted on two kinds of CPU, single-GPU, and multi-GPU systems, and the computational times were analyzed. For the test of cavity flows, as the number of cells increased, the performance and the scalability of GPGPU were improved. When the number of cells was 2503, a system with 8-GPUs showed the highest performance with 42 times of speedup over a CPU system. For the test of flows around a motorbike, a system with 8-GPUs showed the highest performance with 20 times of speedup over a CPU system. For both single precision and double precision calculations, the performance improvements using GPGPU were efficient. The results demonstrate that GPGPU would be more efficient than computing on CPUs when computing large-scale flows and practical problems that require massive parallelism.

      • KCI등재

        2차원 압축성 유동 해석자의 OpenACC를 이용한 GPU 활용

        김승래,한서음,이복직 한국전산유체공학회 2022 한국전산유체공학회지 Vol.27 No.3

        A two-dimensional compressible flow solver was ported to GPU using OpenACC. The performance of this program was tested in three cases: viscous flow on a flat plate, inviscid transonic flow in a channel with a bump, and inviscid transonic flow around n0012 airfoil. The GPU program running on RTX 3090 showed up to 20 times of speedup compared to the original program using a single core of Ryzen 5950X, and up to 10 times of speedup compared to the program that uses all resources on the CPU. Among the computation steps of the program, implicit residual smoothing was the worst performing step on the GPU. To address this problem, skipping residual smoothing and using the Cyclic Reduction algorithm were tried as alternatives. These approaches improved speedup in almost every case, increasing the maximum speedups to 24 times compared to the single core program and 11 times compared to the 16-core program. The results show that GPU is a suitable tool for accelerating CFD solvers due to its memory bandwidth and parallel computing capability and using OpenACC is a viable method for porting programs to GPU.

      • KCI등재

        IB-LBM을 이용한 도심 항공 교통 비행체 멀티로터 날개의 공력소음 해석

        정형근(Hyungkeun Chung),문영준(Young June Moon) 한국항공우주학회 2023 韓國航空宇宙學會誌 Vol.51 No.3

        본 연구에서는 멀티 레벨 격자가 적용된 가상경계 격자 볼츠만 법(IB-LBM)을 병렬 GPU 플랫폼상에서 이용하여 도심 항공 교통 비행체의 멀티로터 블레이드에 대한 공력소음 전산해석을 수행하였다. APC 11x8 Sport 드론 프로펠러에 대해 다양한 회전 속도 및 격자 수렴 테스트를 수행하여 블레이드 통과 주파수 및 하모닉스 주파수에서 추력 및 음압 레벨의 예측에 대한 정확성을 검증했다. 해당 검증은 실험 데이터와의 비교를 통해 합리적인 예측 정확도를 보였다. 또한 NASA X-57 Maxwell의 프로펠러를 다양한 수직 거리 차이를 두고 배치하여 프로펠러의 공력소음 특성을 발견하기 위해 계산을 수행하였다. 수직 거리 차이가 있는 트윈 프로펠러는 2차 하모닉스 주파수의 음압 레벨을 7~10dB 줄이는 것으로 나타났다. In this study, aeroacoustic computational analyses were performed for multi-rotor blades of urban air vehicles using the immersed boundary - lattice Boltzmann method (IB-LBM) on a parallel GPU platform with multi-level grids. Tests of various rotational rates and grid-convergence with different grid resolutions for an APC 11x8 Sport drone propeller were conducted to verify the accuracy of the present method for predicting thrust and sound pressure level at blade passing frequency and its harmonics. IB-LBM validation showed reasonably accurate estimation through comparison with experimental data. Computation for NASA X-57 Maxwell propellers were also conducted with arrangement settings at various vertical distances to discover the aeroacoustic properties of propellers. Twin propellers with vertical offset were found to reduce the sound pressure level at second harmonic frequency by 7~10dB.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼