RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      KCI등재

      OpenMP 디바이스 컨스트럭트의 CUDA 소스 코드로의 변환 및 런타임 최적화 기법

      한글로보기

      https://www.riss.kr/link?id=A107273592

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 논문은 OpenMP 4.5 device construct를 이용하여 개발된 C 소스 코드를 대응하는 CUDA 소스 코드로 변환하는 컴파일러와 이를 지원하는 런타임 시스템을 제안한다. 먼저, OpenMP의 실행 모델, 메모리 모델 및 동기화 과정을 살펴보고, source-level 변환의 방법을 설명한다. 또한, 성능 향상을 위해 고안된 버디 할당자, UDTE와 같은 런타임 시스템 최적화 기술을 소개한다. 실험은 SPEC-ACCEL 1.2 벤치마크를 이용한다. 실험 결과 비교 대상인 gcc7 대비 6배 이상, mriq를 제외한 경우에도 2배 이상의 성능 향상을 가져왔다. 본 논문의 프레임워크를 바탕으로 향후 컴파일러 및 런타임 최적화 기술을 추가적으로 개발할 수 있을 것으로 기대된다.
      번역하기

      본 논문은 OpenMP 4.5 device construct를 이용하여 개발된 C 소스 코드를 대응하는 CUDA 소스 코드로 변환하는 컴파일러와 이를 지원하는 런타임 시스템을 제안한다. 먼저, OpenMP의 실행 모델, 메모리 ...

      본 논문은 OpenMP 4.5 device construct를 이용하여 개발된 C 소스 코드를 대응하는 CUDA 소스 코드로 변환하는 컴파일러와 이를 지원하는 런타임 시스템을 제안한다. 먼저, OpenMP의 실행 모델, 메모리 모델 및 동기화 과정을 살펴보고, source-level 변환의 방법을 설명한다. 또한, 성능 향상을 위해 고안된 버디 할당자, UDTE와 같은 런타임 시스템 최적화 기술을 소개한다. 실험은 SPEC-ACCEL 1.2 벤치마크를 이용한다. 실험 결과 비교 대상인 gcc7 대비 6배 이상, mriq를 제외한 경우에도 2배 이상의 성능 향상을 가져왔다. 본 논문의 프레임워크를 바탕으로 향후 컴파일러 및 런타임 최적화 기술을 추가적으로 개발할 수 있을 것으로 기대된다.

      더보기

      다국어 초록 (Multilingual Abstract)

      This paper deals with an OpenMP framework for GPU offloading. The framework is composed of a compiler and a runtime system that converts C programs written using the OpenMP 4.5 device construct to CUDA programs. First, we look at the execution model, memory model, and synchronization process of OpenMP, and explain how to translate in the source-level. Moreover, we use runtime optimization techniques such as buddy allocator, and UDTE to improve execution performance. Using the SPEC-ACCEL 1.2 benchmark suite, it shows up to 6 times better performance than the gcc7 framework. We expect that additional runtime and compiler optimization techniques can be applied based on the framework of this paper.
      번역하기

      This paper deals with an OpenMP framework for GPU offloading. The framework is composed of a compiler and a runtime system that converts C programs written using the OpenMP 4.5 device construct to CUDA programs. First, we look at the execution model, ...

      This paper deals with an OpenMP framework for GPU offloading. The framework is composed of a compiler and a runtime system that converts C programs written using the OpenMP 4.5 device construct to CUDA programs. First, we look at the execution model, memory model, and synchronization process of OpenMP, and explain how to translate in the source-level. Moreover, we use runtime optimization techniques such as buddy allocator, and UDTE to improve execution performance. Using the SPEC-ACCEL 1.2 benchmark suite, it shows up to 6 times better performance than the gcc7 framework. We expect that additional runtime and compiler optimization techniques can be applied based on the framework of this paper.

      더보기

      목차 (Table of Contents)

      • 요약
      • Abstract
      • 1. 서론
      • 2. 선행 연구
      • 3. OpenMP Device Constructs 모델
      • 요약
      • Abstract
      • 1. 서론
      • 2. 선행 연구
      • 3. OpenMP Device Constructs 모델
      • 4. OpenMP Device Construct 변환 모델
      • 5. 런타임 최적화
      • 6. 성능 평가
      • 7. 결론 및 향후 연구
      • References
      더보기

      참고문헌 (Reference)

      1 Kim, J, "Translating OpenMP device constructs to OpenCL using unnecessary data transfer elimination" IEEE 597-608, 2016

      2 Gabriel Noaje, "Source-to-source code translator: OpenMP C to CUDA" IEEE 512-519, 2011

      3 Juckeland, Guido, "SPEC ACCEL: A standard application suite for measuring hardware accelerator performance" Springer 46-67, 2014

      4 OpenMP Architecture Review Board, "OpenMP Appl ication Programming Interface"

      5 gcc, "GCC 7 Release Series"

      6 NVIDIA, "CUDA C Programming Guide"

      7 Knowlton, Kenneth C, "A fast storage allocator" 8 (8): 623-624, 1965

      1 Kim, J, "Translating OpenMP device constructs to OpenCL using unnecessary data transfer elimination" IEEE 597-608, 2016

      2 Gabriel Noaje, "Source-to-source code translator: OpenMP C to CUDA" IEEE 512-519, 2011

      3 Juckeland, Guido, "SPEC ACCEL: A standard application suite for measuring hardware accelerator performance" Springer 46-67, 2014

      4 OpenMP Architecture Review Board, "OpenMP Appl ication Programming Interface"

      5 gcc, "GCC 7 Release Series"

      6 NVIDIA, "CUDA C Programming Guide"

      7 Knowlton, Kenneth C, "A fast storage allocator" 8 (8): 623-624, 1965

      더보기

      동일학술지(권/호) 다른 논문

      동일학술지 더보기

      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      인용정보 인용지수 설명보기

      학술지 이력

      학술지 이력
      연월일 이력구분 이력상세 등재구분
      2022 평가예정 재인증평가 신청대상 (재인증)
      2019-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2016-01-01 평가 등재학술지 유지 (계속평가) KCI등재
      2015-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2014-09-16 학술지명변경 한글명 : 정보과학회논문지 : 컴퓨팅의 실제 및 레터 -> 정보과학회 컴퓨팅의 실제 논문지
      외국어명 : Journal of KIISE : Computing Practices and Letters -> KIISE Transactions on Computing Practices
      KCI등재
      2013-04-26 학술지명변경 외국어명 : Journal of KISS : Computing Practices and Letters -> Journal of KIISE : Computing Practices and Letters KCI등재
      2011-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2009-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2008-10-02 학술지명변경 한글명 : 정보과학회논문지 : 컴퓨팅의 실제 -> 정보과학회논문지 : 컴퓨팅의 실제 및 레터
      외국어명 : Journal of KISS : Computing Practices -> Journal of KISS : Computing Practices and Letters
      KCI등재
      2007-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2005-01-01 평가 등재학술지 유지 (등재유지) KCI등재
      2002-01-01 평가 등재학술지 선정 (등재후보2차) KCI등재
      더보기

      학술지 인용정보

      학술지 인용정보
      기준연도 WOS-KCI 통합IF(2년) KCIF(2년) KCIF(3년)
      2016 0.29 0.29 0.27
      KCIF(4년) KCIF(5년) 중심성지수(3년) 즉시성지수
      0.24 0.21 0.503 0.04
      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼