RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      저비용 FPGA에 기반한 667 GOPS/W의 재구성 가능한 이진화된 신경망 추론 시스템 = A 667 GOPS/W Reconfigurable Binarized Neural Network Inference System on a Low-Cost FPGA

      한글로보기

      https://www.riss.kr/link?id=T15070952

      • 저자
      • 발행사항

        고양 : 한국항공대학교 일반대학원, 2019

      • 학위논문사항

        학위논문(석사)-- 한국항공대학교 일반대학원 : 항공전자정보공학과 컴퓨터 정보 시스템 및 네트워크 2019. 2

      • 발행연도

        2019

      • 작성언어

        한국어

      • 발행국(도시)

        경기도

      • 형태사항

        73 ; 26 cm

      • 일반주기명

        지도교수: 김태환

      • UCI식별코드

        I804:41048-200000176635

      • 소장기관
        • 한국항공대학교 도서관 소장기관정보
      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract)

      본 연구에서는 이진화된 신경망 (Binarized Neural Network; BNN) 추론을 가속하기 위한 고속의 재구성 가능한 시스템을 제시한다. 제안하는 시스템에서, BNN 추론 과정은 전용의 하드웨어 가속기를 ...

      본 연구에서는 이진화된 신경망 (Binarized Neural Network; BNN) 추론을 가속하기 위한 고속의 재구성 가능한 시스템을 제시한다. 제안하는 시스템에서, BNN 추론 과정은 전용의 하드웨어 가속기를 통해 고속으로 수행되며, 하드웨어 가속기의 구조는 구성 파라미터에 따라 재구성 가능하다. 제안하는 시스템은 재구성 가능한 하드웨어 가속기를 통해 임의의 BNN 모델을 효과적으로 처리할 수 있으며, 레이어 타입에 적응적으로 데이터 플로우를 변경함으로써 높은 추론 속도 및 에너지 효율을 달성할 수 있다. 추가적으로, 제안하는 시스템의 추론 속도 및 에너지 효율은 오프-칩 데이터 전송과 BNN 추론 연산에 대한 중첩 스케줄링 및 이진-입력 이진-출력 (Binary-Input Binary-Output; BIBO) 처리 구조를 통해 크게 향상된다. 제안하는 시스템은 기성의 이기종 멀티 프로세서 시스템-온-칩 (System-On-Chip; SoC) 플랫폼상에서 구현되며, 시스템의 성능은 다양한 벤치마크 BNN 모델에 대하여 평가된다. 제안하는 시스템은 벤치마크 BNN 모델에 대해 최대 361.30 GOPS (Giga-Operations-Per-Second)의 성능 및 667.84 GOPS/W의 에너지 효율을 보인다. 결과적으로, 제안하는 시스템은 기존의 소프트웨어 기반의 시스템에 비해 최대 75.5배의 추론 속도 향상을 이루었고, 기존의 BNN 추론 가속기에 비해 에너지 효율을 최대 8.8배 개선하였다.

      더보기

      목차 (Table of Contents)

      • 제1장 서 론 1
      • 1.1 연구 배경 1
      • 1.2 논문의 구성 3
      • 제2장 배경 지식 4
      • 2.1 CNN 모델 4
      • 제1장 서 론 1
      • 1.1 연구 배경 1
      • 1.2 논문의 구성 3
      • 제2장 배경 지식 4
      • 2.1 CNN 모델 4
      • 2.1.1 CNN 모델 개요 4
      • 2.1.2 보편적인 CNN 모델 13
      • 2.2 관련 연구: 저정밀도 CNN 모델 15
      • 2.3 BNN 모델 18
      • 2.3.1 학습 모델 18
      • 2.3.2 추론 모델 21
      • 제3장 제안하는 시스템 23
      • 3.1 전체 시스템 구조 23
      • 3.2 BNN 추론 서브시스템 26
      • 3.2.1 시스템 구조 26
      • 3.2.2 중첩 스케줄링 29
      • 3.3 BNN 추론 가속기 32
      • 3.3.1 가속기 구조 32
      • 3.3.2 BIBO 처리 구조 37
      • 3.3.3 레이어 타입 적응적 가변 데이터 플로우 38
      • 제4장 구현 결과 41
      • 4.1 벤치 마크 41
      • 4.2 성능 비교 44
      • 제5장 결론 55
      • 참 고 문 헌 56
      • SUMMARY 63
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼