RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      스마트 컨트랙트 취약점 탐지를 위한 사전학습 딥러닝 모델 응용 연구 = Application of Pretrained Deep Learning Models for Smart Contract Vulnerability Detection

      한글로보기

      https://www.riss.kr/link?id=E1776211

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      블록체인 기술의 확산과 함께 스마트 컨트랙트는 중앙은행 디지털화폐(CBDC) 및 스테이블코인과 같은 디지털화폐 시스템의 핵심 구성요소가 되었다. 스마트 컨트랙트는 배포 후 수정이 어려워 단 한 줄의 취약한 코드도 막대한 재정적 손실로 이어질 수 있으므로, 배포 전 자동화된 취약점 탐지의 중요성이 크다. 본 연구에서는 사전학습 코드 언어 모델(CodeBERT 등)을 활용하여 스마트 컨트랙트 취약점 탐지 성능을 최적화하는 방법론을 제안하고, 특히 재진입·접근 제어와 같은 디지털화폐에 치명적인 취약점에 대한 특화 학습의 효과를 정량적으로 분석한다. 이를 위해 긴 소스코드 입력 제약을 완화하기 위한 슬라이딩 윈도우 기반 전처리, 서로 다른 분류기 구조(L1/L2), 청크 단위 집계 방식(예: Max, Percentile, Power Mean, Top-k3)의 조합을 비교하였다. 실험 결과 CodeBERT 백본에 단일 계층(L1) 분류기와 Top-k3 집계 방식을 결합한 모델이 가장 우수한 탐지 성능(최고 F1 = 0.8560)을 보였다. 또한 재진입·접근 제어 취약점에 대한 특화 학습은 목표 취약점의 탐지 성능을 의미 있게 향상시키는 반면, 범용 테스트셋에서는 소폭의 일반화 성능 저하가 관찰되었다. 본 연구는 사전학습 모델 기반 스마트 컨트랙트 취약점 탐지의 최적 구성요소를 제시하고, 특화 학습의 효과와 한계를 실험적으로 분석함으로써 향후 관련 보안 시스템 설계에 기여하고자 한다.
      번역하기

      블록체인 기술의 확산과 함께 스마트 컨트랙트는 중앙은행 디지털화폐(CBDC) 및 스테이블코인과 같은 디지털화폐 시스템의 핵심 구성요소가 되었다. 스마트 컨트랙트는 배포 후 수정이 어려...

      블록체인 기술의 확산과 함께 스마트 컨트랙트는 중앙은행 디지털화폐(CBDC) 및 스테이블코인과 같은 디지털화폐 시스템의 핵심 구성요소가 되었다. 스마트 컨트랙트는 배포 후 수정이 어려워 단 한 줄의 취약한 코드도 막대한 재정적 손실로 이어질 수 있으므로, 배포 전 자동화된 취약점 탐지의 중요성이 크다. 본 연구에서는 사전학습 코드 언어 모델(CodeBERT 등)을 활용하여 스마트 컨트랙트 취약점 탐지 성능을 최적화하는 방법론을 제안하고, 특히 재진입·접근 제어와 같은 디지털화폐에 치명적인 취약점에 대한 특화 학습의 효과를 정량적으로 분석한다. 이를 위해 긴 소스코드 입력 제약을 완화하기 위한 슬라이딩 윈도우 기반 전처리, 서로 다른 분류기 구조(L1/L2), 청크 단위 집계 방식(예: Max, Percentile, Power Mean, Top-k3)의 조합을 비교하였다. 실험 결과 CodeBERT 백본에 단일 계층(L1) 분류기와 Top-k3 집계 방식을 결합한 모델이 가장 우수한 탐지 성능(최고 F1 = 0.8560)을 보였다. 또한 재진입·접근 제어 취약점에 대한 특화 학습은 목표 취약점의 탐지 성능을 의미 있게 향상시키는 반면, 범용 테스트셋에서는 소폭의 일반화 성능 저하가 관찰되었다. 본 연구는 사전학습 모델 기반 스마트 컨트랙트 취약점 탐지의 최적 구성요소를 제시하고, 특화 학습의 효과와 한계를 실험적으로 분석함으로써 향후 관련 보안 시스템 설계에 기여하고자 한다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      With the spread of blockchain technology, smart contracts have become a core component of digital currency systems such as Central Bank Digital Currencies (CBDCs) and stablecoins. Due to the immutable nature of deployed smart contracts, even a single line of vulnerable code can lead to significant financial losses, highlighting the critical importance of automated vulnerability detection.
      This study proposes a methodology for optimizing smart contract vulnerability detection using pre-trained code language models (e.g., CodeBERT) and quantitatively analyzes the effects of specialized fine-tuning for critical vulnerabilities in digital currencies, such as reentrancy and access control. To this end, we evaluated combinations of sliding-window preprocessing designed to mitigate input-length constraints for long source code, different classifier architectures (single-layer L1 vs. two-layer L2), and various chunk-level aggregation methods (e.g., Max, Percentile, Power Mean, Top-k3).
      Experimental results demonstrate that the model combining the CodeBERT backbone, a single-layer (L1) classifier, and the Top-k3 aggregation method achieved the best detection performance, with the highest F1-score of 0.8560. Furthermore, specialized learning for reentrancy and access control vulnerabilities meaningfully improved detection performance for the target vulnerabilities compared with the general-purpose model, while exhibiting a slight trade-off in generalization performance on the overall test set.
      This research identifies the optimal configuration of pre-trained models for smart contract vulnerability detection and empirically clarifies the effects and limitations of specialized learning, aiming to contribute to the future design of related systems.
      번역하기

      With the spread of blockchain technology, smart contracts have become a core component of digital currency systems such as Central Bank Digital Currencies (CBDCs) and stablecoins. Due to the immutable nature of deployed smart contracts, even a single ...

      With the spread of blockchain technology, smart contracts have become a core component of digital currency systems such as Central Bank Digital Currencies (CBDCs) and stablecoins. Due to the immutable nature of deployed smart contracts, even a single line of vulnerable code can lead to significant financial losses, highlighting the critical importance of automated vulnerability detection.
      This study proposes a methodology for optimizing smart contract vulnerability detection using pre-trained code language models (e.g., CodeBERT) and quantitatively analyzes the effects of specialized fine-tuning for critical vulnerabilities in digital currencies, such as reentrancy and access control. To this end, we evaluated combinations of sliding-window preprocessing designed to mitigate input-length constraints for long source code, different classifier architectures (single-layer L1 vs. two-layer L2), and various chunk-level aggregation methods (e.g., Max, Percentile, Power Mean, Top-k3).
      Experimental results demonstrate that the model combining the CodeBERT backbone, a single-layer (L1) classifier, and the Top-k3 aggregation method achieved the best detection performance, with the highest F1-score of 0.8560. Furthermore, specialized learning for reentrancy and access control vulnerabilities meaningfully improved detection performance for the target vulnerabilities compared with the general-purpose model, while exhibiting a slight trade-off in generalization performance on the overall test set.
      This research identifies the optimal configuration of pre-trained models for smart contract vulnerability detection and empirically clarifies the effects and limitations of specialized learning, aiming to contribute to the future design of related systems.

      더보기

      목차 (Table of Contents)

      • 제 1 장 서론 1
      • 제 1 절 연구 배경 및 필요성 1
      • 제 2 절 연구 목적 및 내용 2
      • 제 3 절 연구 보고서의 구성 3
      • 제 2 장 배경 지식 및 선행 연구 4
      • 제 1 장 서론 1
      • 제 1 절 연구 배경 및 필요성 1
      • 제 2 절 연구 목적 및 내용 2
      • 제 3 절 연구 보고서의 구성 3
      • 제 2 장 배경 지식 및 선행 연구 4
      • 제 1 절 스마트 컨트랙트 및 디지털화폐 4
      • 1. 이더리움과 스마트 컨트랙트 4
      • 2. CBDC 및 스테이블코인과 보안 요구사항 6
      • 제 2 절 디지털화폐 관련 주요 스마트 컨트랙트 취약점 7
      • 1. 재진입 (Reentrancy) 8
      • 2. 접근 제어 (Access-Control) 10
      • 3. 정수 오버플로우/언더플로우 (Integer Overflow / Underflow) 12
      • 제 3 절 소스코드 처리를 위한 사전학습 언어 모델 14
      • 1. 트랜스포머와 BERT 14
      • 2. 소스코드 특화 사전학습 모델 14
      • 제 4 절 스마트 컨트랙트 취약점 탐지 선행 연구 15
      • 1. 전통적인 프로그램 분석 기반 탐지 15
      • 2. 딥러닝 기반 탐지 16
      • 제 5 절 선행 연구의 한계 및 연구 방향 18
      • 제 3 장 취약점 탐지 모델 개발 연구 방법 19
      • 제 1 절 전체 연구 프레임워크 19
      • 제 2 절 데이터 준비 21
      • 1. 데이터 수집 및 분석 21
      • 2. 데이터 전처리 23
      • 제 3 절 실험 모델 설계 26
      • 1. 사전학습 모델 대상 선정 27
      • 2. 분류기(Classifier) 구조 31
      • 3. 청크 단위 예측 집계 방식 33
      • 제 4 절 실험 절차 및 평가 38
      • 1. 실험 환경 및 하이퍼파라미터 38
      • 2. 학습 및 평가 절차 39
      • 3. 평가지표 정의 40
      • 제 5 절 취약점 특화 모델링 41
      • 1. 특화 대상 취약점 및 데이터셋 구성 42
      • 2. 특화 모델 학습 방법 43
      • 3. 평가 방법 및 비교 대상 44
      • 제 4 장 실험 결과 및 분석 45
      • 제 1 절 실험 개요 45
      • 제 2 절 학습 안정성 검증 46
      • 제 3 절 탐지 모델 성능 비교 분석 48
      • 1. 전체 성능 비교 48
      • 2. 집계 방식의 영향 분석 52
      • 3. 운영 지표 관점 비교 54
      • 제 4 절 취약점 특화 모델 성능 평가 56
      • 1. 실험 설정 및 비교 대상 56
      • 2. 특화 성능 분석: 목표 취약점에서의 개선 효과 57
      • 3. 일반화 성능 분석: 특화 학습의 영향 58
      • 제 5 절 사례 분석 60
      • 제 5 장 결론 66
      • 제 1 절 연구 요약 및 주요 결과 66
      • 제 2 절 연구의 의의 및 시사점 67
      • 제 3 절 향후 연구 방향 68
      • 참고문헌 70
      • Abstract 76
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼