RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      건설현장 인근 보행 안전 객체 인식을 위한 비전-언어 모델 기반 의사 라벨 생성 자동화

      한글로보기

      https://www.riss.kr/link?id=T17371137

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      건설 현장 주변의 보행자 안전을 확보하기 위해서는 현장 주변의 보행을 방해하는 장애물을 정기적으로 점검해야 하지만, 기존의 점검 방식은 인력 의존도가 높고 많은 시간이 소요된다. 이러한 한계를 해결하기 위해, 본 연구는 개방형 어휘 기반 비전-언어 분할(open- vocabulary vision-language segmentation)과 퓨샷 필터링(Few-shot filtering)을 결합하여, 건설현장 인근 보행로 사진에서 보행 장애물의 의사 라벨(pseudo-label) 데이터셋을 자동으로 생성하는 프레임워크를 제안한다. 제안된 프레임워크는 Autodistill 기반의 예측 결과 중 신뢰도가 낮은 출력을 자동으로 제거하고, 의미적으로 일관된 마스크와 의사 라벨 쌍 만을 선별하여 데이터셋을 구축하도록 설계되었다. 실험 결과, 본 프레임워크는 총 4,959 장의 스트리트 뷰(Street-view) 영상을 약 30 분 이내에 처리하여 10,000 개 이상의 분할 마스크를 생성하였으며, 최소한의 인적 개입만으로도 높은 처리 효율을 달성하였다. 성능 평가의 측면으로는 조화평균(F1)의 평균 점수가 36.5% 향상되었으며, 특히 펜스, 트래픽콘 등 건설 분야 특화 클래스에서 두드러진 성능 향상을 보였다. 결과적으로 본 연구는 건설 관련 보행자 안전 리스크 감사를 위한 확장 가능하고 노력 부담이 적은 데이터셋 구축 방식을 제시하며, 관리자들이 다양한 환경에서 보행로 모니터링을 강화할 수 있는 실질적 도구를 제공한다. 주제어: 비전-언어 모델, 퓨샷 필터링, 개방형 어휘 분할, 의사 라벨 생성, 보행자 안전
      번역하기

      건설 현장 주변의 보행자 안전을 확보하기 위해서는 현장 주변의 보행을 방해하는 장애물을 정기적으로 점검해야 하지만, 기존의 점검 방식은 인력 의존도가 높고 많은 시간이 소요된다. 이...

      건설 현장 주변의 보행자 안전을 확보하기 위해서는 현장 주변의 보행을 방해하는 장애물을 정기적으로 점검해야 하지만, 기존의 점검 방식은 인력 의존도가 높고 많은 시간이 소요된다. 이러한 한계를 해결하기 위해, 본 연구는 개방형 어휘 기반 비전-언어 분할(open- vocabulary vision-language segmentation)과 퓨샷 필터링(Few-shot filtering)을 결합하여, 건설현장 인근 보행로 사진에서 보행 장애물의 의사 라벨(pseudo-label) 데이터셋을 자동으로 생성하는 프레임워크를 제안한다. 제안된 프레임워크는 Autodistill 기반의 예측 결과 중 신뢰도가 낮은 출력을 자동으로 제거하고, 의미적으로 일관된 마스크와 의사 라벨 쌍 만을 선별하여 데이터셋을 구축하도록 설계되었다. 실험 결과, 본 프레임워크는 총 4,959 장의 스트리트 뷰(Street-view) 영상을 약 30 분 이내에 처리하여 10,000 개 이상의 분할 마스크를 생성하였으며, 최소한의 인적 개입만으로도 높은 처리 효율을 달성하였다. 성능 평가의 측면으로는 조화평균(F1)의 평균 점수가 36.5% 향상되었으며, 특히 펜스, 트래픽콘 등 건설 분야 특화 클래스에서 두드러진 성능 향상을 보였다. 결과적으로 본 연구는 건설 관련 보행자 안전 리스크 감사를 위한 확장 가능하고 노력 부담이 적은 데이터셋 구축 방식을 제시하며, 관리자들이 다양한 환경에서 보행로 모니터링을 강화할 수 있는 실질적 도구를 제공한다. 주제어: 비전-언어 모델, 퓨샷 필터링, 개방형 어휘 분할, 의사 라벨 생성, 보행자 안전

      더보기

      목차 (Table of Contents)

      • 국문초록 i
      • 목 차 iii
      • 표 목 차 v
      • 그림목차 vi
      • 국문초록 i
      • 목 차 iii
      • 표 목 차 v
      • 그림목차 vi
      • 제 1장 서론 1
      • 제 2장 문헌고찰 5
      • 2.1. 비전-언어 모델과 분할 모델의 구조적 결합 및 라벨 품질 문제
      • 5
      • 2.2. 비전-언어 모델 응용연구와 이미지 분류 기술 8
      • 2.3. 퓨샷 기반 분류 필요성 11
      • 제 3장 연구 방법 13
      • 3.1. 데이터 수집 13
      • 3.2. 분석 대상 객체 선정 16
      • 3.3. 캡션 온톨로지 설계 18
      • 3.4. Autodistill 기반의 의사 라벨 생성 20
      • 3.5. 퓨샷 필터링 적용 절차 21
      • 3.6. 모델 평가 지표 23
      • iv
      • 제 4장 연구 결과 26
      • 4.1. 초기 의사 라벨 생성 결과 26
      • 4.2. 퓨샷 필터링에 따른 의사 라벨 정제 결과 29
      • 4.3. 성능 비교평가 및 처리효율 분석 36
      • 제 5장 고찰 40
      • 5.1. 퓨샷 필터링에 따른 성능 향상 40
      • 5.2. 서포트셋 구성 및 임계값 변화의 영향 분석 41
      • 5.3. 연구의 시사점 및 한계 42
      • 제 6장 보행안전관리 활용방안 44
      • 제 7장 결론 46
      • 참고문헌 48
      • Abstract 53
      • v
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼