RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      영상 기반 지능형 감시시스템에서의 폭력 행위 탐지 기술 연구 = Research on Violence Detection Technology in Intelligent Visual Surveillance Systems

      한글로보기

      https://www.riss.kr/link?id=T17175927

      • 0

        상세조회
      • 0

        다운로드
      서지정보 열기
      • 내보내기
      • 내책장담기
      • 공유하기
      • 오류접수

      부가정보

      국문 초록 (Abstract) kakao i 다국어 번역

      최근 빈번히 발생 되는 폭력을 동반한 강력 범죄에 대해 사회적 불안감이 고조되면서 범죄 예방을 위한 감시 및 범죄 발생 시 신속한 대처를 위해 CCTV 지능형 영상 감시시스템의 필요성이 증가하고 있다. 영상 분석을 통한 폭력 행위 검출방식 중 하나로 자세 추정 모델을 활용한 행위기반 검출방식이 이용되고 있다. 그러나 자세 추정 모델을 통해 얻은 관절 각도와 변화만으로 폭력 행위를 감지하게 되면, 머리를 쓰다듬는 행위나 hug 동작과 같은 비폭력 장면을 폭력 행위로 오검출하는 문제가 발생할 수 있다.
      본 연구는 자세 추정 모델만을 활용한 행위기반 폭력 검출방식의 오검출 빈도를 감소시키는 데 목적이 있다. 기존의 행위기반 폭력 검출방식인 자세 추정 검출방식에 피격 자로 예상되는 대상의 얼굴 감정 인식 결과(angry, disgust, fear, sad, surprise, happy, neutral)를 조합한 새로운 폭력 검출방식을 제안한다. Youtube video 및 Self-made video로 이루어진 영상 데이터셋에 대해서 자세 추정 모델과 얼굴 감정 인식 결과를 조합하는 방법으로 기존 자세 추정 모델만을 이용한 폭력 검출방식 대비 85% 성능 향상된 92.5%의 정확도를 확인하였다. 본 연구는 인공지능 기반 지능형 영상 감시시스템 개발에 있어 다중 모달리티 접근방식의 효과성을 입증하였다는 점에서 중요한 의의를 가진다. 특히 자세 추정과 감정 인식이라는 서로 다른 특성의 데이터를 결합하여 분석함으로써, 향후 지능형 영상 감시시스템의 새로운 발전 방향을 제시하였다. 향후 연구로는 실제 CCTV 환경에서의 폭력 검출 신뢰도 향상을 위해 실시간 처리 성능 최적화, 다중 객체 트래킹 능력 향상, 그리고 실제 CCTV 환경에서의 장기 필드 테스트를 통한 추가 검증이 필요하다.
      번역하기

      최근 빈번히 발생 되는 폭력을 동반한 강력 범죄에 대해 사회적 불안감이 고조되면서 범죄 예방을 위한 감시 및 범죄 발생 시 신속한 대처를 위해 CCTV 지능형 영상 감시시스템의 필요성이 증...

      최근 빈번히 발생 되는 폭력을 동반한 강력 범죄에 대해 사회적 불안감이 고조되면서 범죄 예방을 위한 감시 및 범죄 발생 시 신속한 대처를 위해 CCTV 지능형 영상 감시시스템의 필요성이 증가하고 있다. 영상 분석을 통한 폭력 행위 검출방식 중 하나로 자세 추정 모델을 활용한 행위기반 검출방식이 이용되고 있다. 그러나 자세 추정 모델을 통해 얻은 관절 각도와 변화만으로 폭력 행위를 감지하게 되면, 머리를 쓰다듬는 행위나 hug 동작과 같은 비폭력 장면을 폭력 행위로 오검출하는 문제가 발생할 수 있다.
      본 연구는 자세 추정 모델만을 활용한 행위기반 폭력 검출방식의 오검출 빈도를 감소시키는 데 목적이 있다. 기존의 행위기반 폭력 검출방식인 자세 추정 검출방식에 피격 자로 예상되는 대상의 얼굴 감정 인식 결과(angry, disgust, fear, sad, surprise, happy, neutral)를 조합한 새로운 폭력 검출방식을 제안한다. Youtube video 및 Self-made video로 이루어진 영상 데이터셋에 대해서 자세 추정 모델과 얼굴 감정 인식 결과를 조합하는 방법으로 기존 자세 추정 모델만을 이용한 폭력 검출방식 대비 85% 성능 향상된 92.5%의 정확도를 확인하였다. 본 연구는 인공지능 기반 지능형 영상 감시시스템 개발에 있어 다중 모달리티 접근방식의 효과성을 입증하였다는 점에서 중요한 의의를 가진다. 특히 자세 추정과 감정 인식이라는 서로 다른 특성의 데이터를 결합하여 분석함으로써, 향후 지능형 영상 감시시스템의 새로운 발전 방향을 제시하였다. 향후 연구로는 실제 CCTV 환경에서의 폭력 검출 신뢰도 향상을 위해 실시간 처리 성능 최적화, 다중 객체 트래킹 능력 향상, 그리고 실제 CCTV 환경에서의 장기 필드 테스트를 통한 추가 검증이 필요하다.

      더보기

      다국어 초록 (Multilingual Abstract) kakao i 다국어 번역

      As social anxiety over violent crimes increases, there is a growing need for CCTV intelligent video surveillance systems for crime prevention and rapid response to criminal incidents. Among the methods of detecting violent behavior through video analysis, pose estimation models are being used for action-based detection. However, when detecting violent behavior solely through joint angles and changes obtained from pose estimation models, false detections can occur in non-violent scenes such as patting someone's head or hugging.
      This study aims to reduce the frequency of false detections in action-based violence detection methods that rely solely on pose estimation models. We propose a new violence detection method that combines facial emotion recognition results (angry, disgust, fear, sad, surprise, happy, neutral) of potential victims with the existing action-based violence detection method using pose estimation. Using a video dataset consisting of YouTube videos and self-made videos, the combination of pose estimation model and facial emotion recognition results showed an accuracy of 92.5%, an 85% improvement compared to the existing violence detection method using only pose estimation models. This study holds significant implications as it demonstrates the effectiveness of a multi-modality approach in developing AI-based intelligent video surveillance systems. In particular, by combining and analyzing data with different characteristics - pose estimation and emotion recognition - it suggests a new direction for the future development of intelligent video surveillance systems. Future research requires optimization of real-time processing performance, improvement of multiple object tracking capabilities, and additional verification through long-term field testing in actual CCTV environments to enhance the reliability of violence detection.
      번역하기

      As social anxiety over violent crimes increases, there is a growing need for CCTV intelligent video surveillance systems for crime prevention and rapid response to criminal incidents. Among the methods of detecting violent behavior through video analy...

      As social anxiety over violent crimes increases, there is a growing need for CCTV intelligent video surveillance systems for crime prevention and rapid response to criminal incidents. Among the methods of detecting violent behavior through video analysis, pose estimation models are being used for action-based detection. However, when detecting violent behavior solely through joint angles and changes obtained from pose estimation models, false detections can occur in non-violent scenes such as patting someone's head or hugging.
      This study aims to reduce the frequency of false detections in action-based violence detection methods that rely solely on pose estimation models. We propose a new violence detection method that combines facial emotion recognition results (angry, disgust, fear, sad, surprise, happy, neutral) of potential victims with the existing action-based violence detection method using pose estimation. Using a video dataset consisting of YouTube videos and self-made videos, the combination of pose estimation model and facial emotion recognition results showed an accuracy of 92.5%, an 85% improvement compared to the existing violence detection method using only pose estimation models. This study holds significant implications as it demonstrates the effectiveness of a multi-modality approach in developing AI-based intelligent video surveillance systems. In particular, by combining and analyzing data with different characteristics - pose estimation and emotion recognition - it suggests a new direction for the future development of intelligent video surveillance systems. Future research requires optimization of real-time processing performance, improvement of multiple object tracking capabilities, and additional verification through long-term field testing in actual CCTV environments to enhance the reliability of violence detection.

      더보기

      목차 (Table of Contents)

      • 제1장 서론 1
      • 1.1 연구 배경 1
      • 1.2 연구 목적 4
      • 제2장 관련 연구 7
      • 2.1 지능형 영상 감시시스템의 이상행동 감지 기법 7
      • 제1장 서론 1
      • 1.1 연구 배경 1
      • 1.2 연구 목적 4
      • 제2장 관련 연구 7
      • 2.1 지능형 영상 감시시스템의 이상행동 감지 기법 7
      • 2.2 자세 추정 기술 기법 8
      • 2.3 감정 인식 기술 기법 12
      • 2.3.1 센서를 이용한 감정 인식 기술 12
      • 2.3.2 영상 기반 감정 인식 기술 13
      • 제3장 딥러닝 기반의 폭력 행위 탐지 기술 17
      • 3.1 전체 시스템 구성도 18
      • 3.2 자세 추정 기반 폭력 검출 19
      • 3.3 IoU 기반 폭력 검출 30
      • 3.4 얼굴 감정 인식 31
      • 제4장 실험 결과 35
      • 4.1 실험 환경 35
      • 4.2 비교 실험 41
      • 4.3 정성적 평가 41
      • 4.4 정량적 평가 44
      • 제5장 결론 47
      • 참고문헌 50
      • 영문초록 55
      더보기

      분석정보

      View

      상세정보조회

      0

      Usage

      원문다운로드

      0

      대출신청

      0

      복사신청

      0

      EDDS신청

      0

      동일 주제 내 활용도 TOP

      더보기

      주제

      연도별 연구동향

      연도별 활용동향

      연관논문

      연구자 네트워크맵

      공동연구자 (7)

      유사연구자 (20) 활용도상위20명

      이 자료와 함께 이용한 RISS 자료

      나만을 위한 추천자료

      해외이동버튼