http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
셧 경계 검출 및 카메라 동작 분석을 통한 비디오 자동 파싱 방법
이미숙(Mee-Sook Lee),설상훈(Sanghoon Sull),양윤모(Yoonmo Yang),이성환(Seong-Whan Lee) 한국정보과학회 1998 정보과학회논문지(B) Vol.25 No.8
본문에서는 비디오 파싱을 위한 핵심 기술 중의 하나인 셧 경계 검출과 카메라 동작 분석에 관하여 제안하고, 다양한 비디오 데이타에 대하여 그 성능을 평가해 본다. 제안된 셧 경제 검출 방법에서는 영상 내에서 발생할 수 있는 급격한 명도 변화에 무관하고 영상의 위치 정보를 충분히 활용하기 위하여 부분 영역별 색상 정보를 특징값으로 사용하였으며, 처리 시간의 단축을 위하여 적용적 시간 윈도우를 사용하였다. 그리고 효율적인 영상의 이동 방향 분석을 위하여 시공간 영상을 사용하였으며, 카메라 분석을 위해서는 잡영에 강한 다층 퍼셉트론을 사용하였다. 또한 시공간 영상의 구성에 필요한 처리 시간의 단축을 위하여 전체 프레임에 부분 영역을 배치하고, 각 부분 영역별로 영상 분석을 적용하였다. 제안된 셧 경계 검출 방법의 성능을 평가하기 위하여 뉴스, 다큐멘터리, 영화와 같이 다양한 비디오 데이타에 대하여 실험한 결과, 제안된 셧 경계 검출 방법이 효율적임을 확인할 수 있었다. 또한 카메라 동작 분석의 경우 수평 이동, 수직 이동, 화면의 확대/축소와 같이 단일한 카메라 조작에 의해서 발생한 영상에 대해서는 분석 성능이 우수함을 알 수 있었다. In this paper, we present an efficient video parsing method for automating content-based video indexing and retrieval using shot boundary detection and camera movements analysis technique, and estimate the performance of the proposed method. In the shot boundary detection, the local color information is used in order to eliminate the false detection caused by an abrupt change of illumination and use the spatial information in frames. In order to reduce the computation time in shot boundary detection, an adaptive time window is applied to this procedure The local spatio-temporal images and multilayer perceptron are used for efficiently analyzing the camera movements. It uses the learning algorithm with the spatio-temporal information in frames and does not have to process the entire image, so this method is reliable and fast. In order to verify the performance of the proposed video parsing method, experiments with video database including news, documentary and movies have been carried out. Experimental results demonstrate the efficiency of the video parsing technique. The proposed method detected correctly the simple camera operations such as horizontal, vertical movements and zoom in and out.
이훈재(Hoonjae Lee),설상훈(Sanghoon Sull) 大韓電子工學會 2010 電子工學會論文誌-SP (Signal processing) Vol.47 No.5
최근 카메라가 탑재된 휴대전화가 널리 보급되면서 휴대전화로 촬영한 동영상에서 문자영역을 검출하고 인식하여 사용자에게 유용한 정보를 제공하는 기능에 대한 연구가 활발히 이루어지고 있다. 따라서 휴대전화로 촬영된 동영상에서 문자 영역을 검출하기 위한 방법이 필요하다. 이를 위해 형태학적 연산을 이용하여 전처리를 수행한 다음, 전처리를 수행한 영상에 대해 변형된 k-means 군집화를 이용하여 이진영상을 얻어낸 후, 연결 요소 (Connected component) 분석 및 문자 특성을 이용한 방법들을 적용하여 문자후보 영역을 검출하고, 일정 시간 내 문자 후보 영역의 검출 빈도를 조사하여 문자 영역 검출의 정확도를 높이는 방법을 제안한다. 휴대전화 동영상을 대상으로 한 실험 결과를 통해 제안하는 방법은 정확도와 회수율이 모두 뛰어난 효과적인 문자 영역 검출 방법임을 확인할 수 있다. With the popularization of the mobile phone with a built-in camera, there are a lot of effort to provide useful information to users by detecting and recognizing the text in the video which is captured by the camera in mobile phone, and there is a need to detect the text regions in such mobile phone video. In this paper, we propose a method to detect the text regions in the mobile phone video. We employ morphological operation as a preprocessing and obtain binarized image using modified k-means clustering. After that, candidate text regions are obtained by applying connected component analysis and general text characteristic analysis. In addition, we increase the precision of the text detection by examining the frequency of the candidate regions. Experimental results show that the proposed method detects the text regions in the mobile phone video with high precision and recall.
조용래(Cho Yongrae),설상훈(Sull Sanghoon) 한국방송·미디어공학회 2005 한국방송공학회 학술발표대회 논문집 Vol.2005 No.-
본 논문은 디지털 방송에서 다양한 부가 정보 제공 및 관련 기기의 기능을 효과적으로 활용하기 위한 연구로서, 방송 시스템에서의 방송이나 편집 등을 고려하여 색인 정보를 재사용하는 알고리즘에 관한 것이다. 이를 위해 본 논문에서는 비주얼 리듬을 이용한 원본 영상과 목표 영상의 매칭을 제안하며, 비주얼 리듬의 히스토그램을 특징 벡터로 사용하여 유사도를 계산한다. 검색 시 목표 영상에 대해 우선 검색 구간을 설정하여 검색 시간을 줄이고자 하였으며, 실제 이 알고리즘을 적용한 결과 약 97%의 정확도의 매칭 결과를 보였다. 또한 결과를 시각적으로 쉽게 알 수 있었기에 오류를 수정하는데 수월하였다. 이를 통해 기존의 색인화 정보를 목표 영상의 복호화 작업 없이 쉽게 재사용 할 수 있어, 불필요한 비용의 증가를 방지하는 효과를 기대할 수 있다.
김택수 ( Taeksoo Kim ),정순홍 ( Soonhong Jung ),설상훈 ( Sanghoon Sull ) 한국정보처리학회 2014 한국정보처리학회 학술대회논문집 Vol.21 No.1
감시 카메라 환경에서 자동으로 그룹 행동을 인식하는 기술이 최근 많은 관심을 받고 있다. 본 논문에서 제안하는 그룹 행동 인식 시스템은 다른 추가 정보 없이 비디오 프레임만을 인풋으로 받아들여,자동으로 보행자 탐지,추적,행동 인식까지 모두 포괄하는 시스템이다. 시공간 모션 패턴을 만들고 연결 요소들로 모델링 한 뒤 Hidden Markov Model (HMM)을 이용해 그룹 행동을 인식한다. 실험 결과,기본 논문과 비교하였을 때,비슷한 인식률을 보이면서 수행 시간을 약 25 배 정도로 획 기적으로 단축하였다.
인트라 프레임 예측모드를 이용한 효율적인 공간적 에러 은닉
이기형 ( Gihyung Lee ),김명훈 ( Myounghoon Kim ),설상훈 ( Sanghoon Sull ) 한국정보처리학회 2007 한국정보처리학회 학술대회논문집 Vol.14 No.1
본 논문은 에러블록에 대해 인트라 프레임 예측모드를 이용하여 효율적인 공간적 에러 은닉 방법을 제안한다. 먼저, 에러블록내 픽셀값 복원을 위한 에러블록의 에지방향 예측은 주변 블록의 변환영역 예측모드를 이용한다. 예측된 에러블록의 정확한 에지방향은 인접한 두 에지방향과 비교하여 결정한다. 에러블록의 에지방향 예측을 주변블록의 예측모드를 이용함으로써, 기존의 에지 방향 계산을 단축시킴으로써 효율적인 에러 은닉을 가능하게 한다