http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
윤용욱(Yong-Uk Yoon),한규웅(Gyu-Woong Han),김동하(Dong-Ha Kim),김재곤(Jae-Gon Kim) 한국방송·미디어공학회 2022 한국방송공학회 학술발표대회 논문집 Vol.2022 No.11
최근 인공지능 기술을 바탕으로 지능형 분석을 수행하는 기계를 위한 비디오 부호화 기술의 필요성이 요구되면서, MPEG 에서는 VCM(Video Coding for Machines) 표준화를 시작하였다. VCM 에서는 기계를 위한 비디오/이미지 압축 또는 비디오/이미지 특징 압축을 위한 다양한 방법이 제시되고 있다. 본 논문에서는 객체추적(object tracking)을 위한 머신비전(machine vision) 네트워크에서 추출되는 다중스케일(multi-scale) 특징의 효율적인 압축 기법을 제시한다. 제안기법은 다중스케일 특징을 단일스케일(single-scale) 특징으로 차원을 축소하여 형성된 특징 시퀀스를 최신 비디오 코덱 표준인 VVC(Versatile Video Coding)를 사용하여 압축한다. 제안기법은 VCM 에서 제시하는 기준(anchor) 대비 89.65%의 BD-rate 부호화 성능향상을 보인다.
VCM 을 위한 BACKBONE 분할포인트의 다중스케일 특징 압축 기법
윤용욱(Yong-Uk Yoon),한규웅(Gyuwoong Han),이주영(Jooyoung Lee),정세윤(Seyoon Jeong),김재곤(Jae-Gon Kim) 한국방송·미디어공학회 2023 한국방송공학회 학술발표대회 논문집 Vol.2023 No.6
MPEG 에서는 머신비전 응용의 증가에 따라 기계를 위한 보다 효율적인 비디오 부호화를 위한 VCM(Video Coding for Machines) 표준을 개발하고 있다. 최근 MSFC(Multi-Scale Feature Compression)기반의 특징 압축 기술이 높은 성능을 보여주고 있다. 본 논문은 객체추적(object tracking) 머신비전 네트워크의 BACKBONE 분할 포인트로부터 추출되는 다중스케일(multi-scale) 특징에 맞는 MSFC 네트워크를 구성하여 압축 성능을 확인한다. 제안기법은 VCM 에서 제시하는 특징기준성능(feature anchor) 대비 최대 97.90% BD-rate 부호화 성능향상을 보여준다.
윤용욱(Yong-Uk Yoon),김재곤(Jae-Gon Kim) 한국방송·미디어공학회 2020 한국방송공학회 학술발표대회 논문집 Vol.2020 No.11
방대한 비디오 데이터의 지능형 분석을 수행하는 기계를 위한 비디오 부호화 기술의 필요성이 대두되면서 MPEG 에서는 VCM(Video Coding for Machine) 표준화를 시작하였다. VCM 은 지능형 머신(machine)의 임무 수행을 위한 비디오 또는 비디오 특징(feature)의 압축 표준 기술로 기술 탐색 단계의 표준화를 진행하고 있다. 본 논문에서는 머신비전(machine vision) 네트워크에서 추출되는 대용량의 특징 압축을 위한 전처리 단계로 보다 효과적인 특징 표현 방법을 제시한다. 제안하는 특징 표현 방법은 정규화, 양자화 과정을 거쳐 특징 데이터 크기를 감소시킨다. 실험에서 특징을 4 개의 값으로 양자화 했을 때, 원본 대비 16 배의 데이터 크기가 감소되지만 mAP 평가 성능은 35.4592 로 높은 수준으로 유지함을 확인하였다.