http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
자동 잔향 편집을 위한 컬러 및 깊이 정보 기반 실내 장면 분류
정민혁,유용현,박성준,황승준,백중환,Jeong, Min-Heuk,Yu, Yong-Hyun,Park, Sung-Jun,Hwang, Seung-Jun,Baek, Joong-Hwan 한국정보통신학회 2020 한국정보통신학회논문지 Vol.24 No.3
영화나 VR 콘텐츠 제작 시 음향에 잔향 효과를 주는 것은 현장감과 생동감을 느끼게 하는데 매우 중요한 요소이다. 공간에 따른 음향의 잔향 시간은 RT60(Reverberation Time 60dB)이라는 표준에서 권고된다. 본 논문에서는 음향 편집 시 자동 잔향 편집을 위한 장면 인식 기법을 제안한다. 이를 위해 컬러 이미지와 예측된 깊이 이미지를 동일한 모델에 독립적으로 학습하는 분류 모델을 설계하였다. 실내 장면 분류는 내부 구조가 유사한 클래스가 존재하여 컬러 정보 학습만으로는 인식률의 한계가 존재한다. 공간의 깊이 정보를 사용하기 위해 딥러닝 기반의 깊이 정보 추출 기술을 사용하였다. RT60을 기반으로 총 10개의 장면 클래스를 구성하고 모델 학습 및 평가를 진행하였다. 최종적으로 제안하는 SCR+DNet(Scene Classification for Reverb+Depth Net) 분류기는 92.4%의 정확도로 기존의 CNN 분류기들보다 더 높은 성능을 달성하였다. The reverberation effect on the sound when producing movies or VR contents is a very important factor in the realism and liveliness. The reverberation time depending the space is recommended in a standard called RT60(Reverberation Time 60 dB). In this paper, we propose a scene recognition technique for automatic reverberation editing. To this end, we devised a classification model that independently trains color images and predicted depth images in the same model. Indoor scene classification is limited only by training color information because of the similarity of internal structure. Deep learning based depth information extraction technology is used to use spatial depth information. Based on RT60, 10 scene classes were constructed and model training and evaluation were conducted. Finally, the proposed SCR + DNet (Scene Classification for Reverb + Depth Net) classifier achieves higher performance than conventional CNN classifiers with 92.4% accuracy.
정민혁(Min Hyuk Jeong),김상균(Sang-Kyun Kim) 한국방송·미디어공학회 2018 한국방송공학회 학술발표대회 논문집 Vol.2018 No.11
본 논문에서는 미디어사물인터넷의 기본적인 기능인 미디어사물을 발견하고 연결하는 과정에 필요한 API 및 프로세스에 대해 설명한다. 또한 미디어사물의 기능, 자원, 데이터를 사용하기 위해 필요한 미디어사물 거래 API와 이의 프로세스를 설명한다. 기본적인 순서로 가장 먼저 미디어사물을 발견할 때, 기능을 기반으로 발견하고 연결하여 해당 기능에 대한 사용권을 선점한다. 미디어사물이 연결된 후에 해당 기능을 사용하는데 필요한 비용에 따라 해당 미디어 토큰을 지불하고, 지불한 만큼의 시간 동안 기능을 사용하는 과정을 시퀸스 다이어그램을 통해 설명하고 각각 필요한 API를 설명한다.