http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
딥러닝 기반 초해상화 모델을 이용한 드론 사진의 해상도 향상 연구
유수홍(Yoo, Suhong),김필립(Kim, Phillip),윤준희(Youn, Junhee) 한국측량학회 2023 한국측량학회지 Vol.41 No.6
단순한 지형지물 추출을 넘어 자연과 사람 간 사회경제적 기능 분석을 진행하기 위해서는 고해상 영상을 활용하는 것이 필수적이다. 고해상 위성 영상 및 항공 영상을 이용할 수 있으나, 경제적 부담으로 인해 지속적인 데이터 취득이 어렵기에, 취득이 비교적 쉬운 원격탐사 영상에 대해 딥러닝 기반의 초해상화 기술을 적용하여 영상의 해상도를 향상하는 방안이 해결책으로 제시되고 있다. 본 연구에서는 고해상과 경제성을 동시에 확보할 수 있는 드론 영상에 대해 초해상화를 통해 영상의 해상도를 향상하였으며, 이는 크기가 매우 작은 사물에 대해서도 탐지 신뢰도를 높이기 위함이다. 본 연구에서는 각종 벤치마크에서 좋은 성능을 보인 EDSR과 SRGAN 모델을 사용하였으며, 학습 데이터는 한국건설기술연구원에서 보유하고 있는 드론과 카메라 장비를 이용하여 촬영 후, 직접 제작하여 실험에 활용하였다. PSNR과 SSIM을 사용하여 최종 결과물에 대한 품질 평가를 진행한 결과, EDSR은 34.24dB의 PSNR 수치와 0.938의 SSIM 수치를 가지는 것으로 나타났으며, SRGAN의 경우에는 각각 36.63dB과 0.954인 것으로 나타나 SRGAN의 성능이 가장 좋은 것으로 나타났다. 이는 벤치마크에 언급된 수치보다도 더 높은 수치이며, 직접 제작한 초해상화 학습 데이터가 신경망 모델에 적합한 정보를 제공했기 때문으로 판단된다. 본 연구의 성과는 탐지 인식률을 향상하기 위한 후속 연구에 적합한 정보를 제공할 수 있는 수준의 결과인 것으로 판단된다. In order to go beyond simple geographic feature extraction and analyze socioeconomic functions between nature and people, it is essential to use high-resolution images. High-resolution satellite and aerial images can be used, but continuous image acquisition is problematic due to economic burden. Therefore, a solution is proposed to improve the resolution of images by applying deep learning-based super-resolution technology to remote-sensing images that are relatively easy to acquire. In this study, to increase detection reliability even for small objects, the resolution of drone images that can secure high resolution and economic efficiency was improved through super-resolution. This study used EDSR (Enhanced Deep Residual Networks for Single Image Super-Resolution) and SRGAN (Super Resolution GAN) models that showed good performance in various benchmarks were used, and the training dataset was acquired using drones and camera equipment owned by the KICT (Korea Institute of Civil Engineering and Building Technology), then produced directly and used for experiments. Quality evaluation of the final result was performed using PSNR (Peak Signal-to-Noise Ratio) and SSIM (Structural Similarity Index). As a result of the experiment, EDSR was found to have a PSNR value of 34.24dB and an SSIM value of 0.938, and SRGAN was found to have 36.63dB and 0.954, respectively, showing that SRGAN had the best performance. The values obtained are higher than those cited in the benchmark, which is attributed to the super-resolution training data produced by KICT, providing suitable information for the neural network model. The outcomes of this study are considered to be of sufficient quality for application in subsequent research aimed at enhancing detection and recognition rates.
딥러닝 기반 의미론적 분할 기법을 통한 건물 자동추출 연구: 모델의 가중치 경중과 전이학습에 따른 정확도 변화 중심으로
유수홍(Yoo, Suhong),손홍규(Sohn, Hong-Gyoo) 한국측량학회 2023 한국측량학회지 Vol.41 No.6
건물 객체는 3차원 모델링, 도시확장 및 환경 분석 등의 분야에 활용될 수 있는 중요한 공간정보 자료원으로, 지속적인 정보 구축이 중요하나 자동으로 구축하기가 쉽지 않은 지형지물 중 하나이다. 이를 해결하는 방안으로 무거운 신규 신경망을 개발하거나 전이학습을 활용하는 방안들이 제시되고 있으나, 여전히 한계가 있다. 이에, 본 연구에서는 가중치의 경중에 따른 모델의 분류 성능과 ImageNet 가중치를 이용한 전이학습 기법이 원격탐사 분야에서의 활용 가능성을 파악하기 위한 실험을 진행하였다. 이를 위해 AiHub의 토지피복지도 학습 데이터를 사용하였으며, MobileNet, ResNet을 백본 신경망으로 사용한 U-Net과 Deeplab V3+ 분류 모델을 활용하였다. 실험 결과, MobileNet기반의 U-Net 모델로 전이학습을 진행하지 않았을 때, 분류정확도가 가장 높은 것으로 나타났으며(f1-score: 0.8483), 시각적으로도 전이학습이 아닌 처음부터 학습시킨 모델이 더 참값에 가깝게 건물을 묘사하는 것으로 확인되었다. 이는 전이학습을 수행하기 위해 신경망을 국한할 필요 없이 다양한 방법을 활용할 수 있다는 의미이며, AiHub에서 제공하는 수준의 데이터 양이 있다면 일정 수준 이상의 분류정확도를 가지는 모델을 제작할 수 있음을 시사한다. Building objects are an essential spatial information source that can be used in fields such as 3D modeling, urban expansion, and environmental analysis. They are one of the geographical features for which continuous information construction is essential but are not easy to construct automatically. As a solution to this problem, methods have been proposed to develop new heavy neural networks or utilize transfer learning, but there are still limitations. This study conducted an experiment to determine the models classification performance according to the weight and the possibility of using the transfer learning technique using ImageNet weights in remote sensing. For this purpose, AiHubs land cover map learning dataset was used, and U-Net and Deeplab V3+ classification models using MobileNet and ResNet as backbone neural networks were utilized. As a result of the experiment, the classification accuracy was found to be highest when transfer learning was not performed with the MobileNet-based U-Net model (f1-score: 0.8483). Additionally, visually, it was confirmed that the model learned from scratch rather than transfer learning depicted the building closer to the ground truth. This means that a variety of methods can be used to perform transfer learning without the need to limit the neural network, and it suggests that if there is an amount of data at the level provided by AiHub, a model with a certain level of classification accuracy can be created.
SpaceNet 건물 데이터셋과 Context-based ResU-Net을 이용한 건물 자동 추출
유수홍 ( Suhong Yoo ),김철환 ( Cheol Hwan Kim ),권영목 ( Youngmok Kwon ),최원준 ( Wonjun Choi ),손홍규 ( Hong-gyoo Sohn ) 대한원격탐사학회 2022 大韓遠隔探査學會誌 Vol.38 No.5
건물 정보는 다양한 도시 공간 분석에 활용되는 필수 정보 중 하나이기에 지속적인 모니터링이 필요하지만 현실적으로 어려움이 존재하고 있다. 이를 위해 광범위한 지역에 대해서도 지속적인 관찰이 가능한 위성 영상으로부터 건물을 추출하기 위한 연구가 진행되고 있으며, 최근에는 딥러닝 기반의 시맨틱 세그멘테이션 기법들이 활용되고 있다. 본 연구에서는 SpaceNet의 건물 v2 무료 오픈 데이터를 이용하여 30 cm 급Worldview-3 RGB 영상으로부터 건물을 자동으로 추출하기 위해, context-based ResU-Net의 일부 구조를 변경하여 학습을 진행하였다. 분류 정확도 평가 결과, f1-score가 2회차 SpaceNet 대회 수상작의 분류 정확도보다 높은 것으로 나타났다. 앞으로 지속적으로 Worldview-3 위성 영상을 확보할 수 있다면 본 연구의 성과를 활용하여 전세계 건물 자동 추출 모델을 제작하는 것도 가능할 것으로 판단된다. Building information is essential for various urban spatial analyses. For this reason, continuous building monitoring is required, but it is a subject with many practical difficulties. To this end, research is being conducted to extract buildings from satellite images that can be continuously observed over a wide area. Recently, deep learning-based semantic segmentation techniques have been used. In this study, a part of the structure of the context-based ResU-Net was modified, and training was conducted to automatically extract a building from a 30 cm Worldview-3 RGB image using SpaceNet’s building v2 free open data. As a result of the classification accuracy evaluation, the f1-score, which was higher than the classification accuracy of the 2nd SpaceNet competition winners. Therefore, if Worldview-3 satellite imagery can be continuously provided, it will be possible to use the building extraction results of this study to generate an automatic model of building around the world.
배준수(Junsu Bae),유수홍(Suhong Yoo),이지상(Jisang Lee),손홍규(Hong-Gyoo Sohn) 대한공간정보학회 2018 한국지형공간정보학회 학술대회 Vol.2018 No.5
초분광 영상은 초분광 카메라로부터 얻어진 영상을 말하며, 파장 폭이 좁은 연속적인 분광 밴드들로 구성되어 있어 많은 연구 분야에 사용되고 있다. 본 연구에서는 기존에 도출되었던 식생지수들을 초분광 영상에 적용하여 보았고, 또한 히스토그램 분석을 통하여 다른 파장 대역를 이용하여 식생지수를 구현해 보았다. 영상에 따라 기존에 도출된 식생지수들이 적합하지 않은 것들이 존재하였고, 히스토그램 분석을 통해 산출된 식생지 수는 모든 영상의 식생들을 모두 탐지하였다.