http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
Deformable convolutional network를 기반으로 한 Mask R-CNN
김민종(Minjong Kim),이영섭(Youngseop Lee),임창원(Changwon Lim) 한국데이터정보과학회 2020 한국데이터정보과학회지 Vol.31 No.6
객체 탐색은 자율 주행, 실시간 보안, 건설 자동화에서 활용될 수 있는 기술로서 각광 받고 있는 컴퓨터 비전 응용 기술이다. 최근 딥러닝을 기반으로 한 객체 탐색 모델이 등장하였고 딥러닝 기술의 발전과 함께 빠른 속도로 객체 탐색 모델들도 발전하고 있다. 객체 탐색 모델들은 대용량 크기의 입력값인 이미지를 처리하기 위해 공통적으로 CNN (convolutional neural network)를 사용한다. 하지만 CNN은 객체의 크기에 상관없이 공통된 필터를 사용하는 문제점이 있다. 본 연구에서는 오프셋 (offset)을 이용해 객체에 대응하는 필터를 만드는 Deformable convolutional network를 Mask R-CNN에 적용해 합성곱 네트워크의 문제점을 해결하고 객체 탐색 알고리즘의 정확도를 높이는 방법을 제안하고자 한다. 제안된 방법은 Pascal VOC와 COCO 데이터를 이용해 성능실험을 수행하였고, 기존의 Mask R-CNN 방법보다 성능이 개선되는 결과를 보였다. Object detection is a computer vision application technology that is in spotlight as a technology that can be used in autonomous driving, real-time security and construction automation. Recently, object detection models based on deep learning has appeared, and object detection models are also developing at a rapid pace with the development of deep learning technology. Object detection models commonly use convolution neural network (CNN) to process a large size of image data. However, CNN has a problem of using a common filter regardless of the size of the object. In this paper, we propose a method to solve the problem of the CNN and improve the accuracy of objection detection algorithm by applying a deformable convolutional network that creates a filter corresponding to an object using an offset to Mask R-CNN. The proposed method is evaluated by an experiment using Pascal VOC and COCO data, and it can be shown that the proposed method outperforms the existing Mask R-CNN method.
세포 계수 측정을 위한 딥러닝 기반 객체 탐지 시스템 연구 개발
한동현(Donghyun Han),김민종(Minjong Kim),김태강(Taekang Kim),박준후(Joonhoo Park),조수빈(Subin Jo),김상진(Sangjin Kim) 한국정보기술학회 2022 Proceedings of KIIT Conference Vol.2022 No.6
본 논문에서는 세포 계수 기술을 활용하여 세포 배양액 사진 속에 있는 세포의 계수 및 Viability를 알려주는 모바일 애플리케이션 서비스를 제안한다. 세포 배양액 사진을 업로드 하면, YOLO-R 모델을 통해 세포 배양액의 영상 속 객체를 탐지하고 그 결과로 Total Cell, Live Cell, Dead Cell, Cell Viability의 정보를 추출하여 세포 계수 정보를 사용자에게 빠르게 제공할 수 있다. In this paper, we propose a mobile application service that utilizes cell counting techniques to inform the coefficient and viability of cells in a photograph of a cell culture. Uploading a photograph of a cell culture fluid allows the YOLO-R model to detect objects in the image of the cell culture and extract information from Total Cell, Live Cell, Dead Cell, and Cell Visibility as a result to quickly provide cell coefficient information to the user.
이청엽(Chungyup Lee),김민종(Minjong Kim) 대한전자공학회 2021 전자공학회논문지 Vol.58 No.11
제조 설비 기술의 발달로 산업현장에서 불량 데이터 확보가 점차 어려워 데이터 불균형을 야기한다. 머신비전 분야에서는 데이터 불균형 문제를 해결할 수 있는 Autoencoder, GAN 방식의 Unsupervised 이상 탐지 기술이 각광받고 있다. 하지만 Autoencoder, GAN 방식은 학습이 불안정하며, 일반적으로 단순 픽셀 차이를 계산하는 L1, L2 손실 함수를 사용하여 구조적 차이를 판단하기 어렵다. 따라서 동일 클래스에서 비정상 데이터를 탐지하는 Novelty Detection 이상 탐지 분야에 적합하지 않다. 본 연구에서는 복원력을 향상시킬 수 있는 U-Net 기반 복원 네트워크를 사용하고, 동일 클래스에서 Local Region의 구조적 차이를 확인할 수 있는 SSIM, MS-SSIM 손실 함수를 사용한 방법을 제시한다. 해당 방법은 실제 산업현장에서 발생하는 물체의 결함을 판단하는데 사용하는 제조 분야에 특화된 MVTec 데이터를 사용해서 실험을 진행하였고 Autoencoder, GAN 방식 네트워크에서 L1, SSIM, MS-SSIM 손실 함수를 사용하여 성능 비교 실험하였다. Due to the development of manufacturing technology, it is increasingly difficult to gather data flaws in the manufacturing process, leading to imbalanced data. Therefore, Autoencoder and GAN-based unsupervised anomaly detections that solve the problem of imbalanced data are in the spotlight. However, the Autoencoder and GAN-based models are not only unstable during training, but also typically use L1 and L2 loss functions for a per-pixel error, making it harder to distinguish structural differences between input and reconstruction. Consequently, detecting anomalies in the same class is not suitable in novelty anomaly detection fields. In this work, we present a way to take advantage of SSIM, MS-SSIM loss functions on a U-Net network to identify structural differences between local regions in the same class and improve reconstruction stability while training. Utilizing MVTec dataset, which is specialized for manufacturing processes to detect defects, we compared the performances of L1, SSIM, MS-SSIM on Autoencoder, GAN-based networks.