http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
유광현(GwangHyun Yu),당탄부(Dang Thanh Vu),르호앙안(Le Hoang Anh),김진영(JinYoung Kim) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
질 좋은 수면을 위한 다양한 어플리케이션에 사용되는 수면 중 코골이 탐지를 위한 알고리즘을 위하여 코골이 소리에 대해서 전통적인 머신러닝 기반 모델 및 딥러닝 기반 모델에 적합한 오디오 특징 추출 방법을 제시하고 딥러닝 기반 코골이 탐지모델을 제안한다. 이를 위하여 성인 남성 6명의 자체 코골이 데이터셋을 수집하였고, 이를 특징 추출에 효과적으로 사용하기 위한 전처리 방법을 제안한다. 데이터셋은 머신러닝 기반 모델에 사용될 수 있는 코골이 MFCC 특징 추출 방법과 딥러닝 기반 모델에 사용할 수 있는 코골이 멜 스펙트로그램 특징 추출 방법을 적용하였고, Resnet 모델을 기반으로 코골이 탐지 딥러닝 모델을 구현하여 실험하였다. 실험 결과 코골이 멜 스펙트로그램 특징 추출과 딥러닝 기반 코골이 탐지 모델을 적용했을 때 코골이 탐지 인식률은 98.6%로 다른 특징 추출 방법과 머신러닝 기반 모델을 적용할 때보다 좋은 성능을 보였다.
배지훈(Jihoon Bae),당탄부(Dang Thanh Vu),김진영(JinYoung Kim) 한국통신학회 2022 한국통신학회 학술대회논문집 Vol.2022 No.2
본 논문은 Graph Neural Network(GNN)기반 이미지 분류(Image Classification)방법을 제시하고 그 결과를 나타낸다. 우리는 먼저 SLIC 알고리즘을 사용하여 원본 이미지를 슈퍼픽셀 이미지로 변환한다. 그리고 각 슈퍼픽셀 영역을 노드로, 주변픽셀들을 엣지로 연결시키어 그래프를 생성하는 Region Adjacency Graph(RAG) 알고리즘을 적용한 뒤 GNN에 통과시켜 이미지 분류를 수행한다. 우리는 Graph Attention Network(GAT)모델을 사용하여 MNIST, FashionMNIST, CIFAR10 데이터셋으로 실험하였고, 결과분석 및 CGAT(Convolution Graph Attention Network)를 새로 제안하며 발전방향을 제시한다.
이주환(Lee Ju-Hwan),당탄부(Dang Thanh Vu),배지훈(Bae Ji Hoon),김진영(Kim Jin Young) 한국정보기술학회 2021 Proceedings of KIIT Conference Vol.2021 No.6
본 연구는 광범위한 컴퓨터 비전 문제를 성공적으로 해결한 새로운 아키텍쳐인 Visual Transformer(ViT)를 사용하여 단일 이미지로부터 깊이 정보를 추정하는 새로운 접근 방식을 제안한다. 인코더의 자기주의 메커니즘을 통해 모델은 넓은 이미지 영역에서 깊이 정보를 고려하는 여러 이미지 패치 간의 상관관계를 확인한다. 상대적으로 전역 인식에 집중하는 자기주의의 국소 영역 인식 성능 개선을 위해서 다중스케일 기반 특징맵을 학습하여 깊이 정보를 추정한다. 논문에서 제안한 프레임워크는 간단하면서도 효과적이며 단일 ViT를 사용한 모델보다 성능이 우수하다. 정량적, 정성적 결과는 디코더의 추가적인 특징을 학습한 네트워크가 다양한 평가지표, 시각화 측면에서 개선된 성능을 보여준다. In this study, we proposes a new approach to estimating depth information from a single image using Visual Transformer (ViT), a new architecture that successfully solves a wide range of computer vision problems. Through the encoder"s self-attention mechanism, the model verifies the correlation between multiple image patches that take depth information into account over a large image area. In order to improve the local area recognition performance of global recognition through self-attention, depth information is estimated by learning multi-scaling based feature maps. The framework proposed in the paper is simple and effective, and has better performance than a model using only ViT. Quantitative and qualitative results show that the network learning additional features of the decoder has improved performance in terms of various evaluation indicators and visualization.
유광현(Gwanghyun Yu),이재원(Jaewon Lee),보호앙트롱(Vo Hoang Trong),당탄부(Dang Thanh Vu),후이트완녁(Huy Toan Nguyen),이주환(JooHwan Lee),신도성(Dosung Shin),김진영(Jinyoung Kim) 한국정보기술학회 2019 한국정보기술학회논문지 Vol.17 No.12
Weeds are a major object which is very harmful to crops. To remove the weeds effectively, we have to classify them accurately and use herbicides. As computing technology has developed, image-based machine learning methods have been studied in this field, specially convolutional neural network(CNN) based models have shown good performance in public image dataset. However, CNN with numerous training parameters and high computational amount. Thus, it works under high hardware condition of expensive GPUs in real application. To solve these problems, in this paper, a hierarchical architecture based deep-learning model is proposed. The experimental results show that the proposed model successfully classify 21 species of the exotic weeds. That is, the model achieve 97.2612% accuracy with a small number of parameters. Our proposed model with a few parameters is expected to be applicable to actual application of network based classification services.