http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
funcGNN과 Siamese Network의 코드 유사성 분석 성능비교
최동빈,조인수,박용범,Choi, Dong-Bin,Jo, In-su,Park, Young B. 한국반도체디스플레이기술학회 2021 반도체디스플레이기술학회지 Vol.20 No.3
As artificial intelligence technologies, including deep learning, develop, these technologies are being introduced to code similarity analysis. In the traditional analysis method of calculating the graph edit distance (GED) after converting the source code into a control flow graph (CFG), there are studies that calculate the GED through a trained graph neural network (GNN) with the converted CFG, Methods for analyzing code similarity through CNN by imaging CFG are also being studied. In this paper, to determine which approach will be effective and efficient in researching code similarity analysis methods using artificial intelligence in the future, code similarity is measured through funcGNN, which measures code similarity using GNN, and Siamese Network, which is an image similarity analysis model. The accuracy was compared and analyzed. As a result of the analysis, the error rate (0.0458) of the Siamese network was bigger than that of the funcGNN (0.0362).
데이터 정제의 관점에서 본 한국문집총간 XML 문서 검토
최지연 ( Choi¸ Ji Yeon ),조성덕 ( Cho¸ Sung Duk ),최동빈 ( Choi¸ Dong Bin ) 근역한문학회 2021 한문학논집(漢文學論集) Vol.60 No.-
정보화 기술이 고도화됨에 따라 단순한 데이터베이스의 서비스보다 DB의 재가공 또는 DB 융합 서비스 등 다양한 형태의 정보 서비스 방식이 요구되고 있다. 본고는 데이터 정제의 관점에서 현재 구축된 한국 고전 데이터베이스 가운데 한국고전종합 DB의 한국문집총간 XML 문서를 검토하였다. 한국문집총간은 한국고전번역원이 삼국 시대부터 대한제국 말기까지 저작된 한국의 문집 중에서 주요 문집을 선정하고, 표점·영인하여 간행한 것으로, 한국고전번역원은 지난 1999년부터 2021년까지 전체 1,259종 500책에 대한 DB 구축 사업을 진행하였다. 본 연구진은 한국문집총간 DB를 기초데이터로 사용하는 과제를 진행하면서 한국문집총간 XML 문서를 검토하였다. 데이터 정제에 영향을 주는 장애요인을 ‘페이지 번호 불일치’, ‘데이터 추가’, ‘데이터 누락’, ‘원문 이미지와 XML 한자의 불일치’의 네가지로 나누고 그 원인을 고찰해 보았다. 본고에서 살펴본 한국문집총간 XML에 대한 논의가 신뢰도 높은 데이터를 구축하는 데 도움이 되기를 기대한다. From the perspective of data reprocessing, this paper intends to review the XML document of the Korean Anthologies Collection Database among the oriental classic databases currently constructed. 'Korean Anthologies Collection' is a book published by the Institute for the Translation of Korean Classics, from the Three Kingdoms Period to the end of Joseon Dynasty by selecting and imprinting major collections of Korean literature. From 1999 to 2021, the establishment of a database (DB) for a total of 500 books of 1,259 species was completed. The researchers divided the types of errors found in the process of reprocessing and using the DB between Korean literature as basic research data into four categories: page number mismatch, data addition, data omission, and, mismatched XML Chinese characters. As information technology is advanced, various types of information service methods such as reprocessing DB or DB convergence service are required rather than simple database services. We hoped that the discussion on XML between the Korean Anthologies Collection examined in this paper will help build reliable research data.
Mask R-CNN 과 zi2zi 모델을 활용하여 탐지된 객체의 스타일을 변환시키는 신경망 모델
조인수 ( In-su Jo ),최동빈 ( Dong-bin Choi ),박용범 ( Young B. Park ) 한국정보처리학회 2021 한국정보처리학회 학술대회논문집 Vol.28 No.2
스타일 변환 모델은 이미지 전체나 이미지 내에서 사용자가 지정한 영역을 대상으로 스타일을 변환시킨다. 이런 방식은 이미지 내의 다수의 객체에 대해 스타일 변환을 시행할 때 일일이 영역을 지정해 줘야 한다는 불편함과 결과물의 전체 해상도가 떨어진다는 한계를 가지고 있다. 본 논문에서는 이런 한계들을 극복하기 위해 객체탐지 모델과 스타일변환 모델을 연동한 객체스타일변환모델을 제안하고 모델 간 연동방법에 대해 자세히 서술한다. 객체탐지모델인 Mask R-CNN 을 통해 필요한 객체를 탐지하고 탐지한 객체의 특징맵들을 스타일변환 모델인 zi2zi 의 입력 값으로 전달하여 이미지 내의 필요한 객체들만 스타일변환이 이루어지도록 모델이 동작한다. 이러한 모델은 기존에 있는 두 모델을 재사용함으로써 모델을 처음부터 새로 설계할 필요가 없다는 장점이 있으며, 공개된 다양한 모델들을 서로 융합하여 사용할 수 있는 방법을 제시하는데 도움을 줄 것이다.
스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석
조인수 ( In-su Jo ),강윤희 ( Yunhee Kang ),최동빈 ( Dong-bin Choi ),박용범 ( Young B. Park ) 한국정보처리학회 2020 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.9 No.12
오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다. In addition to the research on noise removal and super-resolution using the data restoration (Output result) function of Autoencoder, research on the performance improvement of clustering using the dimension reduction function of autoencoder are actively being conducted. The clustering function and data restoration function using Autoencoder have common points that both improve performance through the same learning. Based on these characteristics, this study conducted an experiment to see if the autoencoder model designed to have excellent data recovery performance is superior in clustering performance. Skip connection technique was used to design autoencoder with excellent data recovery performance. The output result performance and clustering performance of both autoencoder model with Skip connection and model without Skip connection were shown as graph and visual extract. The output result performance was increased, but the clustering performance was decreased. This result indicates that the neural network models such as autoencoders are not sure that each layer has learned the characteristics of the data well if the output result is good. Lastly, the performance degradation of clustering was compensated by using both latent code and skip connection. This study is a prior study to solve the Hanja Unicode problem by clustering.