http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
민재옥 ( Jae-ok Min ),박진우 ( Jin-woo Park ),조유정 ( Yu-jeong Jo ),이봉건 ( Bong-gun Lee ),황광수 ( Kwang-su Hwang ),박소희 ( So-hee Park ) 한국정보처리학회 2019 한국정보처리학회 학술대회논문집 Vol.26 No.2
기계독해는(Machine reading comprehension) 사용자 질의에 대한 답변이 될 수 있는 내용을 기계가 문서를 이해하여 추론하는 것을 말하며 기계독해를 이용해서 챗봇과 같은 자동상담 서비스에 활용할 수 있다. 최근 자연어처리 분야에서 많은 성능 향상을 보이고 있는 BERT모델을 기계독해 분야에 적용 할 수 있다. 본 논문에서는 특허상담 분야에서 기계독해 task 성능 향상을 위해 특허상담 코퍼스를 사용하여 사전학습(Pre-training)한 BERT모델과 특허상담 기계학습에 적합한 언어처리 기법을 추가하여 성능을 올릴 수 있는 방안을 제안하였고, 본 논문에서 제안한 방법을 사용하여 특허상담 질의에 대한 답변 결정에서 성능이 향상됨을 보였다.
민재옥,박진우,조유정,이봉건,Min, Jae-Ok,Park, Jin-Woo,Jo, Yu-Jeong,Lee, Bong-Gun 한국정보처리학회 2020 정보처리학회논문지. 소프트웨어 및 데이터 공학 Vol.9 No.4
기계독해는(Machine reading comprehension) 사용자 질의와 관련된 문서를 기계가 이해한 후 정답을 추론하는 인공지능 자연어처리 태스크를 말하며, 이러한 기계독해는 챗봇과 같은 자동상담 서비스에 활용될 수 있다. 최근 자연어처리 분야에서 가장 높은 성능을 보이고 있는 BERT 언어모델은 대용량의 데이터를 pre-training 한 후에 각 자연어처리 태스크에 대해 fine-tuning하여 학습된 모델로 추론함으로써 문제를 해결하는 방식이다. 본 논문에서는 BERT기반 특허상담 기계독해 태스크를 위해 특허상담 데이터 셋을 구축하고 그 구축 방법을 소개하며, patent 코퍼스를 pre-training한 Patent-BERT 모델과 특허상담 모델학습에 적합한 언어처리 알고리즘을 추가함으로써 특허상담 기계독해 태스크의 성능을 향상시킬 수 있는 방안을 제안한다. 본 논문에서 제안한 방법을 사용하여 특허상담 질의에 대한 정답 결정에서 성능이 향상됨을 보였다. MRC (Machine reading comprehension) is the AI NLP task that predict the answer for user's query by understanding of the relevant document and which can be used in automated consult services such as chatbots. Recently, the BERT (Pre-training of Deep Bidirectional Transformers for Language Understanding) model, which shows high performance in various fields of natural language processing, have two phases. First phase is Pre-training the big data of each domain. And second phase is fine-tuning the model for solving each NLP tasks as a prediction. In this paper, we have made the Patent MRC dataset and shown that how to build the patent consultation training data for MRC task. And we propose the method to improve the performance of the MRC task using the Pre-trained Patent-BERT model by the patent consultation corpus and the language processing algorithm suitable for the machine learning of the patent counseling data. As a result of experiment, we show that the performance of the method proposed in this paper is improved to answer the patent counseling query.
특허상담 자동분류의 성능 향상 방안 연구: 트랜스포머 기반 인공지능 모델 버트(BERT)를 활용
노동훈 ( Dong-hun Noh ),민재옥 ( Jae-ok Min ),우소연 ( So-youn Woo ) 한국지식재산연구원 2024 지식재산연구 Vol.19 No.1
특허고객상담은 지식재산권의 창출 및 출원인·권리자의 권익 보호 등을 지원하는 중요한 공공서비스이다. 모든 특허상담 내용은 특허고객을 효과적으로 지원하고 정책적으로 활용하고자 일정한 기준에 따라 분류되고 있다. 2020년까지는 전문상담사가 직접 분류해 왔으나, 2021년부터는 상담 텍스트를 활용하여 TA(Text Analysis)로 자동으로 분류하고 있다. 최근 5년간 상담건 분류 분포를 살펴보면 전문상담사가 분류한 2018~2020년과 TA로 자동분류한 2021~2022년의 분포도가 다소 차이가 나는 것이 관찰되었기에 본 연구에서는 트랜스포머 기반 AI모델인 버트를 활용한 자동분류의 성능 향상방안을 연구하였다. 특허상담 텍스트 데이터와 전문상담사 분류값을 학습데이터로 활용하여 버트를 사전 훈련시키고 특허상담에 맞도록 파인튜닝한 AI 모델을 활용하여 자동분류한 결과 기존 TA보다 분류 분포가 더 유사하게 나타났다. 이를 근거로 추후 특허상담분류버트(가칭)를 특허상담 자동분류에 적용할 때 보다 나은 성능을 기대할 수 있을 것이라 생각된다. 자동분류 결과가 보다 신뢰성 있게 도출되면 전문상담사의 업무부담 완화 및 효율성을 제고하고자 하는 정책적인 목적을 지속적·안정적으로 달성하고 특허고객상담 서비스 현황 및 고객의 니즈를 보다 정확하게 파악할 수 있어 특허고객 서비스 향상에 더 도움이 될 수 있을 것으로 기대된다. Intellectual property customer counseling is an important public service that supports the creation of intellectual property rights and protection of the rights and interests of applicants and rights holders. To effectively support customers and secure the use of counseling content as a policy, counseling contents are classified according to certain criteria. Until 2020, it was professional counselors who directly classified these contents, but 2021 saw a shift toward automatic classification based on text analysis (TA) of the consultation texts. However, an investigation as to the distribution of counseling case classification over the past five years showed some differences between the 2018-2020 distribution, classified by professional counselors, and the 2021-2022 distribution, automatically classified by TA. Therefore, this study investigated how to improve the performance of the automatic classification system using BERT, a transformer-based AI model. After fine-tuning the BERT model, which was pre-trained using patent counseling text data and professional counselor classification values data, it was observed that the BERT’s automatic classification distribution was more similar to that of professional counselors than the classification distribution of the existing TA. These results show that the future application of the “Patent Consultation Classification BERT,” a tentative name for the model, to automatic patent consultation classification may yield a better performance than the current TA method. Furthermore, if the automatic classification results become more reliable through the use of this AI model, the purpose behind the policy for the automation of this procedure―namely easing the burden and improving the efficiency of professional counselors―may be achieved with improved continuity and stability. This may then enable a more accurate identification of the current status of patent customer counseling services and customer needs.