http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
의료 관련 질의응답을 위한 BERT 기반 한국어 QA 모델
권세린(Serin Kwon),정성현(Seonghyeon Jeong),정아연(Ayeon Jeong),조영진(Yeongjin Jo),김지희(Jihie Kim),김광일(Kwangil Kim) 한국정보기술학회 2022 Proceedings of KIIT Conference Vol.2022 No.6
Question Answering(QA)는 자연어 처리 분야에서 활발하게 연구가 되고 있는 주제이다. 따라서 본 연구에서는 ‘질병과 건강’이라는 특정 도메인에 대한 질의에, 자동적으로 답안을 제시하는 한국어 QA 모델을 제시한다. QA 시스템에서는 기존의 KoBERT 시퀀스 모델을 활용했으며, fine-tuning을 위해 KorQuAD 데이터와 질병관리청에서 제공하는 데이터를 KorQuAD 형식으로 수기로 변환한 데이터를 사용했다. 본 연구에서 제안하는 모델은, 기존의 KoBERT 모델과 비교 했을 때, F1 score은 77.49 그리고 Exact Match는 75.00이라는 향상된 성능을 보였다. Question Answering (QA) is a topic that is being actively researched in the field of natural language processing. Therefore, in this study, we propose a Korean QA model that automatically provides answers to questions about a specific domain called ‘disease and health’. In the QA system, we use the existing KoBERT sequence model, and for fine-tuning, KorQuAD data and data provided by the Korea Centers for Disease Control and Prevention were manually converted into KorQuAD format. Compared with the existing KoBERT model, the model proposed in this study showed improved performance with an F1 score of 77.49 and an Exact Match of 75.00.