http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
BERT와 GPT2를 이용한 한국사 질의응답 및 문제 생성 시스템
조우성(Wooseong Cho),오한석(Hanseok Oh),이재준(Jaejun Lee),이현아(Hyunah Lee) 한국정보기술학회 2021 Proceedings of KIIT Conference Vol.2021 No.11
본 논문에서는 한국민족문화대백과사전과 KorQuAD 1.0 데이터집합에 Transformer 방식을 이용한 encoder인 BERT 와 decoder인 GPT2를 적용하여 한국사 Q&A와 Quiz를 자동 생성하는 시스템을 제안한다. 시스템은 자동 생성된 Quiz를 시스템의 Q&A 시스템에 적용하여 검증한다. 한국사 문서에 나타나는 고유명사들의 적절한 분석을 보장하기 위해 사용자 사전과 SentencePiece를 한 활용한 Tokenizer 적용하여 성능 향상을 얻었다. In this paper, we propose a Korean history Q&A and automatic quiz generating system utilizing a Transformer based encoder BERT and a decoder GPT2 based on the Encyclopedia of Korean Culture and the KorQuAD 1.0 data set. Our system verify quizzes when generating them. Our system verifies automatically generated quizzes by applying our system"s Q&A. To ensure proper analysis of proper nouns appearing in Korean history documents, we build a custom tokenizer using a user dictionary and a SentencePiece and obtain performance improvement.