http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
김우정,최지연 한국어문교육연구회 2023 어문연구(語文硏究) Vol.51 No.4
김우정․ 최지연, 2023, 인공지능 기반 한자 인식 기술 현황과 과제, 어문연구, 200 : 313~341 디지털 시대에 접어들면서 인문학 분야에 활용할 수 있는 디지털 기술의 개발도 점차 활발해지고 있다. OCR(optical character recognition) 기술도 그 중 하나로 이미지 형태로 정리되어 있는 자료의 디지털화 작업에 매우 유용하게 사용되며 현재 국외뿐 아니라 국내에서도 적극적으로 OCR 기술을 개발되고 있다. 하지만 한문 고문헌의 경우, 판종과 자형이 다양하고 인쇄의 상태도 균일하지 않아 양질의 OCR 결과물을 얻기에 어려운 점이 존재한다. 본 연구는 국내외 한자 OCR 기술의 현황을 살피고 단국대학교에서 개발한 ‘인공지능 기반 한자 인식 기술’의 개발 과정 및 성과를 소개할 것이다. 아울러, 실제 연구 성과를 바탕으로 인문학 분야에서의 기술 활용 방안을 고찰하고 기술의 고도화 방안도 함께 제시하고자 한다. 본고에서 다룬 내용이 학문후속세대의 감소로 어려움을 겪고 있는 인문학계에 영감과 활력을 불어넣는 데 조금이라도 보탬이 되기를 바란다. With the advent of the digital transformation era, the frequency with which data processed by digital technology is used is increasing in the humanities. OCR (Optical Character Recognition) technology is one such digital technology applicable to digitalizing data organized in visual forms frequently used to analyze mass data in the shape of characters, standardizing the shape of the characters and developing Chinese character recognition application. However, in the case of ancient Chinese documents, it is not easy to obtain high-quality OCR results since the plate types and shapes are diverse and the print condition is not uniform. In this paper, we introduce the current status of the development of major Chinese character OCR models in Korea and consider future tasks.