http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
역사 자료 형태분석에서 미등록어 추정과 분석 중의성 해소
방진우 ( Bang Jinwoo ) 동양예학회 2020 東洋 禮學 Vol.44 No.-
역사 자료 말뭉치에 대한 분석은 예전부터 많이 진행되어온 작업이다. 그간 국어사 연구자들은 상당량의 전자화된 국어 역사 자료를 갖고 있었지만 컴퓨터가 인식하고 전산처리를 하여 유용하게 쓰도록 하지는 못하였다. 본 연구에서는 역사 자료 원시 말뭉치 어휘 분석이 가능한 도구의 개발을 목표로 하였다. 어휘적 연구를 목표로 한 역사 자료 형태 분석기를 개발함으로써, 역사 자료 어휘 연구에 활용할 수 있는 어휘자료를 보다 쉽고 빨리 확보할 수 있고 소요되는 비용도 줄일 수 있을 것이다. 이를 위해 본 연구에서는 약 160만 어절의 활자본 고소설 말뭉치와 그를 대상으로 분석한 결과인 형태분석 말뭉치를 1차 자료로 사용하여 사전을 구축하였고 이 구축된 사전으로 어휘 분석 개발을 진행하였다. Research on the historical data corpus has a long history. Although the researchers of the history of Mandarin have mastered a lot of digital Mandarin historical data, they can’t make good use of them through digital operations of computer. This research’s purpose is to research and develop the historical data of the original corpus analysis tool. The R&D of historical data lexical analyzer is not only beneficial for obtaining the vocabulary data which used to research the historical data vocabulary quickly, but can also cut down the expense. To achieve the research purposes above, this research takes the printed ancient novels corpus with almost 1.6 million basic rhythmic units and the analysis result (formal analysis) of it as first data to compile the dictionary, which is the basis of the R&D of vocabulary analysis.