http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
한글 말뭉치를 이용한 한글 표절 탐색 모델 개발 (pp.231-235)
류창건(Ryu Chang-keon),김형준(Kim Hyong-Jun),조환규(Cho Hwan-Gue) 한국정보과학회 2008 정보과학회 컴퓨팅의 실제 논문지 Vol.14 No.2
최근 들어 각종 창작물에 대한 표절 사건이 빈번하게 발생하고 있다. 특히 문서들 간의 표절은 현재 많은 이슈가 되고 있다. 영어에 관한 표절연구는 서양에서 오래전부터 이뤄져 왔지만 한글은 구조적인 어려움으로 인해 아직 많은 연구가 이뤄지지 않고 있다. 한글은 영어와 구조적인 특징이 많이 다르기 때문에 영어기반의 탐색 기법을 한글 문서에 적용하기는 어렵다. 본 논문에서는 한글의 특성에 맞는 새로운 표절 탐색 기법을 소개하고 한글 말뭉치를 이용하여 그 성능을 실험해본다. 제안된 기법은 “k-mer”와 “지역정렬” 방법을 기반으로, 문서들 간의 표절구간을 매우 빠르고 정확하게 찾아낸다. 또한 우리는 천만어절 이상의 크기를 가진 한글 말뭉치를 이용하여 표절이 일어나지 않은 일반적인 문서에서 우연히 나타나게 될 유사 확률에 관한 모형을 만들었다. 시스템을 이용하여 성능을 측정해 본 결과, 표절 문서를 매우 정확하게 찾는 것을 알 수 있었다. Recently we witnessed a few scandals on plagiarism among academic paper and novels. Plagiarism on documents is getting worse more frequently. Although plagiarism on English had been studied so long time, we hardly find the systematic and complete studies on plagiarisms in Korean documents. Since the linguistic features of Korean are quite different from those of English, we cannot apply the English-based method to Korean documents directly. In this paper, we propose a new plagiarism detecting method for Korean, and we throughly tested our algorithm with one benchmark Korean text corpus. The proposed method is based on "k-mer" and "local alignment" which locates the region of plagiarized document pairs fast and accurately. Using a Korean corpus which contains more than 10 million words, we establish a probability model for local alignment score (random similarity by chance). The experiment has shown that our system was quite successful to detect the plagiarized documents.
계산사진학 평가용 데이터를 위한 디지털 사진 저장소의 설계
장철진(Chuljin Jang),류동성(Dong-Sung Ryu),김형준(Hyong-Jun Kim),류창건(Chang-Keon Ryu),지승현(Seung-Hyun Ji),조환규(Hwan-Gue Cho) 한국정보과학회 2008 한국정보과학회 학술발표논문집 Vol.35 No.2
본 논문에서는 다양한 종류의 평가 데이터가 요구되는 계산사진학의 각 처리 과정에 필요한 사진 데이터를 제공하기 위한 디지털 사진 저장소에 대해서 살펴본다. 계산사진학은 광학적인 영상의 입수와 촬영후의 사진 관리에 이르기까지 많은 과정이 포함되어 있으며 각 경우에 있어서 필요한 처리의 종류에 따라 각기 다른 종류의 테스트 사진 데이터를 필요로 하게 된다. 논문에서 소개하는 디렉(DIRECT)은 클러스터링 및 대용량 사진 관리를 위한 일련의 개인 사진들 뿐 아니라 각 계산 환경에 적합한 실험 데이터를 목적에 맞게 종류별로 제공한다. 이를 위해 디지털 사진 DB 및 사진 속성 DB, 사진 입력시의 속성 추출 모듈 및 원하는 실험 데이터 추출이 가능한 사용자 인터페이스로 구성된 저장소를 설계하고 이의 활용 방안에 대해서 모색해본다.