http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.
변환된 중국어를 복사하여 사용하시면 됩니다.
강원석(Won-Seog Kang) 한국콘텐츠학회 2011 한국콘텐츠학회논문지 Vol.11 No.2
서답형 자동평가는 자연어 처리의 어려움이 있어 그 시스템의 개발이 쉽지 않다. 본 연구는 자연어처리기술을 접목한 서답형 자동채점 시스템을 설계, 구현한다. 이 시스템은 일반화된 채점 시스템이 지니는 성능 저하의 문제를 해결하기 위해 문제유형을 정의하고 각 유형에 맞는 처리를 하여 성능을 향상하였다. 이 시스템의 성능을 실험하기 위하여 교사 채점과 기존의 용어중심의 채점 시스템, 교사채점과 제안한 채점 시스템의 상관계수를 분석하였다. 실험결과, 기존의 용어 중심의 채점 시스템보다 향상된 결과를 얻었다. 앞으로 문제 유형을 확대 정의하고 각 유형에 맞는 자연어 처리 기법을 개선할 필요가 있다. It is not easy to develop the system as the subjective-type evaluation has the difficulty in natural language processing. This thesis designs and implements the automatic evaluation system with natural language processing technique. To solve the degradation of general evaluation system, we define the question type and improve the performance of evaluation through the adaptive process for each question type. To evaluate the system, we analyze the correlation between human evaluation and term-based evaluation, and between human evaluation and this system evaluation. We got the better result than term-based evaluation. It needs to expand the question type and improve the adaptive processing technique for each type.
강원석(Won-Seog Kang),황도삼(Do-Sam Hwang),Jung H Kim 한국콘텐츠학회 2014 한국콘텐츠학회논문지 Vol.14 No.3
문서 저작권에 대한 관심과 중요성이 높아짐에 따라 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 이와 같은 이유로 많은 연구가 이루어지고 있으나 자연어 처리기술의 한계가 있어 문서의 심층적 표절 검출에 어려움이 있다.본 논문은 자연어 분석의 기술을 적용한 유사문서 판별기를 설계,구현한다. 이 시스템은 형태소 분석의 기술과 함께 구문의미 분석의 기술, 저빈도 및 관용표현 가중치을 이용하여 유사문서를 판별한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 기존 시스템, 그리고 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미 분석을 활용한 시스템의 개선점을 발견할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다. Owing to importance of document copyright the need to detectd ocument duplication and plagiarism is increasing. Many studies have so ught to meet such need, but there are difficulties indocument duplication detection due to technological limitations with the processing of natural language. This thesis designs and implements a discriminator of similar documents with natural language processing technique. This system discriminates similar documents using morphological analysis, syntactic analysis, and weight on low frequency and idiom. To evaluate the system, we analyze the correlation between human discrimination and term-based discrimination, and between human discrimination and proposed discrimination. This analysis shows that the proposed discrimination needs improving. Future research should work to define the document type and improve the processing technique appropriate for each type.
포스터 : 구문정보 가중치를 이용한 유사문서 판별기 설계 및 구현
강원석 ( Won Seog Kang ),황도삼 ( Do Sam Hwang ),( Jung H Kim ) 한국컴퓨터교육학회 2011 한국컴퓨터교육학회 학술발표대회논문집 Vol.15 No.2
문서의 복제나 표절 유무를 판별하는 유사 문서 판별은 표절의 정의에 따라 종류가 다양하다. 본 연구에서는 표층레벨의 표절 유무를 찾는 것이 아니라 심층레벨의 표절 유무를 찾는 유사문서 판별기를 설계, 구현한다. 본 시스템은 단어, 어절구조, 단위문구고 등의 구문정보를 찾아내고 각 정보의 가증치를 이용하여 유사문서를 판별하는 방법을 사용한다. 본 시스템을 실험한 결과 유용한 결과를 얻었다. 앞으로 검사데이타를 실험하여 실효성있는 유사문서 판별기로 개발할 필요가 있다.
강원석(Won-Seog Kang) 한국콘텐츠학회 2015 한국콘텐츠학회논문지 Vol.15 No.10
정보사회에 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 그 필요성에 따라 많은 연구가 이루어지고 있으나 자연어 처리의 문제가 유사 문서 판별의 질 향상에 제약이 되었다. 최근 구문의미분석의 기술을 접목하여 유사문서 판별의 성능을 향상을 시도하였으나 구문의미분석의 결과인 구문의미트리를 비교하는 어려움이 있었다. 본 논문은 구문의미트리의 유사도를 계산하는 구문의미트리 비교기를 개발하고 이를 이용하여 유사문서를 판별하는 시스템을 설계, 구현한다. 본 시스템의 성능을 실험하기 위하여 휴먼판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미트리 비교기를 이용한 유사문서 판별기의 성능을 검증할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다. In information society, the need to detect document duplication and plagiarism is increasing. Many studies have progressed to meet such need, but there are limitations in increasing document duplication detection quality due to technological problem of natural language processing. Recently, some studies tried to increase the quality by applying syntatic-semantic analysis technique. But, the studies have the problem comparing syntactic-semantic trees. This paper develops a syntactic-semantic tree comparator, designs and implements a discriminator of similar documents using the comparator. To evaluate the system, we analyze the correlation between human discrimination and system discrimination with the comparator. This analysis shows that the proposed discrimination has good performance. We need to define the document type and improve the processing technique appropriate for each type.
정보 과학 기술 : 웹문서 분류를 위한 한국어 형태소 해석 시스템 설계 및 구현
강원석 ( Won Seog Kang ),류태천 ( Tae Chun Ryu ),정영훈 ( Young Hoon Jung ),홍석호 ( Seog Ho Hong ),정부천 ( Boo Cheon Jung ) 한국컴퓨터교육학회 2010 한국컴퓨터교육학회 학술발표대회논문집 Vol.14 No.1
정보사회에서 필요로 하는 정보를 신속히 찾기 위하여 정보를 미리 분류할 필요가 있다. 본 연구는 웹에 있는 웹문서를 분류하는 시스템을 위한 형태소 해석 시스템을 제안한다. 본 연구의 한국어 형태소 해석 시스템은 최장일치와 휴리스틱 규칙을 이용한 방법을 사용한다. 본 시스템을 일반의 형태소 해석 시스템과 비교실험한 결과 더 나음을 보였다. 본 시스템에 사용한 최장일치와 휴리스틱 규칙을 이용한 형태소 해석 시스템에 웹문서 분류 분야에 이용가치가 높다.
이러닝 1 : 영역 관련 단어를 이용한 웹문서 분류 시스템 설계 및 구현
강원석 ( Won Seog Kang ),임대현 ( Dae Hyun Im ),심은희 ( Eun Hey Shim ),문승은 ( Seung Eun Moon ),김상희 ( Sang Hey Kim ),정부천 ( Boo Cheon Jung ) 한국컴퓨터교육학회 2009 한국컴퓨터교육학회 학술발표대회논문집 Vol.13 No.1
정보사회에서 필요로 하는 정보를 신속히 찾기 위하여 정보를 분류할 필요가 있다. 본 연구는 웹에 있는 웹 문서를 자동으로 분류하는 시스템을 제안한다. 본 시스템은 문서 분류의 효과를 향상하기 위하여 영역 관련단어를 조사한 후 이를 이용하는 방법을 사용한다. 시스템을 비학습 자료에 대하여 실험한 결과 영역관련 단어를 이용한 방법이 더 나음을 보였다. 본 시스템에 사용한 영역 관련 단어는 정보검색 분야에 이용가치가 높다.
주관식 문제 채점에서의 구문의미트리 유사도에 대한 연구
강원석 ( Won-seog Kang ) 한국컴퓨터교육학회 2016 한국컴퓨터교육학회 학술발표대회논문집 Vol.20 No.2
주관식 문제 채점에서는 답안문서에 포함된 문장의 구조의미적인 지식을 분별할 수 있도록 구문의미분석에 초점을 둔다. 그러나 구문의미분석의 결과인 구문의미트리는 단어의 나열이 아닌 단어와 단어간의 종속적 관계를 나타내는 구조형이므로 단어를 비교하는 유사도 방법을 적용할 수가 없다. 본 연구는 단어의 지식과 함께 단어와 단어간의 종속적 관계를 내포하는 구문의미트리를 비교하는 유사도 방법에 대한 연구를한다. 구문의미트리 유사도 비교 시스템은 구문의미분석의 효과를 살리게 하여 주관식 문제 채점의 질을 높게 할 것이다.