RISS 검색 - 국내학술지논문 상세보기

부가정보

다국어 초록 (Multilingual Abstract)

In this paper, we present an empirical study for improving the Korean text chunking based on machine learning and feature set selection approaches. We focus on two issues: the problem of selecting feature set for Korean chunking, and the problem of alleviating the data sparseness. To select a proper feature set, we use a heuristic method of searching through the space of feature sets using the estimated performance from a machine learning algorithm as a measure of "incremental usefulness" of a particular feature set. Besides, for smoothing the data sparseness, we suggest a method of using a general part-of-speech tag set and selective lexical information under the consideration of Korean language characteristics. Experimental results showed that chunk tags and lexical information within a given context window are important features and spacing unit information is less important than others, which are independent on the machine learning techniques. Furthermore, using the selective lexical information gives not only a smoothing effect but also the reduction of the feature space than using all of lexical information. Korean text chunking based on the memory-based learning and the decision tree learning with the selected feature space showed the performance of precision/recall of 90.99%/92.52%, and 93.39%/93.41% respectively.

국문 초록 (Abstract)

본 연구에서는 기계학습을 이용하여 한국어 기본구(base phrase)인식의 성능을 향상시키고자 할 때, 학습집합으로부터 획득 가능한 자질집합들 중 최적의 자질집합이 무엇이며, 자료부족 문제...

본 연구에서는 기계학습을 이용하여 한국어 기본구(base phrase)인식의 성능을 향상시키고자 할 때, 학습집합으로부터 획득 가능한 자질집합들 중 최적의 자질집합이 무엇이며, 자료부족 문제를 어떻게 완화할 것인가에 대해 논한다. 먼저 최적의 자질집합 선택은 "점증적 유용성"이란 관점에서 자질의 적합성을 정의하고 이러한 정의에 따라 자질집합을 선택한다. 그리고, 자료부족 문제 완화의 해결점을 찾기 위해 한국어의 통사적 특성을 고려한 형태소 품사체계 사용 및 선택적 어휘자질의 사용이 성능에 미치는 영향을 분석하고 결과를 제시한다.다양한 크기의 문맥 및 속성, 품사체계에 따라 자질 집합을 구성하고, 서로 다른 특성을 갖는 학습기법인 결정트리와 메모리기반 학습기법을 적용한 결과, 한국어 기본구 인식에 유용한 자질은 품사, 어휘, 그리고 기본구 태그로, 두 학습 알고리즘 모두 동일하였다. 또한 한국어의 특성을 고려한 일반화된 품사체계 및 선택적 어휘자질의 사용이 자료부족 문제를 완화시켜주면서 안정된 성능을 보여주었다. 선택된 최적의 자질집합을 사용하여 결정트리와 메모리 기반 학습을 수행한 결과, 전체 기본구에 대해 각각 93.39%/ 93.41%, 90.99%/92.52%의 정확률/재현율을 얻었다.

동일학술지(권/호) 다른 논문

병렬 타부 탐색을 이용한 발전기 기동정지계획의 최적화
- 한국정보과학회
- 이용환
- 2002
- KCI등재
객체의 시공간적 움직임 정보를 이용한 내용 기반 비디오 검색 알고리즘
- 한국정보과학회
- 정종면
- 2002
- KCI등재
CBSD에서의 컴포넌트 조립 테스트 기법
- 한국정보과학회
- 윤회진
- 2002
- KCI등재
컴포넌트 워크플로우 가변성의 정형 명세 및 모델링 기법
- 한국정보과학회
- 이종국
- 2002
- KCI등재

동일학술지 더보기

분석정보

View

상세정보조회

Usage

원문다운로드

대출신청

복사신청

EDDS신청

동일 주제 내 활용도 TOP

주제

연도별 연구동향

연도별 활용동향

연관논문

연구자 네트워크맵

공동연구자 (7)

유사연구자 (20) 활용도상위20명

인용정보 인용지수 설명보기

학술지 이력

학술지 이력
연월일	이력구분	이력상세
2014-09-01	평가	학술지 통합(기타)
2013-04-26	학술지명변경	한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KIISE : Software and Applications
2011-01-01	평가	등재학술지 유지(등재유지)
2009-01-01	평가	등재학술지 유지(등재유지)
2008-10-17	학술지명변경	한글명 : 정보과학회논문지 : 소프트웨어 및 응용</br>외국어명 : Journal of KISS : Software and Applications
2007-01-01	평가	등재학술지 유지(등재유지)
2005-01-01	평가	등재학술지 유지(등재유지)
2002-01-01	평가	등재학술지 선정(등재후보2차)

상세검색

RISS 보유자료

상세검색

해외전자자료

자질집합선택 기반의 기계학습을 통한 한국어 기본구 인식의 성능향상 = Improving the Performance of Korean Text Chunking by Machine Learning Approaches based on Feature Set Selection

부가정보

동일학술지(권/호) 다른 논문

분석정보

인용정보 인용지수 설명보기

이 자료와 함께 이용한 RISS 자료

나만을 위한 추천자료