RISS 학술연구정보서비스

검색
다국어 입력

http://chineseinput.net/에서 pinyin(병음)방식으로 중국어를 변환할 수 있습니다.

변환된 중국어를 복사하여 사용하시면 됩니다.

예시)
  • 中文 을 입력하시려면 zhongwen을 입력하시고 space를누르시면됩니다.
  • 北京 을 입력하시려면 beijing을 입력하시고 space를 누르시면 됩니다.
닫기
    인기검색어 순위 펼치기

    RISS 인기검색어

      검색결과 좁혀 보기

      선택해제
      • 좁혀본 항목 보기순서

        • 원문유무
        • 원문제공처
        • 등재정보
        • 학술지명
        • 주제분류
        • 발행연도
        • 작성언어
        • 저자
          펼치기

      오늘 본 자료

      • 오늘 본 자료가 없습니다.
      더보기
      • 무료
      • 기관 내 무료
      • 유료
      • KCI등재

        자질집합선택 기반의 기계학습을 통한 한국어 기본구 인식의 성능향상

        황영숙(Young-Sook Hwang),정후중(Hoojung Chung),박소영(So-Young Park),곽용재(Young-Jae Kwak),임해창(Hae-Chang Rim) 한국정보과학회 2002 정보과학회논문지 : 소프트웨어 및 응용 Vol.29 No.9·10

        본 연구에서는 기계학습을 이용하여 한국어 기본구(base phrase)인식의 성능을 향상시키고자 할 때, 학습집합으로부터 획득 가능한 자질집합들 중 최적의 자질집합이 무엇이며, 자료부족 문제를 어떻게 완화할 것인가에 대해 논한다. 먼저 최적의 자질집합 선택은 “점증적 유용성“이란 관점에서 자질의 적합성을 정의하고 이러한 정의에 따라 자질집합을 선택한다. 그리고, 자료부족 문제 완화의 해결점을 찾기 위해 한국어의 통사적 특성을 고려한 형태소 품사체계 사용 및 선택적 어휘자질의 사용이 성능에 미치는 영향을 분석하고 결과를 제시한다. 다양한 크기의 문맥 및 속성, 품사체계에 따라 자질 집합을 구성하고, 서로 다른 특성을 갖는 학습기법 결정트리와 메모리기반 학습기법을 적용한 결과, 한국어 기본구 인식에 유용한 자질은 품사, 어휘, 그리고 기본구 태그로, 두 학습 알고리즘 모두 동일하였다. 또한 한국어의 특성을 고려한 일반화된 품사체계 및 선택적 어휘자질의 사용이 자료부족 문제를 완화시켜주면서 안정된 성능을 보여주었다. 선택된 최적의 자질집합을 사용하여 결정트리와 메모리 기반 학습을 수행한 결과, 전체 기본구에 대해 각각 93.39%/93.41%, 90.99%/92.52%의 정확률/재현율을 얻었다. In this paper, we present an empirical study for improving the Korean text chunking based on machine learning and feature set selection approaches. We focus on two issues: the problem of selecting feature set for Korean chunking, and the problem of alleviating the data sparseness. To select a proper feature set, we use a heuristic method of searching through the space of feature sets using the estimated performance from a machine learning algorithm as a measure of "incremental usefulness" of a particular feature set. Besides, for smoothing the data sparseness, we suggest a method of using a general part-of-speech tag set and selective lexical information under the consideration of Korean language characteristics. Experimental results showed that chunk tags and lexical information within a given context window are important features and spacing unit information is less important than others, which are independent on the machine learning techniques. Furthermore, using the selective lexical information gives not only a smoothing effect but also the reduction of the feature space than using all of lexical information. Korean text chunking based on the memory-based learning and the decision tree learning with the selected feature space showed the performance of precision/recall of 90.99%/92.52%, and 93.39%/93.41% respectively.

      • 결정적 구문 분석을 위한 문맥 의존 문법 규칙 획득 도구

        곽용재(YongJae Kwak),황영숙(YoungSook Hwang),박소영(SoYoung Park),정후중(HooJung Chung),임해창(HaeChang Rim) 한국정보과학회 1999 한국정보과학회 학술발표논문집 Vol.26 No.1B

        문맥을 고려하지 않는 CFG 규칙은 작성이 용이하지만 언어 생성에 한계가 있다. 이에 반해 CDG 규칙은 문맥을 고려하기 때문에 언어 생성 능력이 높은 반면 작성이 용이하지 않다. 기존 연구에서는 CDG 규칙을 수작업으로 획득함으로써 많은 시간과 인력이 요구되었다. 본 논문은 CDG 규칙 획득에 필요한 수작업을 최소화할 수 있는 도구를 제안한다. 제안된 도구는 중의성이 없는 경우를 탐지하여 자동으로 규칙을 획득함으로써 수작업을 최소화한다. 규칙 획득 실험 결과, 수동 규칙 획득 작업과 비교하여 약 70%의 수작업이 감소되었다.

      • KCI등재

        표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서

        곽용재(Yong-Jae Kwak),박소영(So-Young Park),황영숙(Young-Sook Hwang),정후중(Hoojung Chung),이상주(Sang-Zoo Lee),임해창(Hae-Chang Rim) 한국정보과학회 2003 정보과학회논문지 : 소프트웨어 및 응용 Vol.30 No.1·2

        일반화 LR(Generalized LR, 이하 GLR) 파싱은 선형 스택을 사용하는 전통적인 LR 파싱 방식의 한계를 극복하도록 만들어진 LR 파싱 기법의 하나로서, LR 기법에 여러 가지 매커니즘을 통합하여 자연어 파싱에 응용하는 작업의 토대가 되어 왔다. 본 논문에서는 기존의 확률적 LR 파싱 기법이 가지고 있는 문제를 개선한 조건부 연산 모델(Conditional Action Model)을 제안한다. 기존의 확률적 LR 파싱 기법은 그래프 구조 스택의 복잡성으로 인해 상대적으로 제한된 문맥 정보만을 사용하여 왔다. 제안된 모델은 부분 생성 파스의 표현을 위하여 표층 구문 타입(Surface Phrasal Type)을 사용하여 그래프 구조 스택에 들어 있는 구문 구조를 기술함으로써 좀 더 세분된 구조적 선호도를 파서에 반영시킬 수 있다. 실험 결과, 어휘를 고려하지 않고 학습한 조건부 연산 모델로 구현된 본 GLR 파서는 기존의 방식보다 약 6-7%의 정확도 향상을 보였으며, 본 모델을 통해 풍부한 스택 정보를 확률적 LR 파서의 구조적 중의성 해결에 효과적으로 사용할 수 있음을 보였다. Generalized LR parsing is one of the enhanced LR parsing methods so that it overcome the limit of one-way linear stack of the traditional LR parser using graph-structured stack, and it has been playing an important role of a firm starting point to generate other variations for NL parsing equipped with various mechanisms. In this paper, we propose a Conditional Action Model that can solve the problems of conventional probabilistic GLR methods. Previous probabilistic GLR parsers have used relatively limited contextual information for disambiguation due to the high complexity of internal GLR stack. Our proposed model uses Surface Phrasal Types representing the structural characteristics of the parse for its additional contextual information, so that more specified structural preferences can be reflected into theparser. Experimental results show that our GLR parser with the proposed Conditional Action Model outperforms the previous methods by about 6~7% without any lexical information, and our model can utilize the rich stack information for syntactic disambiguation of probabilistic LR parser.

      • 단위구문 인식에 기반한 견고한 구문 분석 기법

        황영숙,곽용재,박소영,정후중,임해창 고려대학교 컴퓨터과학기술연구소 2001 JOURNAL OF COMPUTER SCIENCE & ENGINEERING TECHNOLO Vol.3 No.-

        본 논문에서는 문법적 오류가 존재한다 할지라도 견고하게 문장을 분석할 수 있는 구문분석 기법을 제안한다. 제안된 구문 분석기는 부분 구문 분석기와 완전 구문 분석기로 구성되며, 부분 구문 분석기는 완전 구문 분석의 전처리로써 주어진 문장을 단위 구문들로 분할하고(Chunking), 완전 구문 분석기는 부분 구문 분석 결과를 입력 받아 문장의 완전한 구문 구조를 밝혀낸다. 부분 구문 분석기와의 결합은 완전 구문 분석만을 했을 때에 비해 구조적 중의성을 상당히 많이 감소시켜 줌으로써 처리속도를 현격하게 향상시켜 줄 뿐만 아니라, 완전 구문 분석에 실패한다 할지라도 부분 구문 분석의 결과를 이용하여 명사구나 동사구와 같은 중요 구문들을 높은 정확률과 함께 견고하게 추출할 수 있도록 해준다는 장점이 있다. 실험결과, 부분 구문 분석기는 전체 구문에 대해 93.19%의 정확률과 93.11%의 재현률을 보여 주었고, 단위구문 인식 결과를 입력으로 하는 완전 구문 분석기는 평균 0.039sec로 문장을 분석할 수 있음을 보여주었다. 이는 주어진 문장에 대해 문장의 완전한 구문구조를 밝혀내진 못한다 할지라도 93.19%의 정확률로 명사구나 동사구와 같은 중요 단위구문들을 추출할 수 있음을 의미한다. In this paper, we propose a robust parsing technique, which ran robustly analyze a given sentence even though the sentence contains some grammatical errors. The proposed parsing technique consists of a partial parser and a full parser. A partial parser segments a sentence into chunks as a usefule precursor of a full parser, and a full parser tries to analyze the structural relations among chunks resulted from the partial parser. Combining a partial parser with a full parser enables to reduce the structural ambiguities of the sentence and to do speed up of analyzing the sentence during the full parsing. Furthermore, with a high-performanced partial parsing results, the proposed parser takes an advantage of extracting important phrases such as noun phrases and/or verb phrases in a robust way even though a full parser ends in a failure. Experimental results show that the precision and recall of the partial parser are 93.19% and 93.11% and average processing speed of the full parser is 0.039sec/sentence. As a result, the proposed parsing technique has a power of extracting important phrases with a 93.19% precision although it fails to analyse a full structure of a sentence.

      연관 검색어 추천

      이 검색어로 많이 본 자료

      활용도 높은 자료

      해외이동버튼